如何确定 Spark 是否正在重写数据

首先为写入阶段打开 SQL DAG。 向上滚动到作业页面顶部,然后单击“关联的 SQL 查询”:

暂存到 SQL

现在,你应该会看到 DAG。 如果没有,请滚动一下,应该就会看到它:

SQL DAG

如果要执行“删除”或“更新”操作,请查看写入器写入的数据量与预期数据量。 如果看到写入的数据明显多于预期,则可能要重写数据:

写入统计信息

如果正在进行合并,则合并节点具有有关其重写的数据量的明确统计信息。