检查点 V2 允许 Delta Lake 支持更多并发编写器,并减少大型或频繁更新表的写入冲突。
Delta Lake 定期写入检查点,这些检查点记录事务日志的状态。 检查点允许 Delta Lake 重新构造表状态,而无需重播完整的事务日志,从而加快查询规划速度。
可以在 Databricks Runtime 13.3 LTS 及更高版本中使用检查点 V2 来读取和写入表格。
有关开源协议规范,请参阅 Delta Lake 协议中的检查点 V2。
启用检查点 V2
在表级别启用检查点 V2 功能。
自动启用
默认情况下,在 Databricks Runtime 14.1 及更高版本中使用液体聚类分析创建的表使用检查点 V2。 请参阅液态聚类表的兼容性。
自动功能启用(AFE)可以自动为 Unity Catalog 管理表启用检查点 V2。
手动启用
若要在现有 Delta Lake 表上启用检查点 V2,请执行:
ALTER TABLE table_name SET TBLPROPERTIES ('delta.checkpointPolicy' = 'v2');
若要在新的 Delta Lake 表上启用检查点 V2,
CREATE TABLE table_name (...)
TBLPROPERTIES ('delta.checkpointPolicy' = 'v2');
(可选)可以手动触发检查点。 请参阅 REORG TABLE。
降级到经典
将表格降级为经典检查点并完全移除检查点 V2:
ALTER TABLE table_name DROP FEATURE v2Checkpoint;