Delta Lake 中的变体支持
重要
此功能目前以公共预览版提供。
可以使用 VARIANT
数据类型在 Delta Lake 中存储半结构化数据。 有关使用 VARIANT
的示例,请参阅查询变体数据。
必须使用 Databricks Runtime 15.3 或更高版本才能读写启用了变体支持的表。
在 Delta 表上启用变体
若要启用变体,请创建一个包含 VARIANT
类型列的新表,例如:
CREATE TABLE table_name (variant_column VARIANT)
还可以使用以下语法在现有表上启用对 VARIANT
的支持:
ALTER TABLE table_name SET TBLPROPERTIES('delta.feature.variantType-preview' = 'supported')
警告
启用变体时,表协议会升级。 升级后,不支持变体的 Delta Lake 客户端无法读取该表。 请参阅 Azure Databricks 如何管理 Delta Lake 功能兼容性?。
限制
存在以下限制:
- 不能使用变体列对表进行分区。
- 变体列不能是表的聚类分析键。
- 不能使用列生成来创建变体列。
- Delta 不会为变体列收集
minValues
或maxValues
统计信息。