Delta Lake 中的变体支持

重要

此功能目前以公共预览版提供。

可以使用 VARIANT 数据类型在 Delta Lake 中存储半结构化数据。 有关使用 VARIANT 的示例,请参阅查询变体数据

必须使用 Databricks Runtime 15.3 或更高版本才能读写启用了变体支持的表。

在 Delta 表上启用变体

若要启用变体,请创建一个包含 VARIANT 类型列的新表,例如:

CREATE TABLE table_name (variant_column VARIANT)

还可以使用以下语法在现有表上启用对 VARIANT 的支持:

ALTER TABLE table_name SET TBLPROPERTIES('delta.feature.variantType-preview' = 'supported')

警告

启用变体时,表协议会升级。 升级后,不支持变体的 Delta Lake 客户端无法读取该表。 请参阅 Azure Databricks 如何管理 Delta Lake 功能兼容性?

限制

存在以下限制:

  • 不能使用变体列对表进行分区。
  • 变体列不能是表的聚类分析键。
  • 不能使用列生成来创建变体列。
  • Delta 不会为变体列收集 minValuesmaxValues 统计信息。