什么是 Azure Databricks 中的表?

在 Azure Databricks 中,表是存储在架构中的数据的结构化集合。 表用于使用 SQL 或 Spark 存储、查询和管理数据。 默认表类型是 Unity 目录 (UC) 托管表,它使用 Delta Lake 进行可靠的数据存储。

Azure Databricks 支持三种主表类型,每种类型具有不同的所有权和数据管理特征:

表类型 DESCRIPTION 管理者 写作支持
管理 Databricks 管理元数据和数据文件。 统一目录 是的
外部 元数据位于 Databricks 中,数据存储在外部。 无或 Unity 目录 是的
外国 使用联合方式引用外部系统中的只读数据。 外部系统

对于大多数用例,Databricks 建议使用托管表。