什么是表和视图?

表和视图是 Databricks 中用于组织和访问数据的基础概念。

是存储在特定位置的结构化数据集,通常采用 Delta Lake 格式。 表将实际数据储存在存储上,可以使用 SQL 命令或 DataFrame API 查询和操作,支持插入、更新、删除和合并等操作。 请参阅什么是表?

视图是 SQL 查询定义的虚拟表。 视图本身不存储数据。 相反,视图提供一种以特定格式或抽象形式呈现来自一个或多个表的数据的方法。 视图可用于简化复杂的查询、封装业务逻辑,以及为底层数据提供一致的接口,而无需复制存储。 请参阅什么是视图?

Unity Catalog 中的表和视图

表和视图使用 Unity Catalog 进行管理。 在 Unity Catalog 中,表和视图位于三级命名空间 (catalog.schema.table) 的第三级别,如下面的图表所示。

Unity Catalog 对象模型图,侧重于表

Delta 表

下表将解答有关 Delta 表的常见问题。

问题 Delta 表
它是什么? 以 Delta Lake 格式存储的标准表,支持 ACID 事务、架构强制措施和其他 Delta Lake 功能。
建议将其用于哪些用例? 执行以下操作的过程代码:

- 引入
- 转换
它是如何填充的? 过程代码(INSERTUPDATEMERGE、使用 replaceWhere 的分区覆盖)
Unity Catalog 中的对象类型是什么?
谁可以进行更新? 任何可以更新 Delta 表的写入者。
它与哪些 Delta Lake 功能兼容? 支持所有的 Delta Lake 功能。