Azure Databricks 中的架构是什么?

在 Unity Catalog 中,架构是目录的子级,可以包含表、视图、卷、模型和函数。 架构提供的数据组织类别比目录更精细。

本文介绍 Unity Catalog 中 Azure Databricks 数据对象层次结构中的架构角色。

有关旧工作区本地 Hive 元存储中的架构信息,请参阅旧 Hive 元存储中的数据库对象

什么是架构?

在 Unity Catalog 中,架构是 Unity Catalog 的三级命名空间 (catalog.schema.table-etc) 的第二级。

突显了“架构”的 Unity Catalog 对象模型关系图

架构将数据和 AI 资产组织成比目录更精细的逻辑类别。 通常,架构代表单个用例、项目或团队沙盒。 无论类别类型如何,架构都是用于管理数据访问控制和改进数据可发现性的有用工具。

注意

在 Azure Databricks 中,架构有时称为数据库。 例如,CREATE DATABASECREATE SCHEMA 的别名。 此术语不同于某些关系数据库系统中的定义,在这些系统中,数据库是架构的集合。

有关 Unity Catalog 中的数据对象层次结构的详细信息,请参阅什么是 Azure Databricks 中的数据库对象?

架构的托管位置

在 Unity Catalog 中,可以通过为架构指定托管存储位置,将架构中的所有托管表和托管卷的数据与目录中其他架构的数据进行物理隔离。 这完全是可选的。 如果未为架构指定托管存储位置,则数据会驻留在目录的托管存储位置(如果未在目录中定义该位置,则它会驻留在元存储的托管存储位置)。 请参阅在 Unity Catalog 中指定托管存储位置

外部表和卷的数据隔离取决于管理云存储中的数据的方式。 它独立于架构的托管位置。

后续步骤