卷是 Unity Catalog 目录对象,用于管理对非表格数据的访问。 它们通过云对象存储提供逻辑层,以便你可以通过集中式治理来存储、组织和管理文件。
有关卷的综合文档,请参阅什么是 Unity 目录卷?
Unity Catalog 支持的卷类型有两种:
- 托管卷: Azure Databricks 管理生命周期和云存储位置
- 外部卷: 您可以控制云存储的位置和生命周期
使用 Unity Catalog 数据卷可以用来做什么?
可以使用多个接口和工具执行存储卷的文件管理操作。
- 通过目录资源管理器上传和下载文件。 请参阅 什么是目录资源管理器?
- 使用 Apache Spark、pandas 或 SQL 以编程方式读取和写入数据。 请参阅 以编程方式处理卷中的文件。
- 使用
dbutils.fs
、magic 命令或 bash shell 命令来管理文件。 请参阅 用于卷中文件的命令行实用工具 - 直接从存储在卷中的文件创建表。 请参阅 从卷中的数据创建表