数据Data

此部分介绍如何在 Azure Databricks 中使用数据。This section shows how to work with data in Azure Databricks. 可以:You can:

  • 直接从导入的数据创建表。Create tables directly from imported data. 表架构存储在默认 Azure Databricks 内部元存储中,你也可以配置和使用外部元存储。Table schema is stored in the default Azure Databricks internal metastore and you can also configure and use external metastores.
  • 使用各种 Apache Spark 数据源。Use a wide variety of Apache Spark data sources.
  • 将数据导入到 Databricks 文件系统 (DBFS)(一个已装载到 Azure Databricks 工作区并在 Azure Databricks 群集上可用的分布式文件系统),并使用 DBFS CLIDBFS APIDatabricks 文件系统实用工具 (dbutils.fs)Spark API本地文件 API 访问数据。Import data into Databricks File System (DBFS), a distributed file system mounted into an Azure Databricks workspace and available on Azure Databricks clusters and use the DBFS CLI, DBFS API, Databricks file system utilities (dbutils.fs), Spark APIs, and local file APIs to access the data.

本部分的内容:This section covers: