使用 Azure Data Lake Storage Gen2 URI

通过方案标识符 abfs(Azure Blob 文件系统)可以知道与 Azure Data Lake Storage Gen2 兼容的 Hadoop 文件系统驱动程序。 与其他 Hadoop 文件系统驱动程序一样,ABFS 驱动程序使用 URI 格式寻址已启用 Data Lake Storage Gen2 的帐户中的文件和目录。

URI 语法

Azure Blob File System 驱动程序可与帐户的 Data Lake Storage 终结点一起使用,即使该帐户未启用分层命名空间也是如此。 如果存储帐户没有分层命名空间,则简写 URI 语法为:

abfs[s]1://<file_system>2@<account_name>3.dfs.core.chinacloudapi.cn/<path>4/<file_name>5
  1. 方案标识符abfs 协议用作方案标识符。 如果在末尾添加一个 s(abfss),则无论选择何种身份验证方法,ABFS Hadoop 客户端驱动程序将始终使用传输层安全性 (TLS)。 如果选择 OAuth 作为身份验证,则即使指定了 abfs 而不是 abfss,客户端驱动程序仍将始终使用 TLS,因为 OAuth 仅依赖于 TLS 层。 最后,如果选择使用较旧的存储帐户密钥方法,则客户端驱动程序会将 abfs 解释为你不希望使用 TLS。

  2. 文件系统:保存文件和文件夹的父位置。 这与 Azure 存储 Blob 服务中的容器相同。

  3. 帐户名称:创建期间为存储帐户提供的名称。

  4. 路径:目录结构采用正斜杠分隔 (/) 表示形式。

  5. 文件名:单个文件的名称。 如果对目录寻址,则此参数是可选的。

但是,如果要寻址的帐户具有分层命名空间,则缩写 URI 语法为:

/<path>1/<file_name>2
  1. 路径:目录结构采用正斜杠分隔 (/) 表示形式。

  2. 文件名:单个文件的名称。

后续步骤