Compartir a través de

使用 Azure Data Lake Storage URI

与 Azure Data Lake Storage 兼容的 Hadoop 文件系统驱动程序通过其方案标识符abfs (Azure Blob File System) 来识别。 与其他 Hadoop 文件系统驱动程序一致,ABFS 驱动程序采用 URI 格式来寻址启用了 Data Lake Storage 的帐户中的文件和目录。

URI 语法

Azure Blob File System 驱动程序可与帐户的 Data Lake Storage 终结点一起使用,即使该帐户未启用分层命名空间也是如此。 如果存储帐户没有分层命名空间,则简写 URI 语法为:

abfs[s]1://<file_system>2@<account_name>3.dfs.core.chinacloudapi.cn/<path>4/<file_name>5
  1. 方案标识符abfs 协议用作方案标识符。 如果在末尾添加一个 s(abfss),则无论选择何种身份验证方法,ABFS Hadoop 客户端驱动程序将始终使用传输层安全性 (TLS)。 如果选择 OAuth 作为身份验证,则即使指定了 abfs 而不是 abfss,客户端驱动程序仍将始终使用 TLS,因为 OAuth 仅依赖于 TLS 层。 最后,如果选择使用较旧的存储帐户密钥方法,则客户端驱动程序会将 abfs 解释为你不希望使用 TLS。

  2. 文件系统:保存文件和文件夹的父位置。 这与 Azure 存储 Blob 服务中的容器相同。

  3. 帐户名称:创建期间为存储帐户提供的名称。

  4. 路径:目录结构采用正斜杠分隔 (/) 表示形式。

  5. 文件名:单个文件的名称。 如果对目录寻址,则此参数是可选的。

但是,如果要寻址的帐户具有分层命名空间,则缩写 URI 语法为:

/<path>1/<file_name>2
  1. 路径:目录结构采用正斜杠分隔 (/) 表示形式。

  2. 文件名:单个文件的名称。

后续步骤