Azure Blob 存储简介

Azure Blob 存储是 Azure 的适用于云的对象存储解决方案。 Blob 存储最适合存储巨量的非结构化数据。 非结构化数据是不遵循特定数据模型或定义(如文本或二进制数据)的数据。

关于 Blob 存储

Blob 存储用于:

  • 直接向浏览器提供图像或文档。
  • 存储文件以供分布式访问。
  • 对视频和音频进行流式处理。
  • 向日志文件进行写入。
  • 存储用于备份和还原、灾难恢复及存档的数据。
  • 存储数据以供本地或 Azure 托管服务执行分析。

用户或客户端应用程序通过 HTTP/HTTPS 可以从世界任何地方访问 Blob 存储中的对象。 Blob 存储中的对象可以通过 Azure 存储 REST APIAzure PowerShellAzure CLI 或 Azure 存储客户端库访问。 客户端库适用于各种语言,包括 .NETJavaNode.jsPythonGoPHPRuby

关于 Azure Data Lake Storage Gen2

Blob 存储支持 Azure Data Lake storage Gen2,即 Azure 适用于云的企业大数据分析解决方案。 Azure Data Lake Storage Gen2 提供分层文件系统,具有 Blob 存储的优势,包括低成本的分层存储、高可用性、强一致性以及灾难恢复能力。

有关 Data Lake Storage Gen2 的详细信息,请参阅 Azure Data Lake Storage Gen2 预览版简介

Blob 存储资源

Blob 存储提供了三种类型的资源:

  • 存储帐户。
  • 存储帐户中的容器
  • 容器中的 Blob

以下图示显示了这些资源之间的关系。

Blob 存储体系结构的图示

存储帐户

存储帐户在 Azure 中为数据提供唯一的命名空间。 存储在 Azure 存储中的每个对象都有一个地址,其中包含唯一的帐户名称。 帐户名称与 Azure 存储 blob 终结点的组合构成了存储帐户中对象的基址。

例如,如果存储帐户名为 mystorageaccount,则 Blob 存储的默认终结点为:

http://mystorageaccount.blob.core.chinacloudapi.cn 

若要创建存储帐户,请参阅创建存储帐户。 若要了解存储帐户的详细信息,请参阅 Azure 存储帐户概述

容器

容器对一组 blob 进行组织,类似于文件系统中的目录。 一个存储帐户可以包含无限数量的容器,一个容器可以存储无限数量的 Blob。

Note

容器名称必须小写。 有关命名容器的详细信息,请参阅命名和引用容器、Blob 和元数据

Blob

Azure 存储支持三种类型的 Blob:

  • 块 Blob 存储文本和二进制数据,最多约为 4.7 TB。 块 Blob 由可以分别管理的数据块构成。
  • 与块 Blob 一样,追加 Blob 也由块构成,但针对追加操作进行了优化。 追加 Blob 非常适用于诸如记录来自虚拟机的数据之类的场景。
  • 页 Blob 用于存储最大 8 TB 的随机访问文件。 页 Blob 存储虚拟硬盘 (VHD) 文件作为 Azure 虚拟机的磁盘。 有关页 Blob 的更多信息,请参阅 Azure 页 Blob 概述

有关不同类型 Blob 的详细信息,请参阅 Understanding Block Blobs, Append Blobs, and Page Blobs(了解块 Blob、追加 Blob 和页 Blob)。

将数据移至 Blob 存储

存在许多用于将现有数据迁移到 Blob 存储的解决方案:

  • AzCopy 是一种易于使用的适用于 Windows 和 Linux 的命令行工具,可以跨容器或跨存储帐户将数据复制到 Blob 存储,以及从 Blob 存储复制数据。 有关 AzCopy 的详细信息,请参阅使用 AzCopy v10(预览版)传输数据
  • Azure 存储数据移动库是一个 .NET 库,用于在 Azure 存储服务之间移动数据。 AzCopy 实用程序是使用数据移动库生成的。 有关详细信息,请参阅数据移动库的参考文档
  • Azure 导入/导出服务提供了一种方法,可将大量数据从存储帐户导出到你提供的硬盘,然后 Azure 会将带数据的硬盘寄回给你。 有关详细信息,请参阅使用 Azure 导入/导出服务将数据传输到 Blob 存储中

后续步骤