Azure Blob 存储简介

Azure Blob 存储是 Azure 的适用于云的对象存储解决方案。 Blob 存储最适合存储巨量的非结构化数据。 非结构化数据是不遵循特定数据模型或定义的数据(如文本或二进制数据)。

关于 Blob 存储

Blob 存储用于:

  • 直接向浏览器提供图像或文档。
  • 存储文件以供分布式访问。
  • 对视频和音频进行流式处理。
  • 向日志文件进行写入。
  • 存储用于备份和还原、灾难恢复及存档的数据。
  • 存储数据以供本地或 Azure 托管服务执行分析。

用户或客户端应用程序通过 HTTP/HTTPS 可以从世界任何地方访问 Blob 存储中的对象。 Blob 存储中的对象可以通过 Azure 存储 REST APIAzure PowerShellAzure CLI 或 Azure 存储客户端库访问。 提供了不同语言的客户端库,包括:

关于 Azure Data Lake Storage Gen2

Blob 存储支持 Azure Data Lake storage Gen2,即 Azure 适用于云的企业大数据分析解决方案。 Azure Data Lake Storage Gen2 提供了分层文件系统以及 Blob 存储的优势,包括:

  • 低成本分层存储
  • 高可用性
  • 强一致性
  • 灾难恢复功能

有关 Data Lake Storage Gen2 的详细信息,请参阅 Azure Data Lake Storage Gen2 简介

Blob 存储资源

Blob 存储提供了三种类型的资源:

  • 存储帐户
  • 存储帐户中的容器
  • 容器中的 Blob

以下图示显示了这些资源之间的关系。

显示存储帐户、容器和 blob 之间关系的示意图

存储帐户

存储帐户在 Azure 中为数据提供唯一的命名空间。 存储在 Azure 存储中的每个对象都有一个地址,其中包含唯一的帐户名称。 帐户名称与 Azure 存储 blob 终结点的组合构成了存储帐户中对象的基址。

例如,如果存储帐户名为 mystorageaccount,则 Blob 存储的默认终结点为:

http://mystorageaccount.blob.core.chinacloudapi.cn 

若要创建存储帐户,请参阅创建存储帐户。 若要了解存储帐户的详细信息,请参阅 Azure 存储帐户概述

容器

容器对一组 blob 进行组织,类似于文件系统中的目录。 一个存储帐户可以包含无限数量的容器,一个容器可以存储无限数量的 Blob。

备注

容器名称必须小写。 有关命名容器的详细信息,请参阅命名和引用容器、Blob 和元数据

Blob

Azure 存储支持三种类型的 Blob:

  • 块 Blob 存储文本和二进制数据。 块 Blob 由可以分别管理的数据块构成。 块 blob 最多可存储约 190.7 TiB。
  • 与块 Blob 一样,追加 Blob 也由块构成,但针对追加操作进行了优化。 追加 Blob 非常适用于诸如记录来自虚拟机的数据之类的场景。
  • 页 Blob 用于存储最大 8 TiB 的随机访问文件。 页 blob 存储虚拟硬盘 (VHD) 文件并作为 Azure 虚拟机的磁盘。 有关页 Blob 的更多信息,请参阅 Azure 页 Blob 概述

有关不同类型 Blob 的详细信息,请参阅 Understanding Block Blobs, Append Blobs, and Page Blobs(了解块 Blob、追加 Blob 和页 Blob)。

将数据移至 Blob 存储

存在许多用于将现有数据迁移到 Blob 存储的解决方案:

  • AzCopy 是一种易于使用的适用于 Windows 和 Linux 的命令行工具,可以跨容器或跨存储帐户将数据复制到 Blob 存储,以及从 Blob 存储复制数据。 有关 AzCopy 的详细信息,请参阅使用 AzCopy v10 传输数据
  • Azure 存储数据移动库是一个 .NET 库,用于在 Azure 存储服务之间移动数据。 AzCopy 实用程序是使用数据移动库生成的。 有关详细信息,请参阅数据移动库的参考文档
  • Azure 数据工厂 支持使用 Azure 资源的帐户密钥、共享访问签名、服务主体或托管标识向/从 Blob 存储复制数据。 有关详细信息,请参阅使用 Azure 数据工厂向/从 Azure Blob 存储复制数据
  • 如果大型数据集或网络限制导致通过网络上传数据不可行,Azure Data Box 服务可将本地数据传输到 Blob 存储。 可以从世纪互联请求 Azure Data Box Disk 设备。 然后,你可以将数据复制到这些设备中,将设备寄回世纪互联,我们就会将数据上传到 Blob 存储中。
  • Azure 导入/导出服务 提供了一种使用你提供的硬盘向存储帐户导入或从存储帐户导出大量数据的方法。 有关详细信息,请参阅使用 Azure 导入/导出服务将数据传输到 Blob 存储中

后续步骤