存储帐户概述

Azure 存储帐户包含所有 Azure 存储数据对象:Blob、文件、队列和表。 存储帐户为 Azure 存储数据提供一个唯一的命名空间,可通过 HTTP 或 HTTPS 从世界上的任何位置访问该数据。 Azure 存储帐户中的数据持久,高度可用、安全且可大规模缩放。

若要了解如何创建 Azure 存储帐户,请参阅 “创建存储帐户”。

存储帐户的类型

Azure 存储提供多种类型的存储帐户。 每种类型支持不同的功能,并且具有自己的定价模型。

下表介绍了 Azure 针对大多数场景推荐的存储帐户类型。 所有这些作都使用 Azure 资源管理器 部署模型。

存储帐户的类型 支持的存储服务 冗余选项 使用情况
标准常规用途 v2 Blob 存储(包括 Data Lake Storage1)、队列存储、表存储和 Azure 文件存储 本地冗余存储 (LRS)/异地冗余存储 (GRS)/读取访问异地冗余存储 (RA-GRS)

区域冗余存储(ZRS)/ 地理区域冗余存储(GZRS)/ 只读地理区域冗余存储(RA-GZRS)2
Blob、文件共享、队列和表的标准存储帐户类型。 建议在大多数情况下使用 Azure 存储。 如果想要在 Azure 文件存储中支持网络文件系统 (NFS),请使用高级文件共享帐户类型。
高级块 Blob3 Blob 存储(包括 Data Lake Storage1 LRS

ZRS2
块 Blob 和追加 Blob 的高级存储帐户类型。 建议用于事务率较高的方案,或用于那些使用较小对象的或需要存储延迟始终较低的方案。 详细了解示例工作负荷。
高级文件共享3 Azure 文件存储 LRS

ZRS2
仅适用于文件共享的高级存储帐户类型。 建议用于企业级应用程序或高性能级应用程序。 如果想要同时支持服务器消息块 (SMB) 和 NFS 文件共享的存储帐户,请使用此帐户类型。
高级页 Blob3 仅页 Blob LRS

ZRS2
仅适用于页 blob 的高级存储帐户类型。 详细了解页 Blob 和示例用例。

1 Data Lake Storage 是一组专用于基于 Azure Blob 存储的大数据分析的功能。 有关详细信息,请参阅 Data Lake Storage 简介创建与 Data Lake Storage 一起使用的存储帐户

2 ZRS、GZRS 和 RA-GZRS 仅适用于某些区域中的标准通用 v2、高级块 Blob、高级文件共享和高级页 Blob 帐户。 有关详细信息,请参阅 Azure 存储冗余

3 个高级性能存储帐户使用固态硬盘(SSD)实现低延迟和高吞吐量。

旧存储帐户也受支持。 有关详细信息,请参阅 旧存储帐户类型

Azure 存储帐户的服务级别协议(SLA)可在存储帐户的服务级别协议中查看。

备注

创建存储帐户后,不能将该帐户更改为其他类型。 若要将数据移动到其他类型的存储帐户,必须创建新帐户,将数据复制到新帐户。

存储帐户名称

为存储帐户命名时,请记住以下规则:

  • 存储帐户名称必须为 3 到 24 个字符,并且只能包含数字和小写字母。
  • 存储帐户名称在 Azure 中必须是唯一的。 没有两个存储帐户可以有相同的名称。

存储帐户工作负荷

Azure 存储客户使用各种工作负荷来存储数据、访问数据并获取见解以满足其业务目标。 每个工作负荷都根据其要求和行业标准使用特定的协议进行数据操作。

下面是存储帐户的不同的主要工作负荷的概略性分类。

云原生

云原生应用是建立在云范例和技术基础上的大规模分布式应用程序。 这种新式方法侧重于云规模和性能。 云原生应用可以基于微服务体系结构,可以使用托管服务并采用持续交付来保证可靠性。 这些应用程序通常分为 Web 应用、移动应用、容器化应用和无服务器/FaaS 应用。

数据分析

分析是指对数据和统计信息进行系统的计算分析。 这门科学涉及发现、解释和传达在数据中找到的有意义见解/模式。 可以操控和解释所发现的数据,以便进一步推进企业的目标,并帮助企业实现其目标。 这些工作负荷通常包含一个引入大量数据的管道,这些数据经过准备、特选和聚合,可以通过 Power BI、数据仓库或应用程序在下游使用。 分析工作负荷可能需要高流入量和流出量,推高存储帐户的吞吐量。 一些不同类型的分析包括(但不限于):实时分析、高级分析、预测分析、情感分析和情绪分析。 对于分析,我们保证我们的客户能够对分布式存储体系结构中的大量数据进行高吞吐量访问。

高性能计算 (HPC)

高性能计算是多个计算节点的聚合,这些节点执行同一组任务,在给定的期限内实现比单个节点更多的功能。 它涉及使用并行工作的强大处理器来处理海量多维数据集。 对于基因测序和油藏模拟等工作负荷,HPC 工作负荷需要非常高的吞吐量读取和写入操作。 对于地震解释、自动驾驶和风险工作负荷之类的工作负荷,HPC 工作负荷还包括那些可以在访问大量小型文件时确保高 IOPS 和低延迟的应用程序。 主要目标是以超快的速度解决复杂问题。 高性能计算的其他示例包括流体动力学和其他需要可伸缩性和高吞吐量的物理模拟或分析。 为了使我们的客户能够执行 HPC,我们确保客户可以以大量并发操作访问大量数据。

备份和存档

业务连续性和灾难恢复(BCDR)是企业在发生不良事件后保持正常运行的能力。 在存储方面,此目标相当于在存储系统发生中断时维持业务连续性。 随着整个行业推出备份即服务产品,BCDR 数据越来越多地迁移到公有云。 备份和存档工作负荷充当抵御日益猖獗的勒索软件和恶意攻击的最后一道防线。 出现服务中断或数据意外删除或损坏的情况时,以高效且协调的方式恢复数据是首要任务。 为了实现这一目标,可以使用 Azure 存储以最具成本效益的方式存储和检索大量数据。

机器学习和人工智能

人工智能 (AI) 是在计算机中模拟人类智能和解决问题的能力的技术。 机器学习 (ML) 是 AI 的一个子学科,它使用算法来创建模型,这些模型使计算机能够执行任务。 两者都代表了 Azure 上正在快速增长的最新工作负荷。 这种类型的工作负荷可以应用于每个行业,以改善指标并实现性能目标。 这些类型的技术可能导致在医学/健康领域发现拯救生命的药物和做法,同时还提供健康评估。 ML 和 AI 的其他日常用途包括欺诈检测、图像识别和错误信息标记。 这些工作负荷通常需要极特殊化计算(大量 GPU),并且需要高吞吐量和 IOPS、低延迟存储访问和 POSIX 文件系统访问。 Azure 存储通过存储检查点并为大规模数据集和模型提供存储来支持这些类型的工作负荷。 这些数据集和模型以一定的速度进行读写,使 GPU 处于使用状态。

下表说明了 Microsoft 针对每个工作负荷建议的存储帐户配置

工作量 帐户种类 性能 冗余 分层命名空间已启用 默认访问层 已启用软删除
云原生 常规用途 v2 标准 ZRS、RA-GRS 是的
数据分析 常规用途 v2 标准 ZRS1、RA-GRS 2 是的
高性能计算 (HPC) 常规用途 v2 标准 ZRS、RA-GRS 是的 是的
备份和存档 常规用途 v2 标准 ZRS、RA-GRS 3 是的
机器学习和人工智能 常规用途 v2 标准 ZRS、RA-GRS 是的

1 区域冗余存储(ZRS)对于分析工作负荷来说是一个很好的默认值,因为 ZRS 与本地冗余存储(LRS)相比提供了额外的冗余,从而防止区域性故障,同时保持与分析框架完全兼容。 如果分析工作负载需要额外的冗余,则需要额外冗余的客户还可以利用异地冗余存储 (GRS/RA-GRS)。

2 作为 Azure Data Lake Storage(ADLS)的核心功能, 分层命名空间 可增强数据组织和大量数据的访问效率,使其非常适合分析工作负荷。

3 冷访问层提供了一种经济高效的解决方案,用于存储不经常访问的数据,这是备份和存档工作负荷的典型解决方案。 客户还可以在评估成本后考虑使用寒访问层。

存储帐户终结点

存储帐户在 Azure 中为数据提供唯一的命名空间。 在 Azure 存储中存储的每个对象都具有包含唯一帐户名称的 URL 地址。 帐户名称与服务终结点的组合构成了存储帐户的终结点。

可以将存储帐户配置为使用 Blob 存储终结点的自定义域。 有关详细信息,请参阅 为 Azure 存储帐户配置自定义域名

重要

在客户端应用程序中引用服务终结点时,建议避免依赖于缓存的 IP 地址。 存储帐户 IP 地址可能会更改,因此依赖缓存的 IP 地址可能会导致意外行为。

此外,建议遵循 DNS 记录的生存时间 (TTL),避免重写该时间。 重写 DNS TTL 可能会导致意外行为。

Azure 存储中的服务终结点包括协议(建议使用 HTTPS)、作为子域的存储帐户名称和包含服务名称的固定域。

下表列出了每项 Azure 存储服务的终结点格式。

存储服务 终结点
Blob 存储 https://<storage-account>.blob.core.chinacloudapi.cn
静态网站(Blob 存储) https://<storage-account>.web.core.chinacloudapi.cn
Data Lake Storage https://<storage-account>.dfs.core.chinacloudapi.cn
Azure 文件存储 https://<storage-account>.file.core.chinacloudapi.cn
队列存储 https://<storage-account>.queue.core.chinacloudapi.cn
表存储 https://<storage-account>.table.core.chinacloudapi.cn

你可以使用以下方法轻松构造 Azure 存储中的对象的 URL:将对象在存储帐户中的位置追加到终结点。 例如,blob 的 URL 类似于:

https://*mystorageaccount*.blob.core.chinacloudapi.cn/*mycontainer*/*myblob*

迁移存储帐户

下表汇总并指向有关如何移动、升级或迁移存储帐户的指导:

迁移方案 详细信息
将存储帐户移到其他订阅 Azure 资源管理器提供将资源移到其他订阅的选项。 有关详细信息,请参阅 将资源移动到新的资源组或订阅
将存储帐户移到其他资源组 Azure 资源管理器提供将资源移到其他资源组的选项。 有关详细信息,请参阅 将资源移动到新的资源组或订阅
将存储帐户移到其他区域 若要移动某个存储帐户,请在另一个区域中创建该存储帐户的副本。 然后,使用 AzCopy 或其他所选工具将数据移到该帐户。 有关详细信息,请参阅 将 Azure 存储帐户移到另一个区域
升级到常规用途 v2 存储帐户 你可以将常规用途 v1 存储帐户或 Blob 存储帐户升级到常规用途 v2 存储帐户。 请注意,此操作无法撤消。 有关详细信息,请参阅 升级到常规用途 v2 存储帐户
将经典存储帐户迁移到 Azure 资源管理器 在功能、可伸缩性和安全性方面,Azure 资源管理器部署模型优于经典部署模型。 有关将经典存储帐户迁移到 Azure 资源管理器的详细信息,请参阅 平台支持的 IaaS 资源从经典迁移到 Azure 资源管理器的“迁移存储帐户”部分。

将数据传输到存储帐户中

Azure 提供了用于从本地存储设备或第三方云存储提供程序导入数据的服务和实用工具。 使用哪种解决方案取决于要传输的数据量。 有关详细信息,请参阅 Azure 存储迁移概述

存储帐户加密

存储帐户中的所有数据自动在服务端加密。 有关加密和密钥管理的详细信息,请参阅 静态数据的 Azure 存储加密

存储帐户计费

Azure 存储根据存储帐户使用情况计费。 存储帐户中的所有对象会作为组共同计费。 存储成本根据以下因素计算:

  • 区域 是指帐户所基于的地理区域。
  • 帐户类型 是指使用的存储帐户的类型。
  • 访问层是指你为常规用途 v2 或 Blob 存储帐户指定的数据使用模式。
  • “容量”是指你使用多少存储帐户配额来存储数据。
  • 冗余 确定在任何时间同时维护的您的数据副本数量,以及它们所在的位置。
  • 事务 是指对 Azure 存储执行的所有读取和写入作。
  • 数据出口 是指从 Azure 区域传输的任何数据。 当存储帐户中的数据被不在同一区域中运行的应用程序访问时,需要为数据流出量付费。 有关使用资源组对同一区域中的数据和服务进行分组以限制出口费用的信息,请参阅什么是 Azure 资源组?

Azure 存储定价页根据帐户类型、存储容量、复制和事务提供详细的定价信息。 数据传输定价详细信息提供数据出口的详细定价信息。 可以使用 Azure 存储定价计算器 来帮助估算成本。

旧存储帐户类型

下表描述了旧存储帐户类型。 尽管这些帐户类型不是 Azure 推荐的帐户类型,但在某些情况下仍可以使用:

旧存储帐户类型 支持的存储服务 冗余选项 部署模型 使用情况
标准常规用途 v1 Blob 存储、队列存储、表存储或 Azure 文件存储 LRS/GRS/RA-GRS 资源管理器,经典1 常规用途 v1 帐户可能没有最新功能,其每 GB 定价也可能不是最低的。 可考虑在以下场景中使用它:
  • 应用程序为事务密集型,或者使用很大的异地复制带宽,但不需要大的容量。 在这种情况下,常规用途 v1 帐户可能是最经济的选择。
  • 如果使用的 Azure 存储 REST API 版本是早于 2014 年 2 月 14 日的版本,或使用的客户端库版本低于 4.x,则无法升级应用程序。
  • 选择要用作 Azure Site Recovery 缓存的存储帐户。 由于 Site Recovery 需进行事务密集型处理,因此常规用途 v1 帐户可能更具成本效益。 有关详细信息,请参阅 Azure 区域之间的 Azure VM 灾难恢复支持矩阵
Blob 存储 Blob 存储(仅限块 Blob 和追加 Blob) LRS/GRS/RA-GRS 资源管理器 Azure 建议尽可能使用标准常规用途 v2 帐户。

1 如果存储帐户使用的是经典部署模型,建议 迁移到 Azure 资源管理器部署模型。 使用经典部署模型的 Azure 存储帐户已于 2024 年 8 月 31 日停用。 有关详细信息,请参阅 经典存储帐户停用更新

标准存储帐户的可伸缩性目标

下表介绍 Azure 常规用途 v2 (GPv2)、常规用途 v1 (GPv1) 和 Blob 存储帐户的默认限制。 “流入量”限制是指针对发送到存储帐户的所有数据的限制。 “流出量”限制是指针对从存储帐户接收的所有数据的限制。

Azure 建议对大多数场景使用 GPv2 存储帐户。 可以轻松将 GPv1 或 Blob 存储帐户升级为 GPv2 帐户,无需停机且无需复制数据。 有关详细信息,请参阅 升级到 GPv2 存储帐户

资源 限制
每个订阅每个区域的最大存储帐户数,包括标准存储帐户和高级存储帐户。 250
存储帐户的默认最大容量 5 PiB 1
每个存储帐户的 blob 容器、blob、目录和子目录(如果启用了分层命名空间)、文件共享、表、队列、实体或消息数目上限。 无限制
以下区域中每个常规用途 v2 和 Blob 存储帐户的默认最大请求率:
  • 中国东部 2
  • 中国北部 3
每秒 40,000 个请求2
前一行中未列出的区域中,每个常规用途 v2 和 Blob 存储帐户的默认最大请求率。 每秒 20,000 个请求1
以下区域中每个常规用途 v2 和 Blob 存储帐户的默认最大流入量:
  • 中国东部 2
  • 中国北部 3
60 Gbps1
前一行中未列出的区域中,每个常规用途 v2 和 Blob 存储帐户的默认最大流入量。 25 Gbps1
常规用途 v1 存储帐户的默认最大流入量(所有区域) 10 Gbps1
以下区域中每个常规用途 v2 和 Blob 存储帐户的默认最大流出量:
  • 中国东部 2
  • 中国北部 3
200 Gbps1
前一行中未列出的区域中,每个常规用途 v2 和 Blob 存储帐户的默认最大流出量。 50 Gbps1
常规用途 v1 存储帐户的最大出口 如果已启用 RA-GRS/GRS,则为 10 Gbps;对于 LRS/ZRS,为 15 Gbps
每个存储帐户的最大 IP 地址规则数 400
每个存储帐户的虚拟网络规则数目上限 400
每个存储帐户的资源实例规则数目上限 200
每个存储帐户的专用终结点数目上限 200

1 个 Azure 存储标准帐户支持更高的容量限制,并且可以通过请求提升入口和出口限制。 若要请求增加帐户限制,请联系 Azure 支持部门

后续步骤