使用 Blob 访问层的最佳做法
本文提供可帮助你使用访问层来优化性能和降低成本的最佳做法指导。 若要详细了解访问层,请参阅 Blob 数据的访问层。
可通过将 Blob 数据放入最经济高效的访问层来降低成本。 在三个专为优化数据使用成本设计的层中选择。 例如,热层的存储成本较高,但读取成本较低。 因此,如果计划频繁访问数据,则热层可能是最经济高效的选择。 如果计划降低读取数据的频率,则冷层、寒层或存档层可能最为适用,因为它们会提高读取数据的成本,同时降低存储数据的成本。
若要确定最佳访问层,请尝试估算每月读取的数据的百分比。 下面的图表显示了给定的不同读取百分比对每月支出的影响。
提前选择最佳层可以降低成本。 如果你更改已上传的块 Blob 的层,则需要支付在首次上传该 Blob 时写入初始层的费用,然后支付写入所需层的费用。 如果使用生命周期管理策略更改层,则该策略需要经过一天才能生效,并需要经过一天才能完成执行。 在更改层之前,还会产生将数据存储在初始层中的相关容量成本。
有关如何上传到特定访问层的指导,请参阅设置 Blob 的访问层。
要将数据脱机移动到所需层,请参阅 Azure Data Box。
上传数据后,应定期分析容器和 Blob,以了解它们在生产环境中的存储、组织和使用方式。 然后,使用生命周期管理策略将数据移动到最经济高效的层。 例如,将超过 30 天未被访问的数据放入冷层可能更经济高效。 考虑将超过 180 天未被访问的数据存档。
若要收集遥测数据,请启用 Blob 清单报告并启用上次访问时间跟踪。 使用 Azure Synapse 或 Azure Databricks 等工具基于上次访问时间分析使用模式。 若要了解分析数据的方式,请参阅以下任一文章:
分析结果可能会显示未活跃使用的追加 Blob 或页 Blob。 例如,你可能有一些不再读取或写入的日志文件(追加 Blob),但出于合规性原因,你想要存储这些文件。 同样,你可能想要备份磁盘或磁盘快照(页 Blob)。 也可以将这些 Blob 移动到较冷层中。 但是,必须先将其转换为块 Blob。
有关如何将追加 Blob 和页 Blob 转换为块 Blob 的信息,请参阅将追加 Blob 和页 Blob 转换为块 Blob。
每个读取或写入操作都会产生成本。 若要降低读取和写入数据的成本,请考虑使用 TAR 或 ZIP 等文件格式将小文件打包成较大的文件。 减少文件数量可以减少传输数据所需的操作数量。
以下图表显示了为冷层打包文件造成的相对影响。 读取成本假设每月读取百分比为 30%。
以下图表显示了为存档层打包文件造成的相对影响。 读取成本假设每月读取百分比为 30%。
若要对打包文件所实现的成本节省进行建模和分析,请参阅此工作簿中的“打包所实现的节省”选项卡。
提示
为了简化搜索和读取方案,请考虑创建一个索引,用于将打包文件路径与原始文件路径相映射,然后将这些索引作为块 Blob 存储在热层中。