概述：使用图像分析生成图像替代文本

注意

Azure Vision 中的图像分析 4.0 服务已弃用，将于 2028 年 9 月 25 日停用，之后对服务的调用将失败。建议切换到迁移指南中概述的可用替代方法之一。

什么是替换文字?

替换文字 (Alt text) 是添加到 <img> 标记的 HTML 属性，用于在应用程序或网页上显示图像。它在普通 HTML 代码中如下所示：

<img src="elephant.jpg" alt="An elephant in a grassland.">

可选文字使网站所有者能够以纯文本描述图像。这些图像说明通过让屏幕阅读器（例如 Microsoft 讲述人、JAWS 和 NVDA）能够准确地将图像内容传达给盲人或有视觉障碍的用户，进而提高无障碍性。

替换文字对于图像搜索引擎优化 (SEO) 也至关重要。它可帮助搜索引擎了解图像中的视觉内容。然后，当用户搜索网站中的内容时，搜索引擎可以更好地在搜索结果中包含你的网站并对其进行排名。

图像分析提供图像文字描述模型，用于生成图像视觉内容的一句话描述。可以将这些 AI 生成的描述文字用作图像的替换文字。

草原里的大象。

自动生成的描述文字：“草原里的大象。”

Microsoft 自己的产品（如 PowerPoint、Word 和 Edge 浏览器）通过图像分析使用图像说明生成替代文本。

若要确保所有图像的替换文字准确，可以选择仅接受高于特定置信度级别的描述文字。每个用户的正确置信度级别因图像类型和使用方案而异。

通常，对于图像分析 3.2 API，建议使用置信度阈值 0.4。

在极少数情况下，图像描述文字可能会包含令人尴尬的错误，例如将男性标记为“女性”或将成年女性标记为“女孩”。我们鼓励用户考虑使用最新的图像分析 4.0 API，它通过支持性别中立的描述文字来消除某些错误。

转到 Azure 门户并导航到右上角的 Feedback 按钮来报告任何尴尬或冒犯性标题。

图像描述文字在图像分析 3.2 API 中提供英语、中文、葡萄牙语、日语和西班牙语。在图像分析 4.0 API 中，图像描述文字仅提供英语。