概述:使用图像分析生成图像替代文本

什么是替换文字?

替换文字或可选文字是添加到“”标记的 HTML 属性,用于在应用程序或网页上显示图像。 它在普通 HTML 代码中如下所示:

<img src="elephant.jpg" alt="An elephant in a grassland.">

可选文字使网站所有者能够以纯文本描述图像。 这些图像说明能够使屏幕阅读器(如 Microsoft 讲述人、JAWS 和 NVDA)准确地将图像内容传达给盲人用户或视力受损的用户,从而强化辅助功能。

替换文字对于图像搜索引擎优化 (SEO) 也至关重要。 它可帮助搜索引擎了解图像中的视觉内容。 然后,当用户搜索网站中的内容时,搜索引擎可以更好地在搜索结果中包含你的网站并对其进行排名。

使用图像分析自动生成替换文字

图像分析提供图像文字描述模型,用于生成图像视觉内容的一句话描述。 可以将这些 AI 生成的描述文字用作图像的替换文字。

草原里的大象。

自动生成的描述文字:“草原里的大象。”

Microsoft 自己的产品(如 PowerPoint、Word 和 Edge 浏览器)使用图像分析提供的图像文字描述来生成替换文字。

PowerPoint 幻灯片的屏幕截图,其中侧边写有替代文本。

给你的网站带来的好处

  • 改善盲人和弱视用户的辅助功能和用户体验。 替换文字使图像中的视觉信息对盲人和弱视用户使用的屏幕阅读器可用。
  • 满足法律合规性要求。 某些网站在法律上可能需要消除所有辅助功能障碍。 将替换文字用于辅助功能有助于网站所有者最大程度地降低当前和未来的法律诉讼风险。
  • 使网站更易于发现和搜索。 图像替换文字可帮助搜索引擎爬网程序更轻松地查找你的网站上的图像,并在搜索结果中将其排名靠前。

最佳做法

置信度阈值

若要确保所有图像的替换文字准确,可以选择仅接受高于特定置信度级别的描述文字。 每个用户的正确置信度级别因图像类型和使用方案而异。

通常,对于图像分析 3.2 API,建议使用置信度阈值 0.4

令人尴尬或错误的字幕

在极少数情况下,图像描述文字可能会包含令人尴尬的错误,例如将男性标记为“女性”或将成年女性标记为“女孩”。 我们鼓励用户考虑使用最新的图像分析 4.0 API,它通过支持性别中立的描述文字来消除某些错误。

请转到 Azure 门户并导航到右上角的“反馈”按钮来报告任何令人尴尬或冒犯性的描述文字。

局限性

语言支持

图像描述文字在图像分析 3.2 API 中提供英语、中文、葡萄牙语、日语和西班牙语。 在图像分析 4.0 API 中,图像描述文字仅提供英语。