什么是 Azure AI 视觉？

2025/07/14

使用 Azure AI 视觉服务可以访问高级算法，这些算法根据你感兴趣的视觉功能处理图像并返回信息。下表列出了主要产品类别。

服务	说明
光学字符识别 (OCR)	光学字符识别 (OCR) 服务从图像中提取文本。可以使用读取 API 从图像和文档中提取印刷体文本和手写文本。此 API 使用基于深度学习的模型，可处理各种表面和背景上的文本。包括业务文档、发票、收据、海报、名片、信件和白板。这些 OCR API 支持提取多种语言的印刷体文本。按 OCR 快速入门的说明开始操作。
图像分析	图像分析服务从图像中提取许多视觉特征，例如对象、人脸、成人内容和自动生成的文本说明。按照图像分析快速入门开始操作。

服务

说明

光学字符识别 (OCR) 服务从图像中提取文本。可以使用读取 API 从图像和文档中提取印刷体文本和手写文本。此 API 使用基于深度学习的模型，可处理各种表面和背景上的文本。包括业务文档、发票、收据、海报、名片、信件和白板。这些 OCR API 支持提取多种语言的印刷体文本。按 OCR 快速入门的说明开始操作。

图像分析

图像分析服务从图像中提取许多视觉特征，例如对象、人脸、成人内容和自动生成的文本说明。按照图像分析快速入门开始操作。

用于数字资产管理的 Azure AI 视觉

Azure AI 视觉可以支持许多数字资产管理 (DAM) 方案。 DAM 是组织、存储和检索富媒体资产以及管理数字权利和权限的业务流程。例如，公司可能希望基于可见徽标、面部、物体、颜色等来分组和标识图像。或者，你可能希望自动生成图像的描述文字，并附加关键字，以便其可供搜索。有关使用 Azure AI 服务、Azure AI 搜索和智能报表的一体式 DAM 解决方案，请参阅 GitHub 上的知识挖掘解决方案加速器指南。有关其他 DAM 示例，请参阅 Azure AI 视觉解决方案模板存储库。

开始使用

若要开始在应用中生成 Azure AI 视觉，请遵循快速入门。

图像要求

Azure AI 视觉可以分析符合以下要求的图像：

图像必须以 JPEG、PNG、GIF 或 BMP 格式显示
图像的文件大小必须不到 4 兆字节 (MB)
图像的尺寸必须大于 50 x 50 像素
- 对于读取 API，图像的尺寸必须介于 50 x 50 和 10,000 x 10,000 像素之间。

数据隐私和安全性

与所有 Azure AI 服务一样，使用 Azure AI 视觉服务的开发人员应了解 Microsoft 关于客户数据的策略。请参阅 Microsoft 信任中心上的“Azure AI 服务”页面来了解详细信息。

后续步骤

参考快速入门的说明，以首选开发语言实现和运行服务。

通过