什么是 Azure AI 视觉?

使用 Azure AI 视觉服务可以访问高级算法,这些算法根据你感兴趣的视觉功能处理图像并返回信息。 下表列出了主要产品类别。

服务 说明
光学字符识别 (OCR) 光学字符识别 (OCR) 服务从图像中提取文本。 可以使用读取 API 从图像和文档中提取印刷体文本和手写文本。 此 API 使用基于深度学习的模型,可处理各种表面和背景上的文本。 包括业务文档、发票、收据、海报、名片、信件和白板。 这些 OCR API 支持提取多种语言的印刷体文本。 按 OCR 快速入门的说明开始操作。
图像分析 图像分析服务从图像中提取许多视觉特征,例如对象、人脸、成人内容和自动生成的文本说明。 按照图像分析快速入门开始操作。
视频分析 视频分析包括与视频相关的功能,如空间分析。 空间分析功能会分析视频源上人的存在和移动,并生成其他系统可以响应的事件。 安装空间分析容器以开始工作。

用于数字资产管理的 Azure AI 视觉

Azure AI 视觉可以支持许多数字资产管理 (DAM) 方案。 DAM 是组织、存储和检索富媒体资产以及管理数字权利和权限的业务流程。 例如,公司可能希望基于可见徽标、面部、物体、颜色等来分组和标识图像。 或者,你可能希望自动生成图像 的描述文字,并附加关键字,以便其可供搜索。 有关使用 Azure AI 服务、Azure AI 搜索和智能报表的一体式 DAM 解决方案,请参阅 GitHub 上的知识挖掘解决方案加速器指南。 有关其他 DAM 示例,请参阅 Azure AI 视觉解决方案模板存储库。

开始使用

若要开始在应用中生成 Azure AI 视觉,请遵循快速入门。

图像要求

Azure AI 视觉可以分析符合以下要求的图像:

  • 图像必须以 JPEG、PNG、GIF 或 BMP 格式显示
  • 图像的文件大小必须不到 4 兆字节 (MB)
  • 图像的尺寸必须大于 50 x 50 像素
    • 对于读取 API,图像的尺寸必须介于 50 x 50 和 10,000 x 10,000 像素之间。

数据隐私和安全性

与所有 Azure AI 服务一样,使用 Azure AI 视觉服务的开发人员应了解 Microsoft 关于客户数据的策略。 请参阅 Microsoft 信任中心上的“Azure AI 服务”页面来了解详细信息。

后续步骤

参考快速入门的说明,以首选开发语言实现和运行服务。