什么是 Azure AI 视觉?

注意

截至 2023 年 7 月,Azure AI 服务包含之前称为认知服务和 Azure 应用 AI 服务的所有内容。 定价不变。 Azure 计费、成本分析、价目表和价格 API 中将继续使用名称“认知服务”和“Azure 应用 AI”。 应用程序编程接口 (API) 或 SDK 没有中断性变更。

使用 Azure 的 Azure AI 视觉服务,你可以访问高级算法,这些算法根据你感兴趣的视觉功能处理图像并返回信息。

服务 说明
光学字符识别 (OCR) 光学字符识别 (OCR) 服务从图像中提取文本。 你可以使用新读取 API 从图像和文档中提取印刷体文本和手写文本。 此 API 使用基于深度学习的模型,可处理各种表面和背景上的文本。 包括业务文档、发票、收据、海报、名片、信件和白板。 这些 OCR API 支持提取多种语言的印刷体文本。 按 OCR 快速入门的说明开始操作。
图像分析 图像分析服务从图像中提取许多视觉特征,例如对象、人脸、成人内容和自动生成的文本说明。 按照图像分析快速入门开始操作。
视频分析 视频分析包括与视频相关的功能,如空间分析。 空间分析功能会分析视频源上人的存在和移动,并生成其他系统可以响应的事件。 安装空间分析容器以开始工作。

用于数字资产管理的 Azure AI 视觉

Azure AI 视觉可以支持许多数字资产管理 (DAM) 方案。 DAM 是组织、存储和检索富媒体资产以及管理数字权利和权限的业务流程。 例如,公司可能希望基于可见徽标、面部、物体、颜色等来分组和标识图像。 或者,你可能希望自动生成图像的标题,并附加关键字,使其可供搜索。 有关使用 Azure AI 服务、Azure AI 搜索和智能报表的一体式 DAM 解决方案,请参阅 GitHub 上的知识挖掘解决方案加速器指南。 有关其他 DAM 示例,请参阅 Azure AI 视觉解决方案模板存储库。

入门

若要开始在应用中生成 Azure AI 视觉,请遵循快速入门。

图像要求

Azure AI 视觉可以分析符合以下要求的图像:

  • 图像必须以 JPEG、PNG、GIF 或 BMP 格式显示
  • 图像的文件大小必须不到 4 兆字节 (MB)
  • 图像的尺寸必须大于 50 x 50 像素
    • 对于读取 API,图像的尺寸必须介于 50 x 50 和 10,000 x 10,000 像素之间。

数据隐私和安全性

与所有 Azure AI 服务一样,使用 Azure AI 视觉服务的开发人员应了解 Microsoft 关于客户数据的策略。 请参阅 Microsoft 信任中心上的“Azure AI 服务”页面来了解详细信息。

后续步骤

参考快速入门的说明,以首选开发语言实现和运行服务。