Azure 视觉中的新增功能

了解 Azure 视觉中的新增功能。查看此页以实时跟进新功能、增强功能、修补程序和文档更新。

2022 年 9 月

Azure Vision 3.0/3.1 文本识别功能预览版的停止服务通知

Azure Vision 3.0 和 3.1 读取 API 的预览版计划于 2023 年 1 月 31 日停用。建议客户参考操作指南和快速入门，以开始使用正式发布版 (GA) 的读取 API。最新的 GA 版本具有以下优势：

2022 年正式发布的最新 OCR 模型
OCR 语言覆盖范围显著增大，包括支持手写文本
改进了 OCR 质量

2022 年 6 月

用于人脸识别的负责任 AI

人脸透明度说明

透明度说明提供了相关指导，通过将融合有意义的人工评审来检测和解决错误识别或其他故障案例、向认为其结果不正确的人员提供支持以及识别和处理因操作条件变化而导致的准确度波动，从而帮助客户提高其系统的准确度和公平性。

停用敏感属性

我们已经停用了面部分析功能，这些功能旨在推断情绪状态和身份属性，如性别、年龄、微笑、面部毛发、头发和化妆。
面部检测功能（包括检测模糊、曝光、眼镜、头部姿势、特征点、噪音、阻挡物、面部轮廓）将仍然普遍可用，并且不需要应用程序。

Fairlearn 包和 Microsoft 的公平性仪表板

开源 Fairlearn 包和 Microsoft 的公平性仪表板旨在支持客户根据自己的数据衡量 Microsoft 面部验证算法的公平性，使他们能够在部署技术之前识别和解决可能影响不同人群的潜在公平性问题。

Azure Vision 3.2-preview 即将停用

API 3.2 预览版已计划于 2022 年 12 月停用。建议客户改用 API 正式版 (GA)。从 3.2 预览版迁移时请注意以下更改：

分析图像和读取 API 调用现在采用可选的 model-version 参数，该参数可用于指定要使用的 AI 模型。默认情况下，它们使用最新模型。
分析图像和读取 API 调用还会在成功的 API 响应中返回 model-version 字段。此字段报告使用了哪个模型。
图像分析 API 现在使用不同的错误报告格式。请参阅 API 参考文档详细了解如何调整任何错误处理代码。

2022 年 5 月

OCR（读取）API 模型已正式发布 (GA)

Azure 视觉的 OCR （读取） API 最新模型，支持 164 种语言现已正式发布为云服务和容器。

OCR 支持的打印文本扩展到 164 种新语言（包括俄语、阿拉伯语、印地语以及使用西里尔文字母、阿拉伯字母和梵文字母的其他语言）。
OCR 支持的手写文本扩展到 9 种语言，即英语、简体中文、法语、德语、意大利语、日语、韩语、葡萄牙语和西班牙语。
增强了对单个字符、手写日期、数量、名称、通常在收据和发票中找到的其他实体的支持。
改进了对数字 PDF 文档的处理。
输入文件大小限制提高 10 倍至 500 MB。
性能和延迟方面的改进。

请参阅 OCR 操作指南，了解如何使用 GA 模型。

读取 API 入门

2022 年 2 月

OCR（读取）API 公共预览版支持 164 种语言

Azure 视觉的 OCR （读取） API 在最新预览版中将支持的语言扩展到 164 种：

OCR 支持的打印文本扩展到 42 种新语言（包括阿拉伯语、印度语以及使用阿拉伯字母和梵文字母的其他语言）。
除了英语、简体中文、法语、德语、意大利语、葡萄牙语和西班牙语外，OCR 支持的手写文本还扩展到日语和韩语。
增强功能包括更好支持提取手写日期、数量、名称和单个字符框。
常规性能和 AI 质量改进

请参阅 OCR 操作指南，了解如何使用新的预览功能。

读取 API 入门

2021 年 9 月

OCR（读取）API 公共预览版支持 122 种语言

Azure 视觉的 OCR（读取）API 在最新预览版中将支持的语言增加至 122 种：

OCR 支持，针对 49 种新语言（包括俄语、保加利亚语、其他西里尔语和其他拉丁语）的打印文本。
OCR 支持，针对 6 种新语言（包括英语、简体中文、法语、德语、意大利语、葡萄牙语和西班牙语）的手写文本。
增强功能，用于处理标识文档中的数字 PDF 和计算机可读区域 (MRZ) 文本。
常规性能和 AI 质量改进

请参阅 OCR 操作指南，了解如何使用新的预览功能。

读取 API 入门

2021 年 8 月

图像标记语言扩展

图像标记器的最新版本 (v3.2) 现支持 50 种语言的标记。有关详细信息，请参阅语言支持页。

2021 年 7 月

面向 Detection_03 的新的 HeadPose 和特征点改进

Detection_03 模型现已更新，可支持面部特征点。
Detection_03 中的特征点功能更加精确，尤其是在对视线跟踪至关重要的眼球特征点方面。

2021 年 5 月

空间分析容器更新

已发布提供新功能集的空间分析容器新版本。借助此 Docker 容器，可分析实时流视频，了解人们与他们在物理环境中的移动之间的空间关系。

现可配置空间分析操作来检测人面朝的方向。
- 可通过配置 personcrossingline 参数，为 personcrossingpolygon 和 enable_orientation 操作启用方向分类器。默认情况下，此选项设置为 off。
空间分析操作现在还提供可检测人步行/奔跑速度的配置
- 可以通过打开 personcrossingline 分类器（默认情况下为关闭状态）来检测 personcrossingpolygon 和 enable_speed 操作的速度。输出结果反映在 speed、avgSpeed 和 minSpeed 输出中。

2021 年 4 月

Azure Vision v3.2 正式版

Azure 视觉 API v3.2 现已全面可用，并包括以下更新内容：

改善了图像标记模型：根据图像中显示的对象、操作和内容分析视觉对象内容并生成相关标记。此模型通过标记图像 API 提供。有关详细信息，请参阅图像分析操作指南和概述。
更新的内容审查模型：检测是否存在成人内容并提供标志来筛选包含成人、猥亵和血腥视觉内容的图像。可通过分析 API 获取此模型。有关详细信息，请参阅图像分析操作指南和概述。
用于 73 种语言的 OCR（读取），这些语言包括简体中文和繁体中文、日语、韩语和拉丁语言。

请参阅 Azure Vision v3.2 正式版

2021 年 3 月

Azure Vision 3.2 公共预览版更新

Azure 视觉 API v3.2 公共预览版已更新。预览版包含所有 Azure 视觉功能以及更新的读取和分析 API。

请参阅 Azure Vision v3.2 公共预览版 3

2021 年 2 月

读取 API v3.2 公共预览版（带有对 73 种语言的 OCR 支持）

Azure 视觉读取 API v3.2 公共预览版（作为云服务和 Docker 容器提供）包括以下更新：

用于 73 种语言的 OCR，这些语言包括简体中文和繁体中文、日语、韩语和拉丁语言。
文本行输出的自然读取顺序（仅限拉丁语言）
文本行的手写样式分类以及置信度分数（仅限拉丁语言）。
对于多页文档，仅提取所选页面的文本。

若要了解详细信息，请参阅读取 API 操作指南。

使用读取 API v3.2 公共预览版

2021 年 1 月

空间分析容器更新

已发布提供新功能集的空间分析容器新版本。借助此 Docker 容器，可分析实时流视频，了解人们与他们在物理环境中的移动之间的空间关系。

现可配置空间分析操作来检测某人是否正戴着口罩等保护性面罩。
- 可通过配置 personcount 参数，为 personcrossingline、personcrossingpolygon 和 ENABLE_FACE_MASK_CLASSIFIER 操作启用口罩分类器。
- 系统将以元数据的形式返回 face_mask 和 face_noMask 属性，其中有在视频流中检测到的每个人的置信度分数
personcrossingpolygon 操作已得到扩展，可计算一个人在某个区域中的停留时间。可将该操作的区域配置中的 type 参数设置为 zonedwelltime，类型为 personZoneDwellTimeEvent 的新事件将包括 durationMs 字段，该字段填充了该人员在该区域中停留的毫秒数。
中断性变更：已将 personZoneEvent 事件重命名为 personZoneEnterExitEvent。此事件在某人进入或离开该区域时由 personcrossingpolygon 操作引发，并提供与所穿过区域的编号侧相关的方向信息。
可在所有操作中将视频 URL 作为“专用参数/已模糊处理”提供。模糊处理现在是可选操作，仅当 KEY 和 IV 作为环境变量提供时才有效。
默认情况下，对所有操作启用了校准。设置 do_calibration: false 可禁用它。
已通过 enable_recalibration 参数增加对自动重新校准的支持（默认禁用），请参阅空间分析操作了解有关详细信息
照相机校准参数设置为 DETECTOR_NODE_CONFIG。有关详细信息，请参阅空间分析操作。

2020 年 12 月

人脸 ID 存储的客户配置

尽管人脸服务不存储客户图像，但已提取的人脸特征将存储在服务器上。人脸 ID 是人脸特征的标识符，并且将在人脸 - 识别、人脸 - 验证和人脸 - 查找相似中使用。在进行原始检测调用之后的 24 小时，存储的人脸特征将过期并将会被删除。客户现在可以决定这些人脸 ID 的缓存时间长度。最大值仍为 24 小时，但现在可以设置最小值 60 秒。缓存人脸 ID 的新时间范围是介于 60 秒和 24 小时之间的任何值。有关详细信息，请参阅人脸 - 检测 API 参考（faceIdTimeToLive 参数）。

2020 年 10 月

Azure 视觉 API v3.1 正式版

Azure 视觉 API 已在公共预览版中升级到 v3.1。

2020 年 9 月

空间分析容器预览版

空间分析容器现提供预览版。使用 Azure 视觉的空间分析功能，可以分析实时流式处理视频，以了解人员与其在物理环境中移动之间的空间关系。空间分析是一种可以在本地使用的 Docker 容器。

读取 API v3.1 公共预览版添加了日语的 OCR

Azure 视觉读取 API v3.1 公共预览版添加了这些功能：

日语的 OCR
对于每个文本行，指示呈现效果是手写体还是打印样式，并随附置信度评分（仅限拉丁语言）。
对于多页文档，仅提取所选页面或页面范围的文本。
此预览版本的读取 API 支持英语、荷兰语、法语、德语、意大利语、日语、葡萄牙语、简体中文和西班牙语。

若要了解详细信息，请参阅读取 API 操作指南。

详细了解读取 API v3.1 公共预览版 2

2020 年 7 月

读取 API v3.1 公共预览版包含简体中文的 OCR

Azure 视觉读取 API v3.1 公共预览版添加了对简体中文的支持。

此预览版本的读取 API 支持英语、荷兰语、法语、德语、意大利语、葡萄牙语、简体中文和西班牙语。

若要了解详细信息，请参阅读取 API 操作指南。

详细了解读取 API v3.1 公共预览版 1

2020 年 5 月

Azure 视觉 API v3.0 进入一般可用性，并更新了 Read API。

支持英语、荷兰语、法语、德语、意大利语、葡萄牙语和西班牙语
准确度改进
每个已提取单词的置信度分数
新输出格式

若要了解详细信息，请参阅 OCR 概述。

2020 年 3 月

现在，将对此服务的所有 HTTP 请求强制执行 TLS 1.2。有关详细信息，请参阅 Azure AI 服务安全性。

2020 年 1 月

读取 API 3.0 公共预览版

现在，可以使用 Read API 3.0 版从图像中提取印刷体文本或手写文本。与早期版本相比，3.0 版提供了：

准确度改进
新输出格式
每个已提取单词的置信度分数
使用语言参数同时支持西班牙语和英语

按照提取文本快速入门，开始使用 3.0 API。

2019 年 4 月

提高了属性准确度

提高了 age 和 headPose 属性的总体准确性。此外还更新了 headPose 属性，pitch 值现已启用。使用这些属性的方法是在returnFaceAttributes 参数的 returnFaceAttributes 参数中指定它们。

提高了处理速度

提高了人脸 - 检测、FaceList - 添加人脸、LargeFaceList - 添加人脸、PersonGroup 人员 - 添加人脸和 LargePersonGroup 人员 - 添加人脸操作的速度。

2019 年 1 月

人脸快照功能

此功能使服务可以支持跨订阅进行数据迁移：快照。

重要

人脸快照 API 已于 2023 年 6 月 30 停用。

2018 年 10 月

API 消息

在 status、createdDateTime和 lastActionDateTime中完善了对 lastSuccessfulTrainingDateTime、、和的说明。

2018 年 5 月

提高了属性准确度

显着改进了 gender 属性，还改进了 age、glasses、facialHair、hair、makeup 属性。通过人脸 - 检测returnFaceAttributes 参数使用这些属性。

增加了文件大小限制

在以下部分中将输入图像文件大小限制从 4 MB 增加到了 6 MB：人脸 - 检测、FaceList - 添加人脸、LargeFaceList - 添加人脸、PersonGroup 人员 - 添加人脸和 LargePersonGroup人员 - 添加人脸。

2017 年 5 月

新的可检测人脸属性

在hairmakeup 参数中添加了 accessory、occlusion、blur、exposure、noise、和 returnFaceAttributes 属性。
在 PersonGroup 和人脸 - 识别中支持 10K 人员。
在带可选参数和 start 的 top中支持分页。
支持在针对 PersonGroup 中的不同 FaceLists 和不同人员添加/删除人脸时的并发性。

2017 年 3 月

新的可检测人脸属性

在emotion 参数中添加了 returnFaceAttributes 属性。

已修复的问题

无法使用从人脸 - 检测返回的矩形重新将人脸检测为 targetFace和 PersonGroup 人员 - 添加人脸中的。
设置了可检测的人脸大小，以确保它一定在 36x36 到 4096x4096 像素之间。

2016 年 11 月

新的订阅层

添加了人脸存储标准订阅以在使用 PersonGroup 人员 - 添加人脸或 FaceList - 添加人脸进行标识或相似性匹配时存储额外的持久性人脸。存储的图像按每 1000 张人脸 0.5 美元收费，每天以此费率按比例计费。免费层订阅的总人数仍限制为 1,000 人。

2016 年 10 月

API 消息

在 targetFace和 PersonGroup 人员 - 添加人脸中将中多个人脸的错误消息从“There are more than one face in the image”更改为“There is more than one face in the image”。

2016 年 7 月

新增功能

支持在人脸 - 验证中进行人脸到人员对象身份验证。
添加了可选的 mode 参数，可以选择两种工作模式：matchPerson中的 matchFace 和，默认值为 matchPerson。
为用户添加了可选的 confidenceThreshold 参数，以设置一个人脸是否属于人脸 - 识别中的 Person 对象的阈值。
在 start中添加了可选的 top 和参数，使用户能够指定要列出的起点和总 PersonGroup 数。

从 V0 进行的 V1.0 更改

将服务根终结点从 https://api.cognitive.azure.cn/face/v0/ 更改为 https://api.cognitive.azure.cn/face/v1.0/。更改已应用于：人脸 - 检测、人脸 - 识别、人脸 - 查找相似和人脸 - 组。
将最小可检测人脸大小更新为 36x36 像素。将不会检测到小于 36x36 像素的人脸。
已弃用人脸 V0 中的 PersonGroup 和 Person 数据。使用人脸 V1.0 服务无法访问这些数据。
于 2016 年 6 月 30 日弃用了人脸 API 的 V0 终结点。

Last updated on 2025-12-05

通过

Azure 视觉中的新增功能

2022 年 9 月

Azure Vision 3.0/3.1 文本识别功能预览版的停止服务通知

2022 年 6 月

用于人脸识别的负责任 AI

人脸透明度说明

停用敏感属性

Fairlearn 包和 Microsoft 的公平性仪表板

Azure Vision 3.2-preview 即将停用

2022 年 5 月

OCR（读取）API 模型已正式发布 (GA)

2022 年 2 月

OCR（读取）API 公共预览版支持 164 种语言

2021 年 9 月

OCR（读取）API 公共预览版支持 122 种语言

2021 年 8 月

图像标记语言扩展

2021 年 7 月

面向 Detection_03 的新的 HeadPose 和特征点改进

2021 年 5 月

空间分析容器更新

2021 年 4 月

Azure Vision v3.2 正式版

2021 年 3 月

Azure Vision 3.2 公共预览版更新

2021 年 2 月

读取 API v3.2 公共预览版（带有对 73 种语言的 OCR 支持）

2021 年 1 月

空间分析容器更新

2020 年 12 月

人脸 ID 存储的客户配置

2020 年 10 月

Azure 视觉 API v3.1 正式版

2020 年 9 月

空间分析容器预览版

读取 API v3.1 公共预览版添加了日语的 OCR

2020 年 7 月

读取 API v3.1 公共预览版包含简体中文的 OCR

2020 年 5 月

2020 年 3 月

2020 年 1 月

读取 API 3.0 公共预览版

2019 年 4 月

提高了属性准确度

提高了处理速度

2019 年 1 月

人脸快照功能

2018 年 10 月

API 消息

2018 年 5 月

提高了属性准确度

增加了文件大小限制

2017 年 5 月

新的可检测人脸属性

2017 年 3 月

新的可检测人脸属性

已修复的问题

2016 年 11 月

新的订阅层

2016 年 10 月

API 消息

2016 年 7 月

新增功能

从 V0 进行的 V1.0 更改

其他资源