共用方式為

检测和编辑对话中个人身份信息

Azure 语言对话 PII API 分析音频话语,以使用各种预定义类别识别和修订敏感信息(PII)。 此 API 适用于转录的文本(称为脚本)和聊天。 对于转录,它还通过提供包含 PII 音频段的计时信息,促进了这些段的编辑。

确定如何处理数据(可选)

指定 PII 检测模型

默认情况下,此功能在输入上使用最新的可用 AI 模型。 你还可以将 API 请求配置为使用特定模型版本

语言支持

有关详细信息, 请参阅PII 语言支持页。 目前,对话 PII GA 模型仅支持英语。 预览模型和 API 支持与其他语言 相同的列表语言

区域支持

会话 PII API 支持 Azure 语言支持的所有 Azure 区域。

提交数据

可以将输入作为会话项列表提交到 API。 在收到请求时执行分析。 由于 API 是异步的,因此发送 API 请求和接收结果之间可能存在延迟。 有关每分钟和每秒可以发送的请求的大小和数量的信息,请参阅以下数据限制。

使用异步功能时,API 结果在引入请求后 24 小时内可用,并在响应中指示。 在此时间段后,结果将被清除,并且不再可用于检索。

将数据提交给会话 PII 时,每个请求可以发送一个对话(文本或语音)。

API 尝试检测给定聊天输入的所有 已定义实体类别 。 如果要指定将检测并返回哪些实体,请使用可选的 piiCategories 参数指定相应的实体类别。

对于口语脚本,检测到的实体会根据 redactionSource 提供的参数值返回。 目前,支持的值为redactionSourcetextlexicalitn以及maskedItn(分别映射到语音转文本 REST API、display\displayTextlexicalitn格式和maskedItn格式)。 此外,对于口述脚本输入,此 API 还提供音频计时信息,以增强音频修订功能。 若要使用 audioRedaction 功能,请使用可选的includeAudioRedaction标记并赋予true值。 音频修订基于词法输入格式执行。

注释

对话 PII 现支持文档大小为 40,000 个字符。

获取 PII 结果

从 PII 检测获得结果时,可以将结果流式传输到应用程序或将输出保存到本地系统上的文件中。 API 响应包括识别的实体,包括其类别和子类别,以及置信度分数。 还将返回 PII 实体已被去除的文本字符串。

例子

  1. Azure 门户中,转到资源概述页

  2. 在左侧菜单中,选择"密钥和终结点”。 需要其中一个密钥和终结点对 API 请求进行身份验证。

  3. 下载并安装所选语言的客户端库包:

    语言 包版本
    .NET 1.0.0
    Python 1.0.0
  4. 有关客户端和返回对象的详细信息, 请参阅 以下参考文档:

服务和数据限制

有关每分钟和每秒可以发送的请求大小和数量信息,请参阅服务限制一文。