对话中个人身份信息(PII)编辑概述

Azure AI 语言中的 PII 数据删除有助于检测和删除回合制对话输入中的敏感数据。 可以将此功能用于聊天和脚本工作流,例如客户支持对话、通话脚本和会议脚本。

对话 PII 针对异步对话任务和对话级上下文进行了优化,因此,您可以跨多个说话人和对话轮次编辑敏感数据。

概览

对话 PII 提供以下功能:

  • 多轮对话结构的编辑。
  • 脚本样式工作负载的异步处理。
  • 跨说话者和说话轮次的会话层次处理。
  • 结构化实体输出,其中包含经过修订的对话内容。

为什么使用对话个人可识别信息 (PII)?

对话 PII 针对基于回合的对话结构进行了优化,并支持与单段文本输入不同的对话上下文。

当你需要以下功能时,对话 PII 特别有用:

  • 在多轮对话数据中对敏感实体进行删减。
  • 处理来自呼叫中心和语音工作流的脚本输入。
  • 在屏蔽敏感信息时保留会话级上下文。

它返回的内容

作业成功后,服务将返回:

  • 检测到具有类别、子类别和置信度分数的实体。
  • 对对话项的输出进行修订。
  • 支持的转录工作流的可选转录相关元数据。

工作原理

对话 PII 使用异步工作流:

  1. 将对话项作为对话作业提交。
  2. 轮询作业状态。
  3. 检索实体和被删减的对话输出。

有关实现详细信息和请求示例,请参阅 检测和编辑对话中的个人身份信息

它与其他 PII 功能类型有何不同

所有 PII 功能类型都使用预定义实体类别,但它们针对不同的输入类型进行了优化:

  • 对话 PII 针对基于轮次和话语记录的聊天输入进行了优化。
  • 文本 PII 针对基于字符串的直接输入和应用集成进行优化。
  • 基于文档的 PII 针对原生文件工作流和文件输出质量进行了优化。

常见用例

当团队需要在存储、分析、质量评审、外部共享或下游 AI 处理之前匿名化聊天数据时,对话 PII 非常有用。

典型示例包括:

  • 呼叫中心通话记录和质量保证流程。
  • 客户支持聊天日志。
  • 会议记录和协作记录。
  • 用于分析和模型评估的多轮次对话数据集。

支持的格式和限制

  • 输入格式:会话条目(聊天或转录结构)
  • 有关当前支持详细信息,请参阅 语言支持配额和限制

Pricing

对话中的个人身份信息编辑使用 Azure AI 语言定价。 有关最新的定价详情,请参阅Azure AI 语言 定价

后续步骤

使用以下参考资料继续进行实施: