Azure AI 语言中的 PII 数据删除有助于检测和删除回合制对话输入中的敏感数据。 可以将此功能用于聊天和脚本工作流,例如客户支持对话、通话脚本和会议脚本。
对话 PII 针对异步对话任务和对话级上下文进行了优化,因此,您可以跨多个说话人和对话轮次编辑敏感数据。
概览
对话 PII 提供以下功能:
- 多轮对话结构的编辑。
- 脚本样式工作负载的异步处理。
- 跨说话者和说话轮次的会话层次处理。
- 结构化实体输出,其中包含经过修订的对话内容。
为什么使用对话个人可识别信息 (PII)?
对话 PII 针对基于回合的对话结构进行了优化,并支持与单段文本输入不同的对话上下文。
当你需要以下功能时,对话 PII 特别有用:
- 在多轮对话数据中对敏感实体进行删减。
- 处理来自呼叫中心和语音工作流的脚本输入。
- 在屏蔽敏感信息时保留会话级上下文。
它返回的内容
作业成功后,服务将返回:
- 检测到具有类别、子类别和置信度分数的实体。
- 对对话项的输出进行修订。
- 支持的转录工作流的可选转录相关元数据。
工作原理
对话 PII 使用异步工作流:
- 将对话项作为对话作业提交。
- 轮询作业状态。
- 检索实体和被删减的对话输出。
有关实现详细信息和请求示例,请参阅 检测和编辑对话中的个人身份信息。
它与其他 PII 功能类型有何不同
所有 PII 功能类型都使用预定义实体类别,但它们针对不同的输入类型进行了优化:
- 对话 PII 针对基于轮次和话语记录的聊天输入进行了优化。
- 文本 PII 针对基于字符串的直接输入和应用集成进行优化。
- 基于文档的 PII 针对原生文件工作流和文件输出质量进行了优化。
常见用例
当团队需要在存储、分析、质量评审、外部共享或下游 AI 处理之前匿名化聊天数据时,对话 PII 非常有用。
典型示例包括:
- 呼叫中心通话记录和质量保证流程。
- 客户支持聊天日志。
- 会议记录和协作记录。
- 用于分析和模型评估的多轮次对话数据集。
支持的格式和限制
Pricing
对话中的个人身份信息编辑使用 Azure AI 语言定价。 有关最新的定价详情,请参阅Azure AI 语言 定价。
后续步骤
使用以下参考资料继续进行实施: