摘要是 Azure AI 语言提供的一项功能,它是生成式大型语言模型和任务优化编码器模型的组合,可提供具有更高质量、成本效益和较低延迟的汇总解决方案。
通过本文详细了解此功能,以及如何在应用程序中使用它。
现成即用,该服务为三种类型的文本提供摘要解决方案,即纯文本、对话和原生文档。 文本摘要仅接受纯文本块。 对话摘要接受对话输入,包括各种语音音频信号。 原生文档摘要接受以原生格式(如 Word、PDF 或纯文本)存在的文档。 有关详细信息, 请参阅支持的文档格式。
本文档包含以下文章类型:
- 快速入门是入门指南,帮助您如何向服务发出请求。
- 操作指南包含以更具体的方式或自定义方式使用服务的说明。
文本摘要使用自然语言处理技术为纯文本生成摘要,可以从文档、对话或任何文本生成摘要。 此 API 提供两种汇总方法:
例如,请考虑以下文本段落:
“在 Microsoft,我们致力于推动人工智能技术超越现有水平,采用更全面、以人为本的方法来学习和理解。” 作为 Azure AI 服务的首席技术官,我一直在与一群了不起的科学家和工程师合作,将这一探索变为现实。 “在我的角色中,我以独特的视角看待人类认知的三个属性之间的关系:语言文本 (X)、音频或视觉传感器信号(Y) 和多语言 (Z)。” 在所有这三个属性的交点,都有一些神奇之处,如图 1 所示,我们称之为 XYZ 代码,它是一种联合表示,可以创造出更强大的 AI,它能说、听、看和更好地理解人类。 我们相信 XYZ 代码将使我们能够实现长期愿景:跨领域迁移学习、跨越模式和语言。 目标是拥有可以联合学习表示以支持广泛的下游 AI 任务的预训练模型,就像人们现在所做的。 在过去的五年里,我们在会话语音识别、机器翻译、会话问答、机器阅读理解和图像字幕方面的基准测试中达到了人类的表现。 这五项突破为我们提供了强烈的信号,让我们朝着更雄心勃勃的愿望实现人工智能能力的飞跃,实现更接近人类学习和理解方式的多感官和多语言学习。 我相信,只要以外部知识源为基础,联合 XYZ 代码是这一愿景的基础组成部分,特别是在下游 AI 任务中。
收到请求后,通过为 API 后端创建作业来处理文本摘要 API 请求。 若作业成功,将返回 API 的输出。 输出结果将在24小时内可供检索。 在指定时间后,输出将被清除。 由于多语言和表情符号支持,响应可以包含文本偏移。 有关详细信息,请参阅如何处理偏移。
如果使用前面的示例,API 可能会返回以下摘要:
抽取式摘要:
- 在 Microsoft,我们寻求通过采用一种更全面且以人为本的方法来学习和理解,推动 AI 超越现有技术。
- “我们相信 XYZ 代码将使我们能够实现长期愿景:跨领域迁移学习、跨越模式和语言。”
- 目标是拥有可以联合学习表示以支持广泛的下游 AI 任务的预训练模型,就像人们现在所做的。
抽象式摘要:
- “Microsoft 正在采取更全面的、以人为本的方法来学习和理解。 我们相信 XYZ 代码将使我们能够实现长期愿景:跨领域迁移学习、跨越模式和语言。 在过去五年里,我们在对话语音识别的基准上达到了人类水平。
本文档包含以下文章类型:
- 快速入门属于入门说明,可指导你向服务发出请求。
- 操作指南包含以更具体的方式或自定义方式使用服务的说明。
对话摘要支持以下功能:
- 回顾:将对话总结为简短段落。
- 问题/解决方法摘要:特定于呼叫中心的功能,用于提供有关客户服务代理与客户之间对话中的问题和解决方案的摘要。
- 章节标题总结:根据对话中讨论的主题将对话分为多个章节,并提供输入对话的建议章节标题。
- 叙述性摘要:生成输入对话的详细通话笔记、会议笔记或聊天摘要。
例如,请考虑以下示例对话:
代理:“你好,你正在和 Rene 聊天。请问有什么可以帮你的?”
客户:“你好,我尝试为 Smart Brew 300 浓缩咖啡机设置 wifi 连接,但不起作用。”
代理:“很遗憾发生了这种情况。我们来看看做些什么可以解决这个问题。你能不能按一下 wifi 连接按钮,按住 3 秒,然后告诉我电源灯是否在缓慢闪烁?”
客户:“是的,我按下了 wifi 连接按钮,现在电源灯在缓慢闪烁。”
代理:“很好。谢谢!现在,请查看你的 Contoso Coffee 应用。它是否提示你连接到咖啡机?”
客户:“不。没有发生任何事。”
代理:“我明白了。谢谢。让我们试试恢复出厂设置是不是可以解决问题。请按住中心按钮 5 秒钟以开始恢复出厂设置。”
客户:“我已经试过了恢复出厂设置,并且再次执行了上面的步骤,但仍然不起作用。”
代理:“我很遗憾听到这个消息。让我看看是否有其他方法可以解决这个问题。请稍等片刻。”
对话摘要功能会将该文本简化为以下内容:
示例摘要 |
备注 |
对话方面 |
客户无法为 Smart Brew 300 浓缩咖啡机设置 wifi 连接 |
客户和代理对话中的客户问题 |
问题 |
代理建议了几个故障排除步骤,包括检查 wifi 连接、检查 Contoso Coffee 应用和执行恢复出厂设置。 但是,这些步骤都未解决问题。 然后,代理请客户稍候,寻找另一个解决方案。 |
客户和代理对话中尝试的解决方案 |
解决方法 |
客户联系了代理以获取有关为其 Smart Brew 300 浓缩咖啡机设置 wifi 连接方面的帮助。 代理通过多个故障排除步骤对客户进行引导,包括 wifi 连接检查、检查电源灯和恢复出厂设置。 尽管遵循了这些步骤,但问题仍然存在。 然后代理决定探索其他潜在解决方案 |
将对话汇总到一个段落中 |
回顾 |
SmartBrew 300 浓缩咖啡机疑难解答 |
对对话进行细分,并为每段生成标题;通常与 narrative 方面合作 |
章节标题 |
客户在为其 Smart Brew 300 浓缩咖啡机设置 wifi 连接时遇到问题。 代理建议了多种解决方案,包括恢复出厂设置,但问题仍然存在。 |
对对话进行细分并为每个段生成摘要,通常与 chapterTitle 方面协同工作 |
叙述 |
本文档包含以下文章类型:
- 快速入门属于入门说明,可指导你向服务发出请求。
- 操作指南包含以更具体的方式或自定义方式使用服务的说明。
本机文档摘要使用自然语言处理技术为本机文档生成摘要。 原生文档是指用于创建原始文档的文件格式,例如 Microsoft Word (docx) 或可移植文档文件 (pdf)。 有了原生文档支持,在使用 Azure AI 语言资源功能之前无需再进行文本预处理。 目前,本机文档功能适用于两种类型的摘要:
目前, 文档摘要 支持以下本机文档格式:
文件类型 |
文件扩展名 |
说明 |
文本 |
.txt |
无格式的文本文档。 |
Adobe PDF |
.pdf |
可移植文档文件格式的文档。 |
Microsoft Word |
.docx |
Microsoft Word 文档文件。 |
有关详细信息,请参阅对原生文档进行摘要
若要使用摘要,需在应用程序中进行提交,以便进行分析并处理 API 输出。 分析按原样执行,不会对数据所用的模型进行额外的自定义。 可以通过两种方式使用摘要:
开发选项 |
说明 |
链接 |
REST API |
使用 REST API 将对话摘要集成到应用程序中。 |
快速入门:使用对话摘要 |
开发选项 |
说明 |
REST API 或客户端库 (Azure SDK) |
使用 REST API 或以各种语言提供的客户端库将文本摘要集成到应用程序中。 有关详细信息,请参阅摘要快速入门。 |
- 摘要采用文本进行分析。 有关详细信息,请参阅操作指南中的数据和服务限制。
- 摘要适用于各种书面语言。 有关详细信息,请参阅语言支持。
- 对话摘要采用结构化文本进行分析。 有关详细信息,请参阅数据和服务限制。
- 对话摘要适用于各种口语。 有关详细信息,请参阅语言支持。
- 摘要采用文本进行分析。 有关详细信息,请参阅操作指南中的数据和服务限制。
- 摘要适用于各种书面语言。 有关详细信息,请参阅语言支持。
在应用程序中使用文本摘要时,请参阅以下适用于 Azure AI 语言的参考文档和示例: