什么是摘要?

重要

对话总结仅在以下情况下可用:

  • REST API
  • Python
  • C#

摘要是 Azure AI 语言提供的一项功能,它是生成式大型语言模型和任务优化编码器模型的组合,可提供具有更高质量、成本效益和较低延迟的汇总解决方案。 通过本文详细了解此功能,以及如何在应用程序中使用它。

现成即用,该服务为三种类型的文本提供摘要解决方案,即纯文本、对话和原生文档。 文本摘要仅接受纯文本块。 对话摘要接受对话输入,包括各种语音音频信号。 原生文档摘要接受以原生格式(如 Word、PDF 或纯文本)存在的文档。 有关详细信息, 请参阅支持的文档格式

能力

本文档包含以下文章类型:

  • 快速入门属于入门说明,可指导你向服务发出请求。
  • 操作指南包含以更具体的方式或自定义方式使用服务的说明。

本机文档摘要使用自然语言处理技术为本机文档生成摘要。 原生文档是指用于创建原始文档的文件格式,例如 Microsoft Word (docx) 或可移植文档文件 (pdf)。 有了原生文档支持,在使用 Azure AI 语言资源功能之前无需再进行文本预处理。 目前,本机文档功能适用于两种类型的摘要:

  • 提取摘要:通过提取文档中的突出句子以及这些句子的定位信息来生成摘要。

    • 提取的多个句子:这些句子共同传达了文档的核心思想。 它们是从输入文档内容中提取的原始句子。
    • 排名分数:排名分数指示句子与主要主题的相关程度。 文本摘要会对提取的句子进行排名,你可以确定这些句子是按其出现的顺序还是根据其排名进行返回。 例如,如果请求一个包含三个句子的摘要,则抽取式摘要会返回分数最高的三个句子。
    • 位置信息:提取的句子的开始位置和长度。
  • 抽象式摘要:生成具有简洁、连贯的句子或单词的摘要,而不是从原始文档中逐字提取句子。

    • 摘要文本:抽象摘要返回每个上下文输入范围的摘要。 可以对长输入进行分段,以便返回多组摘要文本及其上下文输入范围。
    • 上下文输入范围:输入中用于生成摘要文本的范围。

目前, 文档摘要 支持以下本机文档格式:

文件类型 文件扩展名 说明
文本 .txt 无格式的文本文档。
Adobe PDF .pdf 可移植文档文件格式的文档。
Microsoft Word .docx Microsoft Word 文档文件。

有关详细信息,请参阅对原生文档进行摘要

开始学习摘要撰写

若要使用摘要,需在应用程序中进行提交,以便进行分析并处理 API 输出。 分析按原样执行,不会对数据所用的模型进行额外的自定义。 可以通过两种方式使用摘要:

开发选项 说明
REST API 或客户端库 (Azure SDK) 使用 REST API 或以各种语言提供的客户端库将文本摘要集成到应用程序中。 有关详细信息,请参阅摘要快速入门

输入要求和服务限制

  • 摘要采用文本进行分析。 有关详细信息,请参阅操作指南中的数据和服务限制
  • 摘要适用于各种书面语言。 有关详细信息,请参阅语言支持

参考文档和代码示例

在应用程序中使用文本摘要时,请参阅以下适用于 Azure AI 语言的参考文档和示例:

开发选项/语言 参考文档 示例
C# C# 文档 C# 示例
Java Java 文档 Java 示例
Javascript JavaScript 文档 JavaScript 示例
Python Python 文档 Python 示例