如何使用关键短语提取

关键短语提取功能可用于计算非结构化文本,并针对每个文档返回关键短语列表。

如果需要快速确定文档集中的要点,此功能十分有用。 例如,给定输入文本“The food was delicious and the staff was wonderful”,服务会返回主要主题:“food”和“wonderful staff” 。

提示

若要开始使用此功能,可以按照快速入门文章开始操作。 也可使用 Language Studio 提出示例请求,而无需编写代码。

开发选项

若要使用关键短语提取,需在应用程序中提交原始非结构化文本进行分析并处理 API 输出。 分析按原样执行,不会对数据所用的模型进行其他自定义。 可通过两种方式使用关键短语提取:

开发选项 说明
Language Studio Language Studio 是一个基于 Web 的平台,让你可以在没有 Azure 帐户的情况下尝试使用文本示例进行实体链接,并在注册时使用自己的数据。 有关详细信息,请参阅 Language Studio 网站Language Studio 快速入门
REST API 或客户端库 (Azure SDK) 使用 REST API 或以各种语言提供的客户端库将关键短语提取集成到应用程序中。 有关详细信息,请参阅关键短语提取快速入门
Docker 容器 使用可用的 Docker 容器在本地部署此功能。 借助这些 Docker 容器,你能够将服务进一步引入数据,以满足合规性、安全性或其他操作目的。

确定如何处理数据(可选)

指定关键短语提取模型

默认情况下,关键短语提取将对文本使用最新的可用 AI 模型。 你还可以将 API 请求配置为使用特定模型版本

输入语言

在提交要由关键短语提取进行处理的文档时,可以指定在编写这些文档时采用哪种受支持的语言。如果不指定语言,关键短语提取将默认为英语。 API 可能会在响应中返回偏移量,以支持不同的多语言和表情符号编码

提交数据

提供的要处理的文本量越大,关键短语提取效果越好。 这恰好与情绪分析(文本量越小,效果越好)相反。 要从两个操作获取最佳结果,请考虑相应地重建输入。

若要发送 API 请求,需要语言资源终结点和密钥。

注意

可以在 Azure 门户上找到语言资源的密钥和终结点。 它们将位于资源的“密钥和终结点”页的“资源管理”下 。

在收到请求时执行分析。 同步使用关键短语提取功能是无状态的。 不会在帐户中存储数据,结果会立即在响应中返回。

以异步方式使用此功能时,API 结果在引入请求时的 24 小时内可用,并在响应中指示。 在此时间段后,结果将被清除,并且不再可用于检索。

获取关键短语提取结果

从 API 收到结果时,返回的关键短语的顺序由模型在内部确定。 可将结果流式传输到应用程序,或者将输出保存到本地系统上的文件中。

服务和数据限制

有关每分钟和每秒可以发送的请求大小和数量信息,请参阅服务限制一文。

后续步骤

关键短语提取概述