如何使用关键短语提取
关键短语提取功能可用于计算非结构化文本,并针对每个文档返回关键短语列表。
如果需要快速确定文档集中的要点,此功能十分有用。 例如,给定输入文本“The food was delicious and the staff was wonderful”,服务会返回主要主题:“food”和“wonderful staff” 。
提示
若要开始使用此功能,可以按照快速入门文章开始操作。 也可使用 Language Studio 提出示例请求,而无需编写代码。
开发选项
若要使用关键短语提取,需在应用程序中提交原始非结构化文本进行分析并处理 API 输出。 分析按原样执行,不会对数据所用的模型进行其他自定义。 可通过两种方式使用关键短语提取:
开发选项 | 说明 |
---|---|
Language Studio | Language Studio 是一个基于 Web 的平台,让你可以在没有 Azure 帐户的情况下尝试使用文本示例进行实体链接,并在注册时使用自己的数据。 有关详细信息,请参阅 Language Studio 网站或 Language Studio 快速入门。 |
REST API 或客户端库 (Azure SDK) | 使用 REST API 或以各种语言提供的客户端库将关键短语提取集成到应用程序中。 有关详细信息,请参阅关键短语提取快速入门。 |
Docker 容器 | 使用可用的 Docker 容器在本地部署此功能。 借助这些 Docker 容器,你能够将服务进一步引入数据,以满足合规性、安全性或其他操作目的。 |
确定如何处理数据(可选)
指定关键短语提取模型
默认情况下,关键短语提取将对文本使用最新的可用 AI 模型。 你还可以将 API 请求配置为使用特定模型版本。
输入语言
在提交要由关键短语提取进行处理的文档时,可以指定在编写这些文档时采用哪种受支持的语言。如果不指定语言,关键短语提取将默认为英语。 API 可能会在响应中返回偏移量,以支持不同的多语言和表情符号编码。
提交数据
提供的要处理的文本量越大,关键短语提取效果越好。 这恰好与情绪分析(文本量越小,效果越好)相反。 要从两个操作获取最佳结果,请考虑相应地重建输入。
若要发送 API 请求,需要语言资源终结点和密钥。
注意
可以在 Azure 门户上找到语言资源的密钥和终结点。 它们将位于资源的“密钥和终结点”页的“资源管理”下 。
在收到请求时执行分析。 同步使用关键短语提取功能是无状态的。 不会在帐户中存储数据,结果会立即在响应中返回。
在以异步方式使用此功能时,API 结果在引入请求时的 24 小时内可用,并在响应中指示。 在此时间段后,结果将被清除,并且不再可用于检索。
获取关键短语提取结果
从 API 收到结果时,返回的关键短语的顺序由模型在内部确定。 可将结果流式传输到应用程序,或者将输出保存到本地系统上的文件中。
服务和数据限制
有关每分钟和每秒可以发送的请求大小和数量信息,请参阅服务限制一文。