Compartir a través de

如何:使用情绪分析和观点挖掘

情绪分析和观点挖掘是检测积极情绪和消极情绪的两种方法。 使用情绪分析,可以在句子和文档级别获得情绪标签(如“消极”、“中性”和“积极”)和置信度分数。 观点挖掘提供文本中与字词(如产品或服务属性)相关的精细信息。

情绪分析

情绪分析将情绪标签应用于文本,然后在句子和文档级别返回标签,每个标签都有一个置信度分数。

标签为积极、消极和中性。 在文档级别,还可能返回混合情绪标签。 文档的情绪由以下内容确定:

句子情绪 返回的文档标签
文档中至少有一个 positive 句子。 剩下的句子为 neutral positive
文档中至少有一个 negative 句子。 剩下的句子为 neutral negative
文档中至少有一个 negative 句子和一个 positive 句子。 mixed
文档中的所有句子为 neutral neutral

置信度分数范围介于 1 到 0 之间。 分数越接近于 1 表示标签分类的置信度越高,分数越低表示置信度越低。 对于每个文档或每个句子,与标签(积极、消极和中性)关联的预测分数总和为 1。

观点挖掘

观点挖掘是一项情绪分析功能。 此功能在自然语言处理 (NLP) 中也称为基于特性的情绪分析,它更加精细地描述了对文本中某些产品或服务属性的观点。 API 将观点作为目标(名词或动词)和评估(形容词)。

例如,如果客户评论某家酒店,例如“房间很好,但员工不友好”,观点挖掘将查找文本中的目标(方面)及其相关的评估(观点)和情绪。 情绪分析可能只报告消极情绪。

A diagram of the Opinion Mining example

如果你正在使用 REST API,若要在结果中获取观点挖掘,必须在情绪分析请求中包含 opinionMining=true 标志。 观点挖掘结果将包含在情绪分析响应中。 观点挖掘是情绪分析的扩展,包含在你当前的定价层中。

开发选项

若要使用情绪分析,需在应用程序中提交原始非结构化文本进行分析并处理 API 输出。 分析按原样执行,不会对数据所用的模型进行其他自定义。 可通过两种方式使用情绪分析:

开发选项 说明
Language Studio Language Studio 是一个基于 Web 的平台,让你可以在没有 Azure 帐户的情况下尝试使用文本示例进行实体链接,并在注册时使用自己的数据。 有关详细信息,请参阅 Language Studio 网站Language Studio 快速入门
REST API 或客户端库 (Azure SDK) 使用 REST API 或以各种语言提供的客户端库将情绪分析集成到应用程序中。 有关详细信息,请参阅情绪分析快速入门
Docker 容器 使用可用的 Docker 容器在本地部署此功能。 借助这些 Docker 容器,你能够将服务进一步引入数据,以满足合规性、安全性或其他操作目的。

确定如何处理数据(可选)

指定情绪分析模型

默认情况下,情绪分析对文本使用最新可用的 AI 模型。 你还可以将 API 请求配置为使用特定模型版本

输入语言

提交要由情绪分析处理的文档时,可以指定它们是用哪种受支持的语言编写的。 如果未指定语言,则情绪分析默认为英语。 API 可能会在响应中返回偏移量,以支持不同的多语言和表情符号编码

提交数据

当为情绪分析和观点挖掘提供较少的文本时,会得到更高质量的结果。 这与一些功能(如关键短语提取)相反,关键短语提取在处理较大的文本块时表现更好。

若要发送 API 请求,需要语言资源终结点和密钥。

注意

可以在 Azure 门户上找到语言资源的密钥和终结点。 它们将位于资源的“密钥和终结点”页的“资源管理”下 。

在收到请求时执行分析。 同步使用情绪分析和观点挖掘功能是无状态的。 不会在帐户中存储数据,结果会立即在响应中返回。

以异步方式使用此功能时,API 结果在引入请求时的 24 小时内可用,并在响应中指示。 在此时间段后,结果将被清除,并且不再可用于检索。

获取情绪分析和观点挖掘结果

从 API 收到结果时,返回的关键短语的顺序由模型在内部确定。 可将结果流式传输到应用程序,或者将输出保存到本地系统上的文件中。

情绪分析为整个文档以及其中的每个句子返回情绪标签和置信度分数。 分数越接近于 1 表示标签分类的置信度越高,分数越低表示置信度越低。 一个文档可以有多个句子,每个文档或句子的置信度分数合计为 1。

观点挖掘将查找文本中的目标(名词或动词)及其相关的评估(形容词)。 例如,“餐厅的食物很好,并且服务员很友好”这句话包括两个目标:食物和服务员。 每个目标都有一个评估。 例如,对食物的评估是“很好”,对服务员的评估是“很友好”。

API 返回观点作为目标(名词或动词)和评估(形容词)。

服务和数据限制

有关每分钟和每秒可以发送的请求大小和数量信息,请参阅服务限制一文。

请参阅