次の方法で共有

对话语言理解中使用的术语和定义

使用本文了解你在使用对话语言理解时可能遇到的一些定义和术语。

实体

实体是言语中的字词,描述用于实现或识别意向的信息。 如果实体很复杂,并且你希望模型标识特定的部分,可将模型分解为子实体。 例如,你可能希望模型预测某个地址,但同时预测街道、城市、州和邮政编码等子实体。

F1 分数

F1 分数是精度和召回的一个函数,当你在 精度召回之间寻求平衡时需要。

Intent

意向表示用户想执行的任务或操作。 用户输入的内容中所表达的目的或目标,比如预订航班或支付帐单。

列表实体

列表实体表示一组固定、封闭的相关字词及其同义词。 与机器学习实体不同,列表实体是精确匹配项。

每当实体名单中的一个单词出现在输入中时,就会预测一个实体。 例如,假设有一个名为“size”的实体列表,其中包含“small”、“medium”和“large”一词。如果在陈述中使用了其中任何一个单词,则会识别大小实体。 无论这些词语出现在哪种上下文中,都会发生这种预测。

型号

模型是经过培训以执行特定任务的对象,此处为对话理解任务。 通过提供标记数据来训练模型以供学习,以便以后可以使用这些模型来理解语句。

  • 模型评估是一种在训练后立即进行的过程,可了解模型的性能情况。
  • 部署指的是将模型分配到部署以便通过预测 API 使用它的过程。

过度拟合

若模型只关注特定示例而无法很好地实现通用,就会发生过度拟合。

Precision

度量模型的精确度/准确度。 它是正确识别的正值(真正)与所有识别出的正值之间的比率。 精准率指标指示正确标记了多少个预测类。

Project

项目是一个工作区,用于基于你的数据构建自定义 ML 模型。 只有你和其他有权访问正在使用的 Azure 资源的人可以访问你的项目。

Recall

度量模型预测实际正类的能力。 它是预测的真正值与标记的结果之间的比率。 召回率指标显示正确的预测类的数量。

正则表达式

正则表达式实体表示正则表达式。 正则表达式实体是完全匹配的。

架构

架构被定义为项目中意向和实体的组合。 架构设计是项目成功的关键部分。 创建架构时,需要考虑应在项目中包括哪些意向和实体。

训练数据

训练数据是训练模型所需的信息集。

话语

发声指的是一种用户输入,它是对话中句子的简短文本代表。 这是一个自然的语言短语,如“下周二预订 2 张西雅图门票”。添加了示例话语来训练模型,模型在运行时预测新话语

后续步骤