对话语言理解中使用的术语和定义

使用本文了解你在使用对话语言理解时可能遇到的一些定义和术语。

实体

实体是言语中的字词，描述用于实现或识别意向的信息。如果实体很复杂，并且你希望模型标识特定的部分，可将模型分解为子实体。例如，你可能希望模型预测某个地址，但同时预测街道、城市、州和邮政编码等子实体。

F1 分数是精度和召回的一个函数，当你在精度和召回之间寻求平衡时需要。

意向表示用户想执行的任务或操作。用户输入的内容中所表达的目的或目标，比如预订航班或支付帐单。

列表实体表示一组固定、封闭的相关字词及其同义词。与机器学习实体不同，列表实体是精确匹配项。

每当实体名单中的一个单词出现在输入中时，就会预测一个实体。例如，假设有一个名为“size”的实体列表，其中包含“small”、“medium”和“large”一词。如果在陈述中使用了其中任何一个单词，则会识别大小实体。无论这些词语出现在哪种上下文中，都会发生这种预测。

模型是经过培训以执行特定任务的对象，此处为对话理解任务。通过提供标记数据来训练模型以供学习，以便以后可以使用这些模型来理解语句。

若模型只关注特定示例而无法很好地实现通用，就会发生过度拟合。

度量模型的精确度/准确度。它是正确识别的正值（真正）与所有识别出的正值之间的比率。精准率指标指示正确标记了多少个预测类。

项目是一个工作区，用于基于你的数据构建自定义 ML 模型。只有你和其他有权访问正在使用的 Azure 资源的人可以访问你的项目。

度量模型预测实际正类的能力。它是预测的真正值与标记的结果之间的比率。召回率指标显示正确的预测类的数量。

正则表达式实体表示正则表达式。正则表达式实体是完全匹配的。

架构被定义为项目中意向和实体的组合。架构设计是项目成功的关键部分。创建架构时，需要考虑应在项目中包括哪些意向和实体。

训练数据是训练模型所需的信息集。

发声指的是一种用户输入，它是对话中句子的简短文本代表。这是一个自然的语言短语，如“下周二预订 2 张西雅图门票”。添加了示例话语来训练模型，模型在运行时预测新话语