添加实体以提取数据

创建实体,以便从语言理解 (LUIS) 应用的用户话语中提取关键数据。 客户端应用程序使用提取的实体数据来满足客户请求。

实体表示要提取的话语中的字词或短语。 实体描述与意向相关的信息,它们有时对于应用执行任务至关重要。 在将示例话语添加到意向或将示例话语添加到意向之外(之前或之后)时,可以创建实体。

规划实体,然后创建并进行标记

可以通过示例话语创建计算机学习实体,也可以通过“实体”页创建计算机学习实体。

通常,最佳做法是在门户中创建机器学习实体之前,先花费一定时间来规划实体。 然后,通过示例话语文本创建机器学习实体,并在子实体和特征中包含尽可能多的当时已知的详细信息。 可分解实体教程演示了如何使用此方法。

在规划实体的过程中,可能会需要文本匹配实体(例如预生成的实体、正则表达式实体或列表实体)。 可以从“实体”页面创建它们,然后在示例话语中标记它们。

标记时,你可以标记单个实体,然后生成为父级机器学习实体。 或者,你可以从父级机器学习实体开始,然后分解为子实体。

提示

标记可能指示实体的所有字词,即使在客户端应用程序中提取后未使用这些单词。

何时创建实体

规划实体后,应创建你的机器学习实体和子实体。 这可能需要添加预生成实体或文本匹配实体,来为你的机器学习实体提供功能。 这一切应在进行标记之前完成。

一旦开始标记示例话语,就可以创建机器学习实体或扩展列表实体。

使用下表了解在何处创建或如何将每种实体类型添加到应用。

实体类型 LUIS 门户中可在哪里创建实体
机器学习实体 实体或意图详细信息
列表实体 实体或意图详细信息
正则表达式实体 实体
Pattern.any 实体 实体
预生成实体 实体
预生成域实体 实体

可以从“实体”页创建所有实体,也可以在“意向详细信息”页上的示例话语中,在标记实体的过程中创建多个实体 。 只能在“意向详细信息”页上的示例话语中标记实体。

如何创建新的自定义实体

此过程适用于计算机学习实体、列表实体和正则表达式实体。

  1. 登录到 LUIS 门户,选择“订阅”和“创作资源”以查看分配给该创作资源的应用。
  2. 在“我的应用”页上选择应用名称以打开应用。
  3. 选择“实体”页。
  4. 选择“+ 创建”,然后选择实体类型。
  5. 继续配置实体,并在完成后选择“创建”。

创建机器学习实体

  1. 登录到 LUIS 门户,选择“订阅”和“创作资源”以查看分配给该创作资源的应用。

  2. 在“我的应用”页上选择应用名称以打开应用。

  3. 在“生成”部分的左侧面板中选择“实体”,然后选择“+ 创建” 。

  4. 在“创建实体类型”对话框中,输入实体名称,然后选择“机器学习”,然后选择 。 若要添加子实体,请选择“添加结构”。 选择“创建” 。

    创建机器学习实体的屏幕截图。

  5. 在“添加子实体”中,通过选择父实体行上的“+”添加子实体 。

    添加实体的屏幕截图。

  6. 选择“创建”,完成创建过程。

向机器学习实体添加功能

  1. 登录到 LUIS 门户,选择“订阅”和“创作资源”以查看分配给该创作资源的应用。

  2. 在“我的应用”页上选择应用名称以打开应用。

  3. 从“生成”部分,在左侧面板中选择“实体”,然后选择机器学习实体 。

  4. 通过选择实体或子实体行上的“+ 添加功能”来添加功能。

  5. 从现有实体和短语列表中选择。

  6. 如果只在找到功能时才提取实体,请为该功能选择星号 *

    向实体添加功能的屏幕截图。

创建正则表达式实体

  1. 登录到 LUIS 门户,选择“订阅”和“创作资源”以查看分配给该创作资源的应用。

  2. 在“我的应用”页上选择应用名称以打开应用。

  3. 在“生成”部分的左侧面板中选择“实体”,然后选择“+ 创建” 。

  4. 在“创建实体类型”对话框中,输入实体的名称,然后选择“RegEx”,在“Regex”字段中输入正则表达式,然后选择“创建” 。

    创建正则表达式实体的屏幕截图。

创建列表实体

列表实体表示一组固定、封闭的相关单词。 虽然你作为作者可以更改列表,但 LUIS 不会扩大或缩小列表。 还可以使用列表 entity .json 格式导入到现有列表实体。

下面的列表演示规范名称和同义词。

颜色 - 列表项名称 颜色 - 同义词
红色 深红色、血红色、苹果色、消防车色
蓝色 天空蓝、钴蓝
绿色 鲜绿色、青柠绿

使用过程来创建列表实体。 创建列表实体后,不需要在意向中标记示例言语。 使用精确文本匹配列表项和同义词。

  1. 登录到 LUIS 门户,选择“订阅”和“创作资源”以查看分配给该创作资源的应用。

  2. 在“我的应用”页上选择应用名称以打开应用。

  3. 在“生成”部分的左侧面板中选择“实体”,然后选择“+ 创建” 。

  4. 在“创建实体类型”对话框中,输入实体名称(例如 Colors),然后选择“列表” 。

  5. 在“创建列表实体”对话框的“添加新子列表…”中,输入列表项名称(例如 Green),然后添加同义词 。

    在实体详细信息页中创建颜色列表作为列表实体。

  6. 添加完列表项和同义词后,选择“创建”。

    完成对应用的一组更改后,请记得对应用进行训练。 请不要在一次更改后对应用进行训练。

    备注

    此过程演示如何从“意向详细信息”页中的示例言语创建和标记列表实体。 还可以从“实体”页创建相同的实体。

为实体添加角色

角色是基于上下文的实体命名子类型。

添加角色以区分不同的上下文

在下面的言语中,有两个位置是由其各自周围的字词(如 tofrom)在语义上进行了指定:

Pick up the package from Seattle and deliver to New York City.

在此过程中,将 origindestination 角色添加到预生成的 geographyV2 实体。

  1. 登录到 LUIS 门户,选择“订阅”和“创作资源”以查看分配给该创作资源的应用。

  2. 在“我的应用”页上选择应用名称以打开应用。

  3. 在“生成”部分的左侧面板中选择“实体” 。

  4. 选择“+ 添加预生成的实体”。 依次选择“geographyV2”、“完成” 。 这会将预生成的实体添加到应用。

    如果发现模式在包含 Pattern.any 时错误提取实体,请使用显式列表来更正此问题。

  5. 从实体的“实体”页列表中选择新添加的预生成的 geographyV2实体。

  6. 要添加新角色,请选择“未添加角色”旁边的 + 。

  7. 在“类型角色…”文本框中,输入角色 Origin 的名称并按 Enter。 添加 Destination 的第二个角色名称然后按 Enter。

    将 Origin 角色添加到 Location 实体的屏幕截图

    该角色将添加到预生成的实体中,但不会添加到使用该实体的任何言语中。

在示例言语中使用角色来标记文本

提示

可以通过使用某个机器学习实体的子实体来进行标记的方式来替换角色。

  1. 登录到 LUIS 门户,选择“订阅”和“创作资源”以查看分配给该创作资源的应用。

  2. 在“我的应用”页上选择应用名称以打开应用。

  3. 转到“意向详细信息”页,其中包含使用该角色的示例言语。

  4. 若要使用角色进行标记,请在示例语句中选择实体标签(文本下的实线),然后从下拉列表中选择“在实体窗格中查看”。

    屏幕截图显示了已选中“在实体窗格中查看”菜单项。

    实体面板将在右侧打开。

  5. 选择实体,然后转到面板底部并选择角色。

    屏幕截图显示了选择角色的位置。

创建 pattern.any 实体

Pattern.any 实体仅适用于模式模式

不要更改实体类型

LUIS 不允许更改实体类型,因为它不知道构造该实体要添加或删除的内容。 若要更改类型,最好创建一个名称稍微不同的、类型正确的新实体。 实体创建后,在每句话语中,删除旧标记实体名称并添加新的实体名称。 重新标记所有话语后,即可删除旧实体。

后续步骤

了解有关以下方面的详细信息: