使用同义词提高响应质量

本教程中,您将学习如何:

  • 添加同义词以提高响应质量
  • 通过“测试”窗格的“检查”选项评估响应质量

本教程介绍如何使用同义词提高响应的质量。 假设用户在使用单词的不同形式、同义词或首字母缩略词时,没有获得准确的查询响应。 因此,他们决定通过使用 Authoring API 添加关键字的同义词来提高响应的质量。

使用内容创作 API 添加同义词

通过添加以下字词及其变体来优化结果:

单词 Alterations
修复问题 troubleshootdiagnostic
白板 white boardwhite canvas
蓝牙 blue toothBT
{
    "synonyms": [
        {
            "alterations": [
                "fix problems",
                "troubleshoot",
                "diagnostic",
                ]
        },
        {
            "alterations": [
                "whiteboard",
                "white board",
                "white canvas"
            ]
        },
        {
            "alterations": [
                "bluetooth",
                "blue tooth",
                "BT"
            ]
        }
    ]
}

对于“修复 Surface 触控笔的问题”这一问答对,我们比较了使用其同义词“疑难解答”进行查询时得到的响应。

在添加同义词之前的响应

添加同义词后的响应

正如你所看到的,当troubleshoot 未被添加为同义词时,我们对查询“如何对 Surface 触控笔进行故障排除”的置信度很低。 但是,在添加 troubleshoot 为“修复问题”的同义词后,我们收到了对查询的正确响应,其置信度分数更高。 添加这些同义词后,将改进结果的相关性。

重要

同义词不区分大小写。 将停用词添加为同义词时,同义词也可能无法按预期工作。 可在此处找到停用词列表:停用词列表。 例如,如果为信息技术添加缩写 IT ,则系统可能无法识别信息技术,因为 IT 是一个停止词,在处理查询时会进行筛选。

注释

  • 可以按任意顺序添加同义词。 排序在任何计算逻辑中都不考虑。
  • 同义词只能添加到至少有一个问答对的项目中。
  • 仅当项目中至少有一个问题和答案对存在时,才能添加同义词。
  • 在两组更改之间重叠同义词时,可能会产生意外的结果,不建议使用重叠集。
  • 同义词不允许使用特殊字符。 对于“COVID-19”等连字符,它们被视为“COVID 19”,“空格”可用作术语分隔符。 下面是 不允许的特殊字符列表:
特殊字符 符号
逗号 ,
问号 ?
结肠 :
分号 ;
双引号 "
单引号
左括号 (
右括号 )
打开大括号 { }
关闭大括号 }
左括号 [
右括号 ]
连字符/短划线 -
加号 +
期限 .
正斜杠 /
感叹号 !
星号 *
下划线 _
与号 @
哈希 #

后续步骤