使用同义词改善响应质量

在本教程中,你将了解如何执行以下操作:

  • 添加同义词以提高响应质量
  • 通过“测试”窗格的“检查”选项来评估响应质量

本教程将向你演示如何通过使用同义词来改善响应质量。 假设用户在使用某个单词的替代形式、同义词或首字母缩写词进行查询时,未能获得准确的响应。 因此,用户决定通过使用创作 API 为关键字添加同义词来改善响应质量。

使用创作 API 添加同义词

接下来,我们将添加以下单词及其替代词来改善响应结果:

Word 替代词
修复问题 troubleshootdiagnostic
白板 white boardwhite canvas
蓝牙 blue toothBT
{
    "synonyms": [
        {
            "alterations": [
                "fix problems",
                "troubleshoot",
                "diagnostic",
                ]
        },
        {
            "alterations": [
                "whiteboard",
                "white board",
                "white canvas"
            ]
        },
        {
            "alterations": [
                "bluetooth",
                "blue tooth",
                "BT"
            ]
        }
    ]
}

对于“修复 Surface 触控笔问题”问题和答案对,我们将使用其同义词“故障排除”进行的查询的响应作了比较。

添加同义词之前的响应

Screenshot with confidence score of .74 highlighted in red

添加同义词之后的响应

Screenshot with a confidence score of .97 highlighted in red

如你所见,在未将 troubleshoot 添加为同义词时,“如何对你的 Surface 触控笔进行故障排除”这一查询获得的响应置信度较低。 但是,在将 troubleshoot 添加为“修复问题”的同义词后,我们获得了对该查询的正确响应,置信度评分也更高。 添加这些同义词后提高了查询结果的相关性,因此改善了用户体验。

重要

同义词不区分大小写。 如果将停用词添加为同义词,同义词可能不起作用。 你可在此处找到停用字词列表:停用字词列表。 例如,如果添加“信息技术”的缩写词“IT”,系统可能无法识别“信息技术”一词,因为“IT”是一个停用词,系统在处理查询时会将其排除在外。

备注

  • 可以按任意顺序添加同义词。 任何计算逻辑中都不会考虑排序。
  • 同义词只能添加到至少有一个问答对的项目中。
  • 仅当项目中存在至少一个问答对时,才能添加同义词。
  • 如果在 2 组更改之间重叠同义词,则可能会产生意外结果,并且不建议使用重叠的组。
  • 同义词不允许使用特殊字符。 “COVID-19”等带连字符的单词会视为与“COVID 19”相同,并且“空格”可用作词条分隔符。 以下是不允许的特殊字符列表:
特殊字符 符号
逗号 ,
问号
冒号 解码的字符:
分号 ;
双引号 "
单引号
左圆括号 (
右圆括号 )
左大括号 {
右大括号 }
左方括号 [
右方括号 ]
连字符/短划线 -
正号 +
周期
西文斜杠 /
感叹号 !
星号 *
下划线 _
& 号 @
哈希 #

后续步骤