levenshtein 函数

适用于:check marked yes Databricks SQL check marked yes Databricks Runtime

返回字符串 str1str2 之间的编辑距离。

语法

levenshtein(str1, str2 [, maxDistance])

参数

  • str1:一个 STRING 表达式。

  • str2:一个 STRING 表达式。

  • maxDistance:可选 INTEGER 表达式限制了所考虑的最大 Levenshtein 距离。 默认值无限制。

    适用于:check marked yes Databricks SQL check marked yes Databricks Runtime 13.2 及更高版本

返回

INTEGER。 如果 maxDistance 小于两个字符串之间的距离,则函数返回 -1。 如果 maxDistance 为负,则函数返回 -1。

示例

> SELECT levenshtein('kitten', 'sitting');
 3

> SELECT levenshtein('kitten', 'sitting', 2);
 -1

> SELECT levenshtein('kitten', 'sitting', 4);
 3