levenshtein 函数

适用于: 勾选“是” Databricks SQL 勾选“是” Databricks Runtime

返回字符串 str1str2 之间的编辑距离。

语法

levenshtein(str1, str2 [, maxDistance])

参数

  • str1:一个 STRING 表达式。

  • str2:一个 STRING 表达式。

  • maxDistance:可选 INTEGER 表达式限制了所考虑的最大 Levenshtein 距离。 默认值无限制。

    适用于: 勾选“是” Databricks SQL 勾选“是” Databricks Runtime 13.3 LTS 及更高版本

返回

INTEGER。 如果 maxDistance 小于两个字符串之间的距离,则函数返回 -1。 如果 maxDistance 为负,则函数返回 -1。

示例

> SELECT levenshtein('kitten', 'sitting');
 3

> SELECT levenshtein('kitten', 'sitting', 2);
 -1

> SELECT levenshtein('kitten', 'sitting', 4);
 3