regexp_extract_all 函数

适用于:Databricks SQL check marked yes Databricks Runtime

提取 str 中与 regexp 表达式匹配的、对应于 regex 组索引的所有字符串。

语法

regexp_extract_all(str, regexp [, idx] )

参数

  • str:匹配的 STRING 表达式。
  • regexp:具有匹配模式的 STRING 表达式。
  • idx:大于或等于 0 的可选整数表达式,默认值为 1。

返回

ARRAY<STRING>

字符串 regexp 必须是 Java 正则表达式。

使用文本时,请使用raw-literalr 前缀)来避免转义字符预处理。

regexp 可以包含多个组。 idx 指示要提取的正则表达式组。 如果 idx 为 0,则表示匹配整个正则表达式。

示例

> SELECT regexp_extract_all('100-200, 300-400', '(\\d+)-(\\d+)', 1);
 [100, 300]