window 分组表达式

适用于:check marked yes Databricks SQL check marked yes Databricks Runtime

通过 timestamp 表达式创建基于跳跃的滑动窗口。

语法

window(expr, width [, slide [, start] ] )

参数

  • expr:一个 TIMESTAMP 表达式,用于指定窗口的主题。
  • width:一个 STRING 字面量,它将窗口宽度表示为 INTERVAL DAY TO SECOND 字面量。
  • start:一个可选的 STRING 字面量,代表下一窗口的起始时间(以 INTERVAL DAY TO SECOND 字面量表示)。
  • slide:一个可选的 STRING 字面量,代表从午夜到起始时间的偏移量(以 INTERVAL HOUR TO SECOND 字面量表示)。

返回

返回可以使用聚合函数对其执行操作的分组集。 GROUP BY 列名为 window。 它的类型为 STRUCT<start:TIMESTAMP, end:TIMESTAMP>

slide 必须小于或等于 widthstart 必须小于 slide

如果 slide<width,则每个组中的行会重叠。 默认情况下,slide 等于 width,因此 expr 将分区到组中。 窗口从 1970-01-01 00:00:00 UTC + start 开始。 start 的默认值为 '0 SECONDS''

示例

> SELECT window, min(val), max(val), count(val)
  FROM VALUES (TIMESTAMP'2020-08-01 12:20:21', 17),
              (TIMESTAMP'2020-08-01 12:20:22', 12),
              (TIMESTAMP'2020-08-01 12:23:10',  8),
              (TIMESTAMP'2020-08-01 12:25:05', 11),
              (TIMESTAMP'2020-08-01 12:28:59', 15),
              (TIMESTAMP'2020-08-01 12:30:01', 23),
              (TIMESTAMP'2020-08-01 12:30:15',  2),
              (TIMESTAMP'2020-08-01 12:35:22', 16) AS S(stamp, val)
  GROUP BY window(stamp, '2 MINUTES 30 SECONDS', '30 SECONDS', '15 SECONDS');
  {2020-08-01 12:19:15, 2020-08-01 12:21:45} 12       17       2
  {2020-08-01 12:18:15, 2020-08-01 12:20:45} 12       17       2
  {2020-08-01 12:20:15, 2020-08-01 12:22:45} 12       17       2
  {2020-08-01 12:19:45, 2020-08-01 12:22:15} 12       17       2
  {2020-08-01 12:18:45, 2020-08-01 12:21:15} 12       17       2
  {2020-08-01 12:21:45, 2020-08-01 12:24:15} 8        8        1
  {2020-08-01 12:22:45, 2020-08-01 12:25:15} 8        11       2
  {2020-08-01 12:21:15, 2020-08-01 12:23:45} 8        8        1
  {2020-08-01 12:22:15, 2020-08-01 12:24:45} 8        8        1
  {2020-08-01 12:20:45, 2020-08-01 12:23:15} 8        8        1
  {2020-08-01 12:23:45, 2020-08-01 12:26:15} 11       11       1
  {2020-08-01 12:23:15, 2020-08-01 12:25:45} 11       11       1
  {2020-08-01 12:24:45, 2020-08-01 12:27:15} 11       11       1
  {2020-08-01 12:24:15, 2020-08-01 12:26:45} 11       11       1
  {2020-08-01 12:27:15, 2020-08-01 12:29:45} 15       15       1
  {2020-08-01 12:27:45, 2020-08-01 12:30:15} 15       23       2
  {2020-08-01 12:28:45, 2020-08-01 12:31:15} 2        23       3
  {2020-08-01 12:26:45, 2020-08-01 12:29:15} 15       15       1
  {2020-08-01 12:28:15, 2020-08-01 12:30:45} 2        23       3
  {2020-08-01 12:29:45, 2020-08-01 12:32:15} 2        23       2