window
分组表达式
适用于: Databricks SQL Databricks Runtime
通过 timestamp 表达式创建基于跳跃的滑动窗口。
语法
window(expr, width [, slide [, start] ] )
参数
expr
:一个TIMESTAMP
表达式,用于指定窗口的主题。width
:一个STRING
文本,用于将窗口的宽度表示为INTERVAL DAY TO SECOND
文本。slide
:一个可选STRING
文本,表示从午夜到开头的偏移量,表示为INTERVAL HOUR TO SECOND
文本。start
:一个可选STRING
文本,表示下一个时段的开头,表示为INTERVAL DAY TO SECOND
文本。
返回
返回可以使用聚合函数对其执行操作的分组集。
GROUP BY
列名称为 window
。 它的类型为 STRUCT<start TIMESTAMP, end TIMESTAMP>
slide
必须小于或等于 width
。
start
必须小于 slide
。
如果 slide
<width
,则每个组中的行会重叠。
默认情况下,slide
等于 width
,因此 expr
将分区到组中。
窗口从 1970-01-01 00:00:00 UTC + start
开始。 start
的默认值为 '0 SECONDS'
'
示例
> SELECT window, min(val), max(val), count(val)
FROM VALUES (TIMESTAMP'2020-08-01 12:20:21', 17),
(TIMESTAMP'2020-08-01 12:20:22', 12),
(TIMESTAMP'2020-08-01 12:23:10', 8),
(TIMESTAMP'2020-08-01 12:25:05', 11),
(TIMESTAMP'2020-08-01 12:28:59', 15),
(TIMESTAMP'2020-08-01 12:30:01', 23),
(TIMESTAMP'2020-08-01 12:30:15', 2),
(TIMESTAMP'2020-08-01 12:35:22', 16) AS S(stamp, val)
GROUP BY window(stamp, '2 MINUTES 30 SECONDS', '30 SECONDS', '15 SECONDS');
{2020-08-01 12:19:15, 2020-08-01 12:21:45} 12 17 2
{2020-08-01 12:18:15, 2020-08-01 12:20:45} 12 17 2
{2020-08-01 12:20:15, 2020-08-01 12:22:45} 12 17 2
{2020-08-01 12:19:45, 2020-08-01 12:22:15} 12 17 2
{2020-08-01 12:18:45, 2020-08-01 12:21:15} 12 17 2
{2020-08-01 12:21:45, 2020-08-01 12:24:15} 8 8 1
{2020-08-01 12:22:45, 2020-08-01 12:25:15} 8 11 2
{2020-08-01 12:21:15, 2020-08-01 12:23:45} 8 8 1
{2020-08-01 12:22:15, 2020-08-01 12:24:45} 8 8 1
{2020-08-01 12:20:45, 2020-08-01 12:23:15} 8 8 1
{2020-08-01 12:23:45, 2020-08-01 12:26:15} 11 11 1
{2020-08-01 12:23:15, 2020-08-01 12:25:45} 11 11 1
{2020-08-01 12:24:45, 2020-08-01 12:27:15} 11 11 1
{2020-08-01 12:24:15, 2020-08-01 12:26:45} 11 11 1
{2020-08-01 12:27:15, 2020-08-01 12:29:45} 15 15 1
{2020-08-01 12:27:45, 2020-08-01 12:30:15} 15 23 2
{2020-08-01 12:28:45, 2020-08-01 12:31:15} 2 23 3
{2020-08-01 12:26:45, 2020-08-01 12:29:15} 15 15 1
{2020-08-01 12:28:15, 2020-08-01 12:30:45} 2 23 3
{2020-08-01 12:29:45, 2020-08-01 12:32:15} 2 23 2