top-hitters 运算符

返回输入中最常用的非重复值或具有最大和的值的近似值。

注意

top-hitters 使用在输入数据较大时针对性能进行优化的近似算法。 近似值基于 Count-Min-Sketch 算法。

语法

T|top-hittersNumberOfValuesofValueExpression [ bySummingExpression ]

详细了解语法约定

参数

客户 类型​​ 必需 说明
T string 输入表格表达式。
NumberOfValues int、long 或 real ValueExpression 的非重复值的数目。
ValueExpression string 返回非重复值的输入表 T 上的表达式。
SummingExpression string 如果指定此项,则输入表 T 上的数值表达式,其每个 ValueExpression 非重复值的总和将建立要发出的值。 如果未指定,则改为使用 ValueExpression 的每个非重复值的计数。

备注

第一种语法(无 SummingExpression)在概念上等效于:

T|summarizeC``=``count()byValueExpression|topNumberOfValues by Cdesc

第二种语法(带有 SummingExpression)在概念上等效于:

T|summarizeS``=``sum(*SummingExpression*)byValueExpression|topNumberOfValues by Sdesc

示例

获取最频繁的项

下一个示例演示了如何查找前 5 大风暴类型。

StormEvents
| top-hitters 5 of EventType 

输出

EventType approximate_count_EventType
雷雨大风 13015
冰雹 12711
山洪 3688
Drought 3616
冬季天气 3349

获取排名最靠前的项(基于列值)

下一个示例演示了如何查找“Thunderstorm Wind”事件最多的州。

StormEvents
| where EventType == "Thunderstorm Wind"
| top-hitters 10 of State 

输出

状态 approximate_sum_State
德克萨斯 830
佐治亚州 609
密歇根州 602
衣阿华州 585
宾夕法尼亚州 549
ILLINOIS 533
NEW YORK 502
弗吉尼亚州 482
KANSAS 476
俄亥俄州 455