返回单个列,该列包含所请求列的非重复值,且数目不超过指定数目。
运算符针对性能而不是公平性进行优化;结果可能存在严重偏差,不应用于任何需要统计准确性的用途。
语法
T| sample-distinctNumberOfValuesofColumnName
详细了解语法约定。
参数
| 客户 | 类型 | 必需 | 说明 |
|---|---|---|---|
| T | string |
✔️ | 输入表格表达式。 |
| NumberOfValues | int、long 或 real | ✔️ | 要返回的 T 的非重复值的数目。 可以指定任何数值表达式。 |
| ColumnName | string |
✔️ | 要从中采样的列的名称。 |
提示
- 使用 top-hitters 运算符获取排名靠前的值。
- 请参阅示例运算符以对数据行进行采样。
示例
本节中的示例演示如何使用语法帮助你入门。
本文中的示例使用 帮助群集中的公开可用表,例如
StormEvents数据库中的 表。
从总体获取 10 个非重复值
StormEvents | sample-distinct 10 of EpisodeId
输出
| EpisodeId |
|---|
| 11074 |
| 11078 |
| 11749 |
| 12554 |
| 12561 |
| 13183 |
| 11780 |
| 11781 |
| 12826 |
进一步计算示例值
let sampleEpisodes = StormEvents | sample-distinct 10 of EpisodeId;
StormEvents
| where EpisodeId in (sampleEpisodes)
| summarize totalInjuries=sum(InjuriesDirect) by EpisodeId
输出
| EpisodeId | totalInjuries |
|---|---|
| 11091 | 0 |
| 11074 | 0 |
| 11078 | 0 |
| 11749 | 0 |
| 12554 | 3 |
| 12561 | 0 |
| 13183 | 0 |
| 11780 | 0 |
| 11781 | 0 |
| 12826 | 0 |