count_distinct()(聚合函数)-(预览版)
计算每个摘要组的标量表达式指定的唯一值个数;如果省略摘要组,则计算唯一值总数。
Null 值将会忽略,不会纳入计算。
注意
此函数与 summarize 运算符结合使用。
如果只需要估算唯一值计数,建议使用资源消耗较少的 dcount
聚合函数。
若只对谓词返回 true
的记录进行计数,请使用 count_distinctif 聚合函数。
注意
- 此函数限制为 1 亿个唯一值。 尝试对返回太多值的表达式应用此函数会产生运行时错误 (HRESULT: 0x80DA0012)。
- 对来自不同群集的多个数据源进行操作时,函数性能可能会降级。
语法
count_distinct
(
expr)
详细了解语法约定。
参数
客户 | 类型 | 必需 | 说明 |
---|---|---|---|
expr | 标量 (scalar) | ✔️ | 要对其非重复值进行计数的表达式。 |
返回
长整型值,指示每个摘要组的 expr 的不重复值的数目。
示例
此示例显示了在每个州有多少种类型的风暴事件发生。
- 对来自不同群集的多个数据源进行操作时,函数性能可能会降级。
StormEvents
| summarize UniqueEvents=count_distinct(EventType) by State
| top 5 by UniqueEvents
输出
状态 | UniqueEvents |
---|---|
德克萨斯 | 27 |
CALIFORNIA | 26 |
宾夕法尼亚州 | 25 |
佐治亚州 | 24 |
NORTH CAROLINA | 23 |