basket 插件
适用于:✅Azure 数据资源管理器
basket
插件在数据中查找频繁出现的属性模式,并返回在该数据中传递频率阈值的模式。 模式表示在一个或多个列中具有相同值的一部分行。 basket
插件基于最初为篮分析数据挖掘而开发的 Apriori 算法。
语法
T | evaluate
basket
(
[ Threshold,
WeightColumn,
MaxDimensions,
CustomWildcard,
CustomWildcard,
... ])
详细了解语法约定。
参数
客户 | 类型 | 必需 | 说明 |
---|---|---|---|
阈值 | long |
0.015 到 1 范围内的 double ,用于设置被视为频繁的行最小比率。 不会返回比率更小的模式。 默认值为 0.05。 若要使用默认值,请输入波形符:~ 。示例: T | evaluate basket(0.02) |
|
WeightColumn | string |
列名,用于根据指定的权重考虑输入中的每一行。 必须是数字类型列的名称,例如 int 、long 、real 。 默认情况下,每一行的权重都是 1。 若要使用默认值,请输入波形符:~ 。 权重列的常见用法是对已嵌入每一行的数据进行采样或存储/聚合。示例: T | evaluate basket('~', sample_Count) |
|
MaxDimensions | int |
设置默认情况下受限制的每个 basket 不相关维度的最大数量,以最大程度地减少查询运行时。 默认值为 5。 若要使用默认值,请输入波形符:~ 。示例: T | evaluate basket('~', '~', 3) |
|
CustomWildcard | string |
为结果表中的特定类型设置通配符,表明当前模式对此列没有任何限制。 默认设置为 null ,默认值为空字符串的字符串列除外。 如果默认值是可行数据值,应使用其他通配符值,例如 * 。 若要使用默认值,请输入波形符:~ 。示例: T | evaluate basket('~', '~', '~', '*', int(-1), double(-1), long(0), datetime(1900-1-1)) |
注意
若要指定一个跟在可选参数之后的可选参数,请确保为前面的可选参数提供一个值。 有关详细信息,请参阅使用可选参数。
返回
basket
插件返回传递比率阈值的频繁出现的模式。 默认阈值为 0.05。
每种模式均由结果中的一行表示。 第一列是段 ID。 接下来的两列是来自与模式匹配的原始查询的计数和行百分比。 其余列与原始查询相关,其值是来自该列的特定值或表示变量值的通配符值(默认为 null)。
注意
该算法使用采样来确定初始的频繁出现的值。 因此,对于频率接近阈值的模式,多次运行的结果可能略有不同。
示例
StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2)
输出
段 ID | 计数 | 百分比 | 状态 | EventType | 损害 | 损害农作物 |
---|---|---|---|---|---|---|
0 | 4574 | 77.7 | 是 | 0 | ||
1 | 2278 | 38.7 | 冰雹 | 是 | 0 | |
2 | 5675 | 96.4 | 0 | |||
3 | 2371 | 40.3 | 冰雹 | 0 | ||
4 | 1279 | 21.7 | 雷雨大风 | 0 | ||
5 | 2468 | 41.9 | 冰雹 | |||
6 | 1310 | 22.3 | 是 | |||
7 | 1291 | 21.9 | 雷雨大风 |
使用自定义通配符的示例
StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2, '~', '~', '*', int(-1))
输出
段 ID | 计数 | 百分比 | 状态 | EventType | 损害 | 损害农作物 |
---|---|---|---|---|---|---|
0 | 4574 | 77.7 | * | * | 是 | 0 |
1 | 2278 | 38.7 | * | 冰雹 | 是 | 0 |
2 | 5675 | 96.4 | * | * | * | 0 |
3 | 2371 | 40.3 | * | 冰雹 | * | 0 |
4 | 1279 | 21.7 | * | 雷雨大风 | * | 0 |
5 | 2468 | 41.9 | * | 冰雹 | * | -1 |
6 | 1310 | 22.3 | * | * | 是 | -1 |
7 | 1291 | 21.9 | * | 雷雨大风 | * | -1 |