适用于:
Databricks Runtime 18.0 及更高版本
创建一个 KLL(K-Linear-Logarithmic)草图,用于对整数数据进行具有可配置准确性的近似分位估计。
Syntax
kll_sketch_agg_bigint ( expr [, k] )
Arguments
-
expr:要聚合的整型数值表达式。 -
k:用于控制草图准确性的可选INTEGER字面值。 必须介于 8 到 65535 之间。 默认值为 200。 较高的值可提供更好的准确性,但使用更多内存。
退货
包含 BINARY 整数数据的序列化 KLL 草图的值。
注释
-
NULL在聚合期间忽略 expr 中的值。 - 提供了约 99% 置信度的近似分位数的草图。
- 草图是可合并的,允许分布式聚合。
- 无论输入大小如何,内存使用量大约都是 O(k) 项。
例子
-- Create sketch with default k=200
> SELECT kll_sketch_agg_bigint(value) FROM VALUES (1), (2), (3), (4), (5) AS T(value)
[binary data]
-- Create sketch with custom k=400 for higher accuracy
> SELECT kll_sketch_agg_bigint(value, 400) FROM VALUES (10), (20), (30) AS T(value)
[binary data]