kll_sketch_agg_bigint 聚合函数

适用于:勾选为是 Databricks Runtime 18.0 及更高版本

创建一个 KLL(K-Linear-Logarithmic)草图,用于对整数数据进行具有可配置准确性的近似分位估计。

Syntax

kll_sketch_agg_bigint ( expr [, k] )

Arguments

  • expr:要聚合的整型数值表达式。
  • k:用于控制草图准确性的可选 INTEGER 字面值。 必须介于 8 到 65535 之间。 默认值为 200。 较高的值可提供更好的准确性,但使用更多内存。

退货

包含 BINARY 整数数据的序列化 KLL 草图的值。

注释

  • NULL 在聚合期间忽略 expr 中的值。
  • 提供了约 99% 置信度的近似分位数的草图。
  • 草图是可合并的,允许分布式聚合。
  • 无论输入大小如何,内存使用量大约都是 O(k) 项。

例子

-- Create sketch with default k=200
> SELECT kll_sketch_agg_bigint(value) FROM VALUES (1), (2), (3), (4), (5) AS T(value)
  [binary data]

-- Create sketch with custom k=400 for higher accuracy
> SELECT kll_sketch_agg_bigint(value, 400) FROM VALUES (10), (20), (30) AS T(value)
  [binary data]