kll_sketch_agg_double 聚合函数

适用于:勾选为是 Databricks Runtime 18.0 及更高版本

创建一个 KLL(K-Linear-Logarithmic)概略图,用于对具有可调节准确度的双精度浮点数据进行近似分位数估计。

Syntax

kll_sketch_agg_double ( expr [, k] )

Arguments

  • expr DOUBLE:要聚合的表达式。
  • k:用于控制草图准确性的可选 INTEGER 字面值。 必须介于 8 到 65535 之间。 默认值为 200。 较高的值可提供更好的准确性,但使用更多内存。

退货

包含用于DOUBLE数据的序列化KLL草图的BINARY值。

注释

  • NULL 在聚合期间忽略 expr 中的值。
  • NaN 值根据 IEEE 754 语义进行处理。
  • 提供了约 99% 置信度的近似分位数的草图。
  • 首选用于高精度分位数估算。

例子

-- Create sketch from double values
> SELECT kll_sketch_agg_double(measurement) FROM VALUES (1.23456), (2.34567) AS T(measurement)
  [binary data]