Delen via


kll_sketch_merge_bigint functie

Van toepassing op:aangevinkt ja Databricks Runtime 18.0 en hoger

Hiermee worden twee compatibele KLL-schetsen samengevoegd tot één schets.

Syntaxis

kll_sketch_merge_bigint ( sketch1, sketch2 )

Arguments

  • sketch1: Een BINARY uitdrukking bevat een geserialiseerde integer KLL-schets.
  • sketch2: Een BINARY uitdrukking bevat een geserialiseerde integer KLL-schets.

Retouren

Een BINARY waarde met de samengevoegde schets.

Opmerkingen

  • Beide schetsen moeten voor hetzelfde gegevenstype (geheel getal) zijn.
  • De samengevoegde schets heeft dezelfde k-parameter als de invoerschetsen.
  • Schetsen met verschillende k-waarden kunnen niet worden samengevoegd.
  • Handig voor gedistribueerde aggregatie: schetsen per partitie maken en vervolgens samenvoegen.

Voorbeelden

-- Merge sketches from different data partitions
-- Use merged sketch for quantile estimation across all data
> WITH partition1 AS (
    SELECT kll_sketch_agg_bigint(value) AS sketch FROM VALUES (1), (2) AS T(value)
  ),
  partition2 AS (
    SELECT kll_sketch_agg_bigint(value) AS sketch FROM VALUES (3), (4) AS T(value)
  ),
  merged AS (
    SELECT kll_sketch_merge_bigint(p1.sketch, p2.sketch) AS sketch
    FROM partition1 p1, partition2 p2
  )
  SELECT kll_sketch_get_quantile_bigint(sketch, 0.5) FROM merged
  2