Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Gäller för:
Databricks Runtime 18.1 och senare
Skapar en Datasketches TupleSketch från nyckel/värde-par där nycklar används för distinkt räkning och heltalssammanfattningsvärden aggregeras enligt det angivna läget.
Syntax
tuple_sketch_agg_integer ( key, summary [, lgNomEntries [, mode ]] )
Arguments
-
nyckel: Uttrycket för unik värderäkning. Godkända typer är
INTEGER,LONG,FLOAT,DOUBLE,STRING,BINARY,ARRAY<INTEGER>ochARRAY<LONG>. -
sammanfattning: Ett
INTEGERvärde som ska associeras med och aggregeras för varje nyckel. -
lgNomEntries: En valfri
INTEGERliteral som anger log-base-2 för nominella poster. Måste vara mellan 4 och 26, inklusive. Standardvärdet är 12 (4 096 bucketar). Högre värden ger bättre noggrannhet men använder mer minne. -
mode: En valfri
STRINGliteral som anger aggregeringsläget för sammanfattningar. Giltiga värden:'sum','min','max','alwaysone'. Standardvärdet är'sum'.
Retur
Ett BINARY värde som innehåller den serialiserade kompakta TupleSketch med heltalssammanfattningar.
Noteringar
-
NULLnyckel- eller sammanfattningsvärden ignoreras under aggregering. - Tomma strängar, tomma bytematriser och tomma matriser ignoreras för nycklar.
- Parametrarna
lgNomEntriesochmodemåste vara konstanta värden. - Använd tuple_sketch_estimate_integer för att hämta den distinkta uppskattningen av antalet.
- Använd tuple_sketch_summary_integer för att hämta det aggregerade sammanfattningsvärdet.
Felmeddelanden
Exempel
-- Create sketch and get distinct count estimate
> SELECT tuple_sketch_estimate_integer(tuple_sketch_agg_integer(key, summary)) FROM VALUES (1, 5), (1, 1), (2, 2), (2, 3), (3, 2) tab(key, summary);
3.0
-- Get aggregated summary (sum mode by default)
> SELECT tuple_sketch_summary_integer(tuple_sketch_agg_integer(key, summary)) FROM VALUES (1, 1), (1, 2), (2, 3) tab(key, summary);
6