Дистрибутивы столбцов (интеллектуальный анализ данных)

В Службах Microsoft SQL Server Analysis Services можно задать распределения столбцов в структуре для интеллектуального анализа данных, чтобы влиять на обработку данных алгоритмами в этих столбцах при создании моделей интеллектуального анализа. Для некоторых алгоритмов рекомендуется определить распределение любых непрерывных столбцов перед обработкой модели, если столбцы, как известно, содержат общие распределения значений. Если распределения не определены, то результирующие модели интеллектуального анализа данных могут создавать менее точные прогнозы, чем если бы были определены распределения, так как алгоритмы будут иметь меньше информации, из которой следует интерпретировать данные.

Алгоритмы, доступные в службах Analysis Services, поддерживают следующие типы распределения:

Normal Значения для непрерывного столбца образуют гистограмму с нормальным распределением.

Гистограмма с нормальным распределением

Log Normal Значения для непрерывного столбца образуют гистограмму, где кривая вытягивается в верхнем конце и скошена к нижнему концу.

Гистограмма с логнормальным распределением

Uniform Значения для непрерывного столбца образуют ровную кривую, где все значения имеют одинаковую вероятность.

Гистограмма с однородным распределением

Дополнительные сведения об алгоритмах, предоставляемых службами Analysis Services, см. в разделе "Алгоритмы интеллектуального анализа данных" (службы Analysis Services — интеллектуальный анализ данных).

См. также

Типы контента (интеллектуальное анализ данных)Структуры интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)Методы дискретизации (дистрибутивы интеллектуального анализа данных(DMX)Mining Structure Column