SystemGetClusterCrossValidationResults (службы Analysis Services — интеллектуальный анализ данных)

Применимо к: SQL Server 2019 и более ранних версий Analysis Services Azure Analysis Services Fabric/Power BI Premium

Это важно

Интеллектуальный анализ данных был признан устаревшим в службах SQL Server 2017 Analysis Services и теперь прекращён в службах SQL Server 2022 Analysis Services. Документация не обновляется для устаревших и прекращённых функций. Дополнительные сведения см. в статье о обратной совместимости служб Analysis Services.

Секционирует структуру интеллектуального анализа данных по указанному количеству перекрестных разделов, обучает модель для каждой секции, а затем возвращает метрики точности для каждой секции.

Примечание Эту хранимую процедуру можно использовать только с структурой интеллектуального анализа данных, содержащей по крайней мере одну модель кластеризации. Для перекрестной проверки моделей, отличных от кластеризации, необходимо использовать SystemGetCrossValidationResults (службы Analysis Services — интеллектуальный анализ данных).

Синтаксис

  
SystemGetClusterCrossValidationResults(  
<structure name>,   
[,<mining model list>]  
,<fold count>}  
,<max cases>  
<test list>])  

Arguments

Структура интеллектуального анализа данных
Имя структуры интеллектуального анализа данных в текущей базе данных.

(required)

Список моделей интеллектуального анализа данных
Разделенный запятыми список моделей интеллектуального анализа данных для проверки.

Если список моделей интеллектуального анализа данных не указан, перекрестная проверка выполняется для всех моделей кластеризации, связанных с указанной структурой.

Замечание

Для перекрестной проверки моделей, которые не являются моделями кластеризации, необходимо использовать отдельную хранимую процедуру SystemGetCrossValidationResults (службы Analysis Services — интеллектуальный анализ данных).

(необязательно).

количество сверток
Целое число, указывающее количество секций, в которые следует разделить набор данных. Минимальное значение — 2. Максимальное число сверток — максимальное целое число или число случаев, в зависимости от того, что меньше.

Каждая секция будет содержать примерно это число случаев: максимальное число случаев/свертывания.

Значения по умолчанию нет.

Замечание

Количество сверток значительно влияет на время, необходимое для перекрестной проверки. Если выбрать слишком большое число, запрос может выполняться в течение очень длительного времени, и в некоторых случаях сервер может перестать отвечать или истекать.

(required)

максимальное число случаев
Целое число, указывающее максимальное количество случаев, которые можно протестировать.

Значение 0 указывает, что будут использоваться все варианты в источнике данных.

Если указать число, превышающее фактическое число случаев в наборе данных, будут использоваться все случаи в источнике данных.

(required)

список тестов
Строка, указывающая параметры тестирования.

Примечание Этот параметр зарезервирован для дальнейшего использования.

(необязательно).

Тип возвращаемых данных

Таблица возвращаемого типа содержит оценки для каждой отдельной секции и агрегатов для всех моделей.

В следующей таблице описаны возвращаемые столбцы.

Имя столбца Description
НазваниеМодели Имя протестированной модели.
ИмяАтрибута Имя прогнозируемого столбца. Для моделей кластера всегда имеет значение NULL.
AttributeState Указанное целевое значение в прогнозируемом столбце. Для моделей кластера всегда имеет значение NULL.
PartitionIndex 1-й индекс, определяющий, к какой секции применяются результаты.
Размер раздела Целое число, указывающее, сколько случаев было включено в каждую секцию.
Test Тип выполняемого теста.
Мера Имя меры, возвращаемой тестом. Меры для каждой модели зависят от типа прогнозируемого значения. Определение каждой меры см. в разделе " Перекрестная проверка" (службы Analysis Services — интеллектуальный анализ данных).

Список мер, возвращаемых для каждого прогнозируемого типа, см. в разделе "Меры" в отчете о перекрестной проверке.
Ценность Значение указанной тестовой меры.

Замечания

Чтобы вернуть метрики точности для всего набора данных, используйте SystemGetClusterAccuracyResults (службы Analysis Services — интеллектуальный анализ данных).

Кроме того, если модель интеллектуального анализа данных уже секционирована по сверткам, можно обойти обработку и вернуть только результаты перекрестной проверки с помощью SystemGetClusterAccuracyResults (службы Analysis Services — интеллектуальный анализ данных).

Примеры

В следующем примере показано, как разделить структуру интеллектуального анализа данных на три свертывания, а затем протестировать две модели кластеризации, связанные со структурой интеллектуального анализа данных.

В трех строках кода перечислены определенные модели интеллектуального анализа данных, которые требуется протестировать. Если список не указан, используются все модели кластеризации, связанные со структурой.

Строка четыре из кода указывает количество сверток, а строка пять — максимальное количество вариантов использования.

Так как это модели кластеризации, вам не нужно указывать прогнозируемый атрибут или значение.

CALL SystemGetClusterCrossValidationResults(  
[v Target Mail],  
[Cluster 1], [Cluster 2],  
3,  
10000  
)  

Пример результатов:

НазваниеМодели ИмяАтрибута AttributeState PartitionIndex Размер раздела Test Мера Ценность
Кластер 1 1 3025 Clustering Вероятность регистра 0.930524511864121
Кластер 1 2 3025 Clustering Вероятность регистра 0.919184178430778
Кластер 1 3 3024 Clustering Вероятность регистра 0.929651120490248
Кластер 2 1 1289 Clustering Вероятность регистра 0.922789726933607
Кластер 2 2 1288 Clustering Вероятность регистра 0.934865535691068
Кластер 2 3 1288 Clustering Вероятность регистра 0.924724595688798

Требования

Перекрестная проверка доступна только в SQL Server Enterprise, начиная с SQL Server 2008.

См. также

SystemGetCrossValidationResults (службы Analysis Services — интеллектуальный анализ данных)
SystemGetAccuracyResults (службы Analysis Services — интеллектуальный анализ данных)
SystemGetClusterCrossValidationResults
SystemGetClusterAccuracyResults (службы Analysis Services — интеллектуальный анализ данных)