SystemGetClusterCrossValidationResults (службы Analysis Services — интеллектуальный анализ данных)

Выполняет секционирование структуры интеллектуального анализа данных на заданное количество перекрестных разделов, обучает модель по каждой секции, а затем возвращает метрики точности для каждой секции.

Примечание.   Эта хранимая процедура может использоваться только со структурой интеллектуального анализа, содержащей, по крайней мере, одну модель кластеризации. Для перекрестной проверки некластеризованных моделей используется SystemGetCrossValidationResults (службы Analysis Services — интеллектуальный анализ данных).

Синтаксис

SystemGetClusterCrossValidationResults(
<structure name>, 
[,<mining model list>]
,<fold count>}
,<max cases>
<test list>])

Arguments

  • mining structure
    Имя структуры интеллектуального анализа данных в текущей базе данных.

    (обязательно).

  • mining model list
    Список моделей интеллектуального анализа данных для проверки с разделителями-запятыми.

    Если не указан список моделей интеллектуального анализа, перекрестная проверка выполняется в отношении всех моделей кластеризации, связанных с заданной структурой интеллектуального анализа.

    ПримечаниеПримечание

    Для перекрестной проверки моделей, не являющихся моделями кластеризации, необходимо использовать отдельную хранимую процедуру, SystemGetCrossValidationResults (службы Analysis Services — интеллектуальный анализ данных).

    (необязательно).

  • fold count
    Целое число, указывающее количество секций, на которое разделяется набор данных. Минимальное значение равно 2. Максимальное число сверток равно минимальному из следующих двух значений — maximum integer и количество вариантов.

    Каждая секция будет содержать примерно следующее количество вариантов: max cases/fold count.

    Значение по умолчанию отсутствует.

    ПримечаниеПримечание

    Количество сверток значительно увеличивает время, необходимое для перекрестной проверки. Если выбрать слишком большое количество, запрос может выполняться очень долго, а в некоторых случаях сервер может стать недоступным или превысить лимит времени ожидания.

    (обязательно).

  • max cases
    Целое число, определяющее максимальное количество вариантов, которые можно проверять.

    Значение 0 показывает, что будут использоваться все варианты в источнике данных.

    Если указано число, превышающее фактическое количество вариантов в наборе данных, будут использоваться все варианты в наборе данных.

    (обязательно).

  • test list
    Строка, указывающая параметры тестирования.

    Примечание. Этот параметр зарезервирован для использования в будущем.

    (необязательно).

Тип возвращаемых данных:

Таблица возвращаемых типов содержит оценки каждой отдельной секции и статистических функций для всех моделей.

В следующей таблице приводятся описания возвращаемых столбцов.

Имя столбца

Description

ModelName

Имя протестированной модели.

AttributeName

Имя прогнозируемого столбца. Для кластерных моделей всегда имеет значение null.

AttributeState

Заданное целевое значение в прогнозируемом столбце. Для кластерных моделей всегда имеет значение null.

PartitionIndex

Начинающийся с 1 индекс, определяющий, к какой секции применяются результаты.

PartitionSize

Целое число, показывающее, сколько вариантов было включено в каждую секцию.

Проверить

Тип выполненного теста.

Measure

Имя меры, возвращенной тестом. Меры для каждой модели зависят от типа прогнозируемого значения. Определение каждой меры см. в разделе Перекрестная проверка (службы Analysis Services — интеллектуальный анализ данных).

Список мер, возвращаемых для каждого прогнозируемого типа см. в разделе Отчет перекрестной проверки (службы Analysis Services — интеллектуальный анализ данных).

Значение

Значение указанной проверочной меры.

Замечания

Для возвращения показателей точности для всего набора данных используется SystemGetClusterAccuracyResults (службы Analysis Services — интеллектуальный анализ данных).

Кроме того, если модель интеллектуального анализа данных уже секционирована на свертки, можно обойти обработку и возвратить только результаты перекрестной проверки с помощью SystemGetClusterAccuracyResults (службы Analysis Services — интеллектуальный анализ данных).

Примеры

В следующем примере показано секционирование структуры интеллектуального анализа для перекрестной проверки на три свертки и проверка двух моделей кластеризации, связанных с этой структурой интеллектуального анализа.

В третьей строке кода приведен список моделей интеллектуального анализа, предназначенных для проверки. Если не задать список, будут использоваться все модели кластеризации, связанные с этой структурой.

В четвертой строке кода задано количество сверток, а на пятой – максимальное число вариантов.

Поскольку это модели кластеризации, необязательно указывать прогнозируемый атрибут или значение.

CALL SystemGetClusterCrossValidationResults([v Target Mail],[Cluster 1], [Cluster 2],3,10000)

Образец результатов.

ModelName

AttributeName

AttributeState

PartitionIndex

PartitionSize

Проверить

Measure

Значение

Кластер 1

 

 

1

3025

Кластеризация

Вероятность варианта

0.930524511864121

Кластер 1

 

 

2

3025

Кластеризация

Вероятность варианта

0.919184178430778

Кластер 1

 

 

3

3024

Кластеризация

Вероятность варианта

0.929651120490248

Кластер 2

 

 

1

1289

Кластеризация

Вероятность варианта

0.922789726933607

Кластер 2

 

 

2

1288

Кластеризация

Вероятность варианта

0.934865535691068

Кластер 2

 

 

3

1288

Кластеризация

Вероятность варианта

0.924724595688798

Требования

Перекрестная проверка доступна только в выпуске SQL Server 2008 Enterprise.