Выбор и сопоставление данных тестирования модели

Чтобы создать диаграмму точности в службах Analysis Services, необходимо выбрать данные, которые будут использоваться для тестирования модели, и сопоставить данные с моделью.

По умолчанию службы Analysis Services будут использовать данные для тестирования модели интеллектуального анализа данных, если вы создали отложенный набор данных при создании структуры интеллектуального анализа данных. Создание тестового контрольного набора данных — это самый простой способ тестирования моделей, основанных на той же структуре интеллектуального анализа данных, так как имена столбцов и типы данных всегда будут соответствовать модели, и вы можете быть достаточно уверены, что наблюдается сходное распределение данных. Кроме того, конструктор автоматически создаст связи между входными и модельными столбцами.

Кроме того, можно указать внешний источник данных. Для внешних данных существуют некоторые дополнительные требования:

  • Внешний набор данных должен быть определен как представление источника данных в экземпляре служб Microsoft Analysis Services.

  • Внешний набор данных должен содержать по крайней мере один столбец, который можно сопоставить с прогнозируемым столбцом в модели интеллектуального анализа данных. Вы можете игнорировать некоторые столбцы.

  • Нельзя добавлять новые столбцы или столбцы карты в другое представление источника данных. Выбранное представление источника данных должно содержать все столбцы, необходимые для прогнозирующего запроса.

  • Если имена внешних столбцов точно соответствуют именам в модели, конструктор автоматически сопоставит их для вас. Если сопоставления неверны, их можно изменить или удалить и создать новые сопоставления для существующих столбцов.

  • При использовании внешнего источника данных можно применить фильтры, чтобы ограничить тестовые данные соответствующим подмножеством вариантов.

  • Даже если вы используете отложенный тестовый набор, следует иметь в виду, что фильтры могут вызывать различия между данными тестирования, связанными со структурой данных майнинга и тестовыми случаями модели майнинга.

В этом разделе описывается, как выбрать и сопоставить данные тестирования:

Выберите входные таблицы, чтобы проверить точность модели интеллектуального анализа данных

Сопоставление столбцов модели со столбцами в данных тестирования

Изменение способа сопоставлений столбцов в тестовых данных с моделью

Для выбора входных таблиц для проверки точности модели интеллектуального анализа данных

  1. В конструкторе интеллектуального анализа данных в SQL Server Data Tools (SSDT) дважды щелкните на структуре, содержащей модели, которые вы хотите отобразить на диаграмме.

  2. Перейдите на вкладку Диаграмма точности анализа данных.

  3. На вкладке выбора входных данных в представлении диаграммы точности анализа данных выберите один из следующих вариантов:

    Использование тестовых случаев модели анализа данных

    Используйте тестовые случаи для структуры добычи данных

    Указание другого набора данных

  4. Если вы выбрали Указать другой набор данных, при необходимости можно щелкнуть Открыть редактор фильтров, чтобы создать условия фильтра для входного набора данных. Нажмите кнопку ОК.

  5. Щелкните вкладку "Диаграмма лифта " или вкладку "Матрица классификации ", чтобы автоматически создать диаграмму с помощью указанных данных тестирования.

Сопоставление столбцов модели со столбцами в данных тестирования

  1. Дважды щелкните структуру интеллектуального анализа данных, содержащую модели, которые вы хотите диаграммировать, чтобы открыть структуру и модели в конструкторе интеллектуального анализа данных.

  2. Перейдите на вкладку "Диаграмма точности майнинга", а затем на вкладку "Выбор данных".

  3. На вкладке "Выбор входных данных" в разделе "Выбор набора данных", который будет использоваться для диаграммы точности, выберите " Указать другой набор данных".

  4. Нажмите кнопку "Обзор" (...), чтобы открыть диалоговое окно и создать определение внешнего набора данных.

  5. В диалоговом окне "Выбор структуры интеллектуального анализа данных " выберите структуру интеллектуального анализа данных, содержащую модели, с которыми вы хотите работать, и нажмите кнопку "ОК".

  6. На таблице "Выбор входных таблиц" вкладки "График точности анализа данных" щелкните "Выбор таблицы случаев", чтобы открыть диалоговое окно "Выбор таблицы".

  7. В диалоговом окне "Выбор таблицы " выберите источник данных из списка источников данных . Выберите таблицу, содержащую данные, которые вы хотите использовать в прогнозирующих запросах, чтобы определить точность моделей.

  8. В поле "Имя таблицы или представления" выберите таблицу, содержащую данные, которые необходимо использовать для тестирования моделей.

  9. При необходимости измените сопоставления. Столбцы в структуре майнинга автоматически сопоставляются со столбцами с тем же именем во входной таблице. Чтобы вручную создать сопоставления, щелкните столбец в таблице "Выбор входных таблиц" и перетащите его в соответствующий столбец в таблице "Структура анализа данных". Чтобы удалить сопоставление, щелкните на линии, которая связывает столбец в таблице структуры анализа данных с сопоставленным столбцом в таблице Выбор входных таблиц, а затем нажмите клавишу DELETE.

  10. Нажмите кнопку ОК.

Изменение способа сопоставление входных данных с моделью

  1. В конструкторе интеллектуального анализа данных дважды щелкните структуру, содержащую модели, которые вы хотите отобразить на диаграмме.

  2. Перейдите на вкладку "Диаграмма точности извлечения данных".

  3. Перейдите на вкладку "Выбор ввода ".

  4. В разделе "Выбор набора данных", который будет использоваться для диаграммы точности, выберите параметр "Указать другой набор данных".

  5. Нажмите кнопку просмотра (...), чтобы открыть диалоговое окно и создать определение внешнего источника данных.

  6. В диалоговом окне «Указание сопоставления столбцов» нажмите кнопку «Выбрать таблицу случаев».

  7. В диалоговом окне "Выбор таблицы" выберите представление источника данных из списка и выберите таблицу, содержащую данные дела. Нажмите кнопку ОК.

  8. Если нужные таблицы недоступны, закройте диалоговое окно и создайте новое представление источника данных, содержащее таблицу. Сведения о создании представления источника данных см. в разделе "Определение представления источника данных" (службы Analysis Services).

  9. Если модель интеллектуального анализа данных содержит вложенную таблицу, щелкните "Выбрать вложенную таблицу" и выберите вложенную таблицу из списка таблиц в представлении источника данных. Нажмите кнопку ОК.

  10. Выберите строку соединения сопоставления, которую вы хотите изменить, и выберите Изменить подключения.

    Откроется диалоговое окно «Изменение сопоставления». В таблице в этом диалоговом окне столбец структуры интеллектуального анализа данных перечисляет каждый столбец, содержащий выбранную структуру интеллектуального анализа данных, и столбец таблицы содержит столбцы из входных таблиц, сопоставленных со столбцами в структуре интеллектуального анализа данных.

  11. В столбце таблицы выберите строку, которая соответствует строке в столбце структуры интеллектуального анализа данных, для которой вы хотите изменить связь. Выберите новый столбец из списка или выберите пустую запись из списка, чтобы удалить столбец.

  12. Нажмите кнопку ОК.

    Новые сопоставления столбцов отображаются в диалоговом окне "Указание сопоставления столбцов ". Сопоставление можно удалить, выбрав линию между столбцами и нажав клавишу DELETE. Вы можете создать новое подключение, выбрав столбец в таблице структуры интеллектуального анализа данных и перетащив его в соответствующий столбец в таблице Выбрать таблицу(ы) ввода.

См. также

Задачи тестирования, валидации и инструкции (интеллектуальный анализ данных)