Требования к обработке и рекомендации (интеллектуальный анализ данных)

В этом разделе описываются некоторые технические рекомендации, которые следует учитывать при обработке объектов интеллектуального анализа данных. Общие сведения о том, что такое обработка и как она применяется к интеллектуальному анализу данных, см. в разделе "Обработка объектов интеллектуального анализа данных".

Запросы к реляционному хранилищу

Обработка структур интеллектуального анализа данных

Обработка моделей интеллектуального анализа данных

Запросы к реляционному хранилищу во время обработки

Для интеллектуального анализа данных существует три этапа обработки: запрос исходных данных, определение необработанной статистики и использование определения модели и алгоритма для обучения модели интеллектуального анализа данных.

Сервер служб Analysis Services выдает запросы к базе данных, предоставляющей необработанные данные. Эта база данных может быть экземпляром SQL Server 2014 или более ранней версией ядра СУБД SQL Server. При обработке структуры анализа данных исходные данные передаются в структуру анализа и сохраняются на диске в новом сжатом формате. Не каждый столбец в источнике данных обрабатывается: только столбцы, включенные в структуру интеллектуального анализа данных, как определено привязками.

С помощью этих данных службы Analysis Services создают индекс всех данных и дискретизированных столбцов и создают отдельный индекс для непрерывных столбцов. Для создания индекса создается один запрос для каждой вложенной таблицы, а для обработки связей между каждой парой вложенной таблицы и таблицы регистра создается дополнительный запрос. Причиной создания нескольких запросов является обработка специального внутреннего многомерного хранилища данных. Можно ограничить количество запросов, которые службы Analysis Services отправляют в реляционное хранилище, задав свойство DatabaseConnectionPoolMaxсервера. Дополнительные сведения см. в разделе "Свойства OLAP".

При обработке модели модель не перечитывает данные из источника данных, а получает сводку данных из структуры интеллектуального анализа данных. С помощью созданного куба вместе с кэшированными индексом и данными о кейсах сервер создает независимые потоки для обучения моделей.

Дополнительные сведения о выпусках SQL Server, поддерживающих параллельную обработку моделей, см. в разделах "Функции, поддерживаемые выпусками SQL Server 2012 ( (https://go.microsoft.com/fwlink/?linkid=232473).

Обработка структур майнинга данных

Структура майнинга может обрабатываться вместе со всеми зависимыми моделями или отдельно. Обработка структуры данных отдельно от моделей может быть полезной, если ожидается, что обработка некоторых моделей займет много времени, и вы хотите отложить эту операцию.

Дополнительные сведения см. в разделе "Обработка структуры интеллектуального анализа данных".

Если вы заботитесь о сохранении места на жестком диске, обратите внимание, что службы анализа сохраняют кэши структур данных майнинга локально. То есть он записывает все обучающие данные на локальный жесткий диск. Если вы не хотите, чтобы данные кэшировались, можно изменить значение по умолчанию, установив для свойства MiningStructureCacheMode структуры интеллектуального анализа данных значение ClearAfterProcessing. Это приведет к уничтожению кэша после обработки моделей; однако также будет отключен сквозной доступ на структуру анализа данных. Дополнительные сведения см. в разделе «Запросы детализации» (интеллектуальный анализ данных).

Кроме того, если вы очистите кэш, вы не сможете использовать контрольную выборку, если она была определена, и определение разбиения тестового набора будет потеряно. Дополнительные сведения о наборах тестов на удержание см. в разделе "Обучение и тестирование наборов данных".

Обработка моделей майнинга

Модель можно обрабатывать отдельно от связанной структуры или обрабатывать все модели, основанные на этой структуре, вместе с самой структурой.

Дополнительные сведения см. в разделе "Обработка модели интеллектуального анализа данных".

Однако в SQL Server Data Tools (SSDT) и SQL Server Management Studio нельзя выбирать несколько моделей интеллектуального анализа данных для обработки вместе со структурой. Если вам нужно управлять обработкой моделей, необходимо выбрать их по отдельности или использовать XMLA или DMX для последовательной обработки моделей.

Когда требуется повторная обработка

Прежде чем приступить к работе с ними, необходимо обработать модели служб анализа. При изменении структуры модели интеллектуального анализа данных необходимо также повторно обработать модели интеллектуального анализа данных, обновить данные обучения, изменить существующую модель интеллектуального анализа данных или добавить новую модель интеллектуального анализа данных в структуру.

Модели анализа данных также обрабатываются в следующих сценариях:

Развертывание проекта. В зависимости от параметров проекта и текущего состояния проекта модели интеллектуального анализа данных в проекте обычно обрабатываются в полном объеме при развертывании проекта.

При запуске развертывания обработка начинается автоматически, если на сервере Служб Analysis Services уже существует ранее обработанная версия и не было никаких структурных изменений. Вы можете развернуть проект, выбрав "Развернуть решение " из раскрывающегося списка или нажав клавишу F5. Вы можете

Дополнительная информация о настройке свойств развертывания серверов Analysis Services, которые регулируют управление развертыванием моделей интеллектуального анализа данных, содержится в разделе "Развертывание решений интеллектуального анализа данных".

Перемещение модели интеллектуального анализа данных. При перемещении модели интеллектуального анализа данных с помощью команды EXPORT экспортируется только определение модели, которая включает имя структуры интеллектуального анализа данных, которая, как ожидается, предоставляет данные модели.

Повторная обработка требований для следующих сценариев с помощью команд EXPORT и IMPORT:

  • Структура интеллектуального анализа данных существует в целевом экземпляре, а структура интеллектуального анализа данных находится в непроцессованном состоянии.

    Необходимо повторно обработать как структуру, так и модель.

  • Структура интеллектуального анализа данных существует в целевом экземпляре и была обработана структура интеллектуального анализа данных. Была экспортирована только модель майнинга.

    Модель можно использовать без обработки.

  • Определение майнинговой структуры также экспортировано с использованием ключевого слова WITH DEPENDENCIES.

    Необходимо повторно обработать как структуру, так и модель.

Дополнительные сведения см. в разделе "Экспорт и импорт объектов интеллектуального анализа данных".

См. также

Структуры добычи данных (Analysis Services — интеллектуальный анализ данных)
Структуры добычи данных (Analysis Services — интеллектуальный анализ данных)
Обработка объектов многомерной модели