Логическая архитектура (службы Analysis Services — интеллектуальный анализ данных)

Интеллектуальный анализ данных — это процесс, который включает взаимодействие нескольких компонентов.

  • Доступ к источникам данных в базе данных SQL Server или любом другом источнике данных для обучения, тестирования или прогнозирования.

  • Структуры и модели интеллектуального анализа данных определяются с помощью SQL Server Data Tools (SSDT) или Visual Studio.

  • Вы управляете объектами интеллектуального анализа данных и создаете прогнозы и запросы с помощью SQL Server Management Studio.

  • Когда решение будет завершено, вы развернете его в экземпляре службы Analysis Services.

Процесс создания этих объектов решения уже описан в другом месте. Дополнительные сведения см. в разделе "Решения интеллектуального анализа данных".

Источник данных для интеллектуального анализа данных

Данные, используемые в интеллектуальном анализе данных, не хранятся в решении интеллектуального анализа данных; хранятся только привязки. Данные могут находиться в базе данных, созданной в предыдущей версии SQL Server, системы CRM или даже неструктурированного файла. При обучении структуры или модели путем обработки статистические сводки данных создаются и хранятся в кэше, который может быть сохранен для использования в последующих операциях или удален после обработки. Для получения дополнительной информации см. Структуры интеллектуального анализа данных (службы Analysis Services – Data Mining).

Вы объединяете разрозненные данные в объекте представления источников данных Служб Analysis Services (DSV), который предоставляет слой абстракции поверх источника данных. Можно указать соединения между таблицами или добавить таблицы с отношением "многие ко одному" для создания вложенных столбцов таблицы. Определение этих объектов, источника данных и представления источника данных хранится в решении с расширениями имени файла, *.ds и *.dsv. Для получения дополнительных сведений о создании и использовании источников данных служб Analysis Services и представлений источников данных, см. статью "Поддерживаемые источники данных (SSAS Multidimensional)".

Можно также определить и изменить источники данных и представления источников данных с помощью AMO или XMLA. Дополнительные сведения о работе с этими объектами программным способом см. в разделе "Обзор логической архитектуры" (службы Analysis Services — многомерные данные).</a0>

Структуры добычи данных

Структура интеллектуального анализа данных — это логический контейнер данных, определяющий домен данных, из которого создаются модели интеллектуального анализа данных. Одна структура интеллектуального анализа данных может поддерживать несколько моделей интеллектуального анализа данных.

Если необходимо использовать данные в решении интеллектуального анализа данных, службы Analysis Services считывают данные из источника и создают кеш агрегатов и дополнительной информации. По умолчанию этот кэш сохраняется, чтобы обучающие данные можно было повторно использовать для поддержки дополнительных моделей. Если необходимо удалить кэш, измените свойство CacheMode объекта структуры добычи данных на значение ClearAfterProcessing. Дополнительные сведения см. в разделе "Классы интеллектуального анализа данных AMO".

Службы SQL Server 2014 Analysis Services (SSAS) также предоставляют возможность разделения данных на наборы данных для обучения и тестирования, чтобы можно было протестировать модели интеллектуального анализа данных на репрезентативном, случайно выбранном наборе данных. Данные на самом деле не хранятся отдельно; скорее, данные случая в структуре кэша помечаются свойством, указывающим, используется ли этот конкретный случай для обучения или тестирования. Если кэш удаляется, эта информация не может быть извлечена.

Для получения дополнительной информации см. раздел "Структуры анализа данных (Analysis Services, интеллектуальный анализ данных)".

Структура интеллектуального анализа данных может содержать вложенные таблицы. Вложенная таблица содержит дополнительные сведения о случае, моделироваемом в основной таблице данных. Для получения дополнительной информации см. Вложенные таблицы (Analysis Services - интеллектуальный анализ данных)

Модели добычи данных

Перед обработкой модель интеллектуального анализа данных представляет собой только сочетание свойств метаданных. Эти свойства указывают структуру интеллектуального анализа данных, указывают алгоритм интеллектуального анализа данных и определяют коллекцию параметров и параметров фильтра, влияющих на способ обработки данных. Дополнительные сведения см. в разделе "Модели интеллектуального анализа данных" (службы Analysis Services — интеллектуальный анализ данных).

При обработке модели обучающие данные, хранящиеся в кэше структуры интеллектуального анализа данных, используются для создания шаблонов, основанных как на статистических свойствах данных, так и на эвристиках, определенных алгоритмом и его параметрами. Это называется обучением модели.

Результатом обучения является набор сводных данных, содержащихся в содержимом модели, который описывает шаблоны, найденные и предоставляющие правила для создания прогнозов. Дополнительные сведения см. в разделе «Содержимое модели интеллектуального анализа данных» (службы Analysis Services — интеллектуальный анализ данных).

В ограниченных случаях логическая структура модели также может быть экспортирована в файл, представляющий формулы модели и привязки данных в соответствии со стандартным форматом, языком разметки прогнозного моделирования (PMML). Эта логическая структура может быть импортирована в другие системы, использующие PMML, и описанная таким образом модель затем может быть использована для прогнозирования. Дополнительные сведения см. в разделе "Понимание инструкции выбора DMX".

Пользовательские объекты интеллектуального анализа данных

Другие объекты, которые вы используете в контексте проекта интеллектуального анализа данных, такие как диаграммы точности или прогнозные запросы, не сохраняются в решении, но могут быть преобразованы в скрипты с помощью ASSL или построены с помощью AMO.

Кроме того, можно расширить службы и функции, доступные в экземпляре служб Analysis Services, добавив следующие пользовательские объекты:

Пользовательские сборки
Сборки .NET можно создать с использованием любого языка, совместимого с CLR или COM, а затем зарегистрировать в экземпляре SQL Server. Файлы сборок загружаются из расположения, определенного приложением, и копия сохраняется на сервере вместе с данными. Копия файла сборки используется для загрузки сборки при каждом запуске службы.

Дополнительные сведения см. в разделе "Управление многомерными сборками моделей".

Пользовательские хранимые процедуры
Интеллектуальный анализ данных служб Analysis Services поддерживает использование хранимых процедур для работы с объектами интеллектуального анализа данных. Вы можете создать собственные хранимые процедуры, чтобы расширить функциональные возможности и упростить работу с данными, возвращаемыми запросами прогнозирования и запросами содержимого.

Определение хранимых процедур

Для выполнения перекрестной проверки поддерживаются следующие хранимые процедуры.

Хранимые процедуры анализа данных (Analysis Services — интеллектуальный анализ данных)

Кроме того, службы Analysis Services содержат множество системных хранимых процедур, которые используются внутри системы для интеллектуального анализа данных. Хотя системные хранимые процедуры предназначены для внутреннего использования, вы можете считать их полезными упрощениями. Корпорация Майкрософт оставляет за собой право изменять эти хранимые процедуры по мере необходимости; Поэтому для использования в рабочей среде рекомендуется создавать запросы с помощью DMX, AMO или XMLA.

Алгоритмы пользовательских плагинов
Службы Analysis Services предоставляют механизм для создания собственных алгоритмов и добавления их в качестве новой службы анализа данных в экземпляр сервера.

Службы Analysis Services используют COM-интерфейсы для взаимодействия с алгоритмами подключаемых модулей. Дополнительные сведения о реализации новых алгоритмов см. в статье "Алгоритмы подключаемых модулей".

Перед его использованием необходимо зарегистрировать каждый новый алгоритм. Чтобы зарегистрировать алгоритм, необходимо добавить необходимые метаданные для алгоритмов в файле .ini экземпляра служб Analysis Services. Необходимо добавить сведения в каждый экземпляр, в котором планируется использовать новый алгоритм. После добавления алгоритма можно перезапустить экземпляр и использовать набор строк схемы MINING_SERVICES для просмотра нового алгоритма, включая параметры и поставщики, поддерживаемые алгоритмом.

См. также

Обработка объектов многомерной модели
Справочник по расширениям интеллектуального анализа данных (DMX)