Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
С помощью данного учебника вы научитесь создавать, обучать и исследовать модели интеллектуального анализа данных при помощи языка запросов расширения интеллектуального анализа данных (DMX). После этого вы будете использовать модели интеллектуального анализа данных для создания прогнозов, описывающих, какие продукты будут покупаться с наибольшей вероятностью.
Модели интеллектуального анализа данных будут созданы из данных, содержащихся в примере базы данных AdventureWorksDW2012 , в которой хранятся данные для вымышленной компании Adventure Works Cycles. Adventure Works Cycles является крупной многонациональной производственной компанией. Компания изготавливает и продает велосипеды из металла и композитных материалов в Северной Америке, а также на европейском и азиатском рынках. Основное производство расположено в городе Ботель, штат Вашингтон, и имеет 290 служащих; существуют несколько региональных групп продаж, расположенных на территории рынков сбыта.
Сценарий учебника
Adventure Works Cycles решил создать пользовательское приложение, которое использует функции интеллектуального анализа данных для прогнозирования типов продуктов, которые их клиенты, как правило, приобрести одновременно. Целью приложения является возможность определить набор продуктов и предсказать, какие дополнительные продукты будут покупаться вместе с другими продуктами. Затем Adventure Works Cycles будет использовать эту информацию для добавления функции предложения на свой веб-сайт, а также для более эффективной организации способа представления информации своим клиентам.
Службы Microsoft SQL Server Analysis Services предоставляют несколько средств, которые можно использовать для выполнения этой задачи:
Язык DMX-запросов
Алгоритм ассоциации Майкрософт
Редактор запросов в СРЕДЕ SQL Server Management Studio
Расширения интеллектуального анализа данных (DMX) — это язык запросов, предоставляемый службами Analysis Services, которые можно использовать для создания и работы с моделями интеллектуального анализа данных. Алгоритм ассоциации Майкрософт создает модели, которые могут прогнозировать продукты, которые, скорее всего, будут приобретены вместе.
Целью данного учебника является описание запросов расширений интеллектуального анализа данных, которые используются в описанном выше приложении.
Дополнительные сведения:решения интеллектуального анализа данных
Структура и модели интеллектуального анализа данных
Прежде чем приступить к созданию инструкций DMX, важно понимать основные объекты, которые службы Analysis Services используют для создания моделей интеллектуального анализа данных. Структура интеллектуального анализа данных — это структура данных, которая определяет домен данных, из которого создаются модели интеллектуального анализа данных. Одна структура интеллектуального анализа данных может содержать несколько моделей интеллектуального анализа данных, которые используют один домен. Модель интеллектуального анализа данных применяет алгоритм интеллектуального анализа к данным, представленным структурой интеллектуального анализа данных.
Строительными блоками структуры интеллектуального анализа являются столбцы, которые описывают данные, содержащиеся в источнике данных. Эти столбцы содержат такие сведения, как тип данных, тип содержимого и способы распределения данных.
Модели интеллектуального анализа данных должны включать ключевой столбец, описанный в структуре интеллектуального анализа данных, а также набор оставшихся столбцов. Модель интеллектуального анализа данных определяет использование каждого столбца и определяет алгоритм, используемый для создания этой модели. Например, в расширении интеллектуального анализа данных можно указать столбец в качестве ключевого или столбца типа PREDICT. Если столбец не указан, он считается входным столбцом.
В расширении интеллектуального анализа данных существует два способа создания моделей интеллектуального анализа данных. Можно либо создать структуру интеллектуального анализа данных и связанную модель интеллектуального анализа данных вместе с помощью инструкции CREATE MINING MODEL, либо вначале создать структуру интеллектуального анализа данных с помощью инструкции CREATE MINING STRUCTURE, а затем добавить к структуре модель интеллектуального анализа данных с помощью инструкции ALTER STRUCTURE. Это способы описаны ниже.
CREATE MINING MODEL
Эта инструкция используется для одновременного создания структуры интеллектуального анализа данных и связанной с ней модели интеллектуального анализа данных с одним и тем же именем. К имени модели интеллектуального анализа данных добавляется слово «Structure», чтобы отличить ее от структуры интеллектуального анализа данных.
Эта инструкция полезна, если создается структура интеллектуального анализа данных, которая будет содержать только одну модель интеллектуального анализа данных.
Дополнительные сведения см. в разделе CREATE MINING MODEL (DMX).
СОЗДАНИЕ СТРУКТУРЫ ДЛЯ МАЙНИНГА
Эта инструкция используется для создания новой структуры интеллектуального анализа данных без использования моделей.
При использовании CREATE MINING STRUCTURE можно также создать набор контрольных данных, который может быть использован для проверки моделей, основанных на той же структуры интеллектуального анализа данных.
Дополнительные сведения см. в разделе CREATE MINING STRUCTURE (DMX).
ALTER MINING STRUCTURE
Эта инструкция используется для добавления модели интеллектуального анализа данных к уже существующей на сервере структуре интеллектуального анализа данных.
Есть несколько причин, почему может понадобиться добавить несколько моделей интеллектуального анализа данных в структуру интеллектуального анализа данных. Например, можно создать несколько моделей интеллектуального анализа данных, которые используют разные алгоритмы, чтобы выяснить, какой из них самый лучший. При помощи одного и того же алгоритма можно создать несколько различных моделей и установить для них различные настройки определенного параметра, чтобы выяснить, какое значение параметра является наилучшим.
Дополнительные сведения см. в разделе ALTER MINING STRUCTURE (DMX).
В этом учебнике создается структура интеллектуального анализа данных, которая содержит несколько моделей, поэтому в учебнике используется второй метод.
Дополнительные сведения
Справочник по расширениям интеллектуального анализа данных (DMX), общие сведения о инструкции выбора, структуре и использовании запросов прогнозирования dmX
Обзор учебника
Учебник содержит следующие занятия:
Урок 1. Создание структуры интеллектуального анализа "Потребительская корзина"
На этом занятии рассматривается использование инструкции CREATE для создания структур интеллектуального анализа данных.
Урок 2. Добавление моделей интеллектуального анализа данных к структуре интеллектуального анализа данных "Потребительская корзина"
На этом занятии рассматривается использование инструкции ALTER для добавления моделей интеллектуального анализа данных в структуру интеллектуального анализа данных.
Урок 3. Обработка структуры интеллектуального анализа "Потребительская корзина"
На этом занятии рассматривается использование инструкции INSERT INTO для обработки структур интеллектуального анализа данных и связанных с ними моделей интеллектуального анализа данных.
Урок 4. Прогнозирование "Потребительской корзины"
На этом занятии рассматривается использование инструкции PREDICTION JOIN для создания прогнозов по моделям интеллектуального анализа данных.
Требования
Прежде чем выполнять задания этого учебника, убедитесь, что установлены следующие компоненты:
Microsoft SQL Server
Microsoft SQL Server Analysis Services
База данных AdventureWorksDW2012
В целях повышения безопасности образцы баз данных по умолчанию не установлены. Чтобы установить официальные примеры баз данных для Microsoft SQL Server, перейдите https://www.CodePlex.com/MSFTDBProdSamples на домашнюю страницу microsoft SQL Server Samples and Community Projects в разделе "Примеры продуктов Microsoft SQL Server". Щелкните "Базы данных", а затем перейдите на вкладку "Выпуски " и выберите нужные базы данных.
Примечание.
При просмотре учебников рекомендуется добавить кнопки "Далее" и "Предыдущий раздел" на панель инструментов средства просмотра документов.
См. также
Учебник по расширениям интеллектуального анализа данных "Покупатель велосипеда"
Учебник по основам интеллектуального анализа данных
Урок 3. Создание сценария корзины рынка (учебник по интеллектуальному анализу промежуточных данных)