Занятие 1: Создание модели интеллектуального анализа данных и структуры интеллектуального анализа данных временных рядов

 

Применимо к: SQL Server 2016 Preview

На этом занятии будет создана модель интеллектуального анализа данных, с помощью которой можно спрогнозировать значения во времени на основании исторических данных. После создания модели автоматически будет создана базовая структура, которую можно использовать в качестве основы для дополнительных моделей интеллектуального анализа данных.

На этом занятии предполагается, что вы знакомы с моделями прогнозирования и требованиями алгоритма временных рядов (Майкрософт). Дополнительные сведения см. в статье Microsoft Time Series Algorithm.

Инструкция CREATE MINING MODEL

Чтобы создать модель интеллектуального анализа данных непосредственно и автоматического создания базовой структуры интеллектуального анализа данных, используйте CREATE MINING MODEL ( расширений интеллектуального анализа данных ) инструкции. Код инструкции можно разбить на следующие части:

  • присвоение имени модели;

  • определение временной метки;

  • определение необязательного ключевого столбца ряда;

  • определение прогнозируемого атрибута или атрибутов.

В следующем фрагменте показан стандартный пример инструкции CREATE MINING MODEL:

CREATE MINING MODEL [<Mining Structure Name>]  
(  
   <key columns>,  
   <predictable attribute columns>  
)  
USING <algorithm name>([parameter list])  
WITH DRILLTHROUGH  

Первая строчка кода определяет имя модели интеллектуального анализа данных:

CREATE MINING MODEL [Mining Model Name]  

Службы Analysis Services автоматически формируют имя базовой структуры путем добавления строки «_structure» к имени модели, что гарантирует несовпадение имени структуры и модели. Сведения о присвоении имени объекту в расширениях интеллектуального анализа данных см. в разделе идентификаторы ( расширений интеллектуального анализа данных ).

В следующей строке кода задается ключевой столбец модели интеллектуального анализа данных, который в случае с моделью временных рядов уникально определяет временной этап в исходных данных. Временной этап определяется с помощью KEY TIME ключевые слова после столбца имени и типов данных. Если модель временных рядов имеет отдельный ключ ряда, определяется с помощью ключ ключевое слово.

<key columns>  

Следующая строка кода используется для определения столбцов в прогнозируемой модели. Отдельная модель интеллектуального анализа данных может иметь несколько прогнозируемых атрибутов. В таком случае алгоритм временных рядов (Майкрософт) создает отдельный анализ для каждого ряда:

<predictable attribute columns>  

Задачи занятия

На этом занятии будут выполнены следующие задачи.

  • Создание нового пустого запроса

  • Изменение запроса, чтобы создать модель интеллектуального анализа данных

  • Выполнение запроса

Создание запроса

На первом этапе необходимо подключиться к экземпляру служб Службы Analysis Services и создать новый DMX-запрос в среде SQL Server Management Studio.

Создание нового DMX-запроса в среде SQL Server Management Studio

  1. Откройте среду SQL Server Management Studio.

  2. В подключение к серверу диалоговом для типа сервера, выберите служб Analysis Services. В имя сервера, тип LocalHost, или имя экземпляра Службы Analysis Services вы хотите подключиться для этого занятия. Нажмите кнопку Соединить.

  3. В обозревателя объектов, щелкните правой кнопкой мыши экземпляр Службы Analysis Services, пункты новый запрос, а затем нажмите кнопку расширений интеллектуального анализа данных.

    Откроется редактор запросов, содержащий новый, пустой запрос.

Изменение запроса

Следующим шагом будет изменение инструкции CREATE MINING MODEL, чтобы создать модель интеллектуального анализа данных, используемую для составления прогнозов, а также ее базовую структуру интеллектуального анализа данных.

Настройка инструкции CREATE MINING MODEL

  1. В редакторе запросов скопируйте общий пример инструкции CREATE MINING MODEL в пустое окно запроса.

  2. Вместо

    [mining model name]   
    

    вставьте

    [Forecasting_MIXED]  
    
  3. Вместо

    <key columns>  
    

    вставьте

    [Reporting Date] DATE KEY TIME,  
    [Model Region] TEXT KEY  
    

    Ключа времени ключевое слово указывает, что столбец ReportingDate содержит временных шаг значения, используемые для определения порядка следования значений. Временными этапами могут быть даты и значения времени, целые числа или любой другой тип упорядоченных данных при условии, что значения уникальны, а данные отсортированы.

    Текст и ключ означают, что столбец ModelRegion содержит дополнительный ключ ряда. Допускается использование только одного ключа ряда, при этом значения в столбце должны отличаться друг от друга.

  4. Вместо

    < predictable attribute columns> )  
    

    вставьте

    [Quantity] LONG CONTINUOUS PREDICT,  
    [Amount] DOUBLE CONTINUOUS PREDICT  
    )  
    
  5. Вместо

    USING <algorithm name>([parameter list])  
    WITH DRILLTHROUGH  
    

    вставьте

    USING Microsoft_Time_Series
    (AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED')  
    WITH DRILLTHROUGH  
    

    Параметр алгоритма AUTO_DETECT_PERIODICITY = 0,8, указывает, что алгоритм должен обнаруживать циклы в данных. Установка значения, близкого к 1, позволяет обнаружить множество шаблонов, но может замедлить процесс обработки.

    Параметр алгоритма FORECAST_METHOD, указывает, следует ли данные для анализа с помощью ARTXP, ARIMA или сочетание обоих.

    Ключевое слово WITH DRILLTHROUGH, укажите, требуется иметь возможность просмотра подробной статистики в исходных данных после завершения создания модели. Добавьте это предложение в том случае, если нужно просматривать модель с помощью средства просмотра временных рядов (Майкрософт). Для создания прогноза оно не требуется.

    Полная инструкция теперь должна выглядеть следующим образом.

    CREATE MINING MODEL [Forecasting_MIXED]  
         (  
        [Reporting Date] DATE KEY TIME,  
        [Model Region] TEXT KEY,  
        [Quantity] LONG CONTINUOUS PREDICT,  
        [Amount] DOUBLE CONTINUOUS PREDICT  
        )  
    USING Microsoft_Time_Series (AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED')  
    WITH DRILLTHROUGH  
    
  6. В меню Файл щелкните Сохранить DMXQuery1.dmx как.

  7. В Сохранить как диалоговом перейдите к соответствующей папке и присвойте файлу имя Forecasting_MIXED.dmx.

Выполнение запроса

На последнем шаге нужно выполнить запрос. Создав и сохранив запрос, его необходимо выполнить, чтобы сформировать модель интеллектуального анализа данных и соответствующую структуру на сервере. Дополнительные сведения о выполнении запросов в редакторе запросов см. в разделе редактора запросов компонента Database Engine ( SQL Server Management Studio ).

Выполнение запроса

  • В редакторе запросов на панели инструментов щелкните Execute.

    Состояние запроса сообщения вкладку в нижней части редактора запросов после завершения выполнения инструкции. Сообщение должно выглядеть следующим образом:

    Executing the query   
    Execution complete  
    

    Новая структура с именем Forecasting_MIXED_Structure теперь существует на сервере, вместе с соответствующей модели интеллектуального анализа Forecasting_MIXED.

На следующем занятии вы добавите модели интеллектуального анализа данных для Forecasting_MIXED структуры интеллектуального анализа данных, который вы только что создали.

Следующее занятие

Занятие 2: Добавление моделей интеллектуального анализа данных для структуры интеллектуального анализа данных временных рядов

См. также:

Содержимое моделей интеллектуального анализа данных для моделей временных рядов (службы Analysis Services — интеллектуальный анализ данных)
Технический справочник по алгоритму временных рядов (Майкрософт)