Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Применимо к:
SQL Server 2019 и более ранних версий Analysis Services
Azure Analysis Services
Fabric/Power BI Premium
Это важно
Интеллектуальный анализ данных был признан устаревшим в службах SQL Server 2017 Analysis Services и теперь прекращён в службах SQL Server 2022 Analysis Services. Документация не обновляется для устаревших и прекращённых функций. Дополнительные сведения см. в статье о обратной совместимости служб Analysis Services.
Все модели интеллектуального анализа данных используют единую структуру для хранения содержимого. Эта структура определяется в соответствии со схемой содержимого интеллектуального анализа данных в виде набора строк. Однако в этой стандартной структуре узлы, содержащие информацию, упорядочивается разными способами для представления различных видов деревьев. В этом разделе описывается, как организованы узлы и что означает каждый узел для моделей майнинга, основанных на алгоритме временных рядов Microsoft.
Описание общего содержимого модели интеллектуального анализа данных, применимого ко всем типам моделей, см. в разделе "Содержимое модели интеллектуального анализа данных" (службы Analysis Services — интеллектуальный анализ данных).
При ознакомлении с этим разделом вам может быть полезно следить за содержимым модели временных рядов. Вы можете создать модель временных рядов, пройдя базовое руководство по интеллектуальному анализу данных. Модель, созданная в руководстве, — это смешанная модель, которая обучает данные с помощью алгоритмов ARIMA и ARTXP. Для получения информации о том, как просматривать содержимое модели интеллектуального анализа данных, см. раздел «Просмотр моделей интеллектуального анализа данных».
Общие сведения о структуре модели временных рядов
Модель временных рядов имеет один родительский узел, представляющий модель и ее метаданные. Под родительским узлом есть одно или два дерева временных рядов в зависимости от алгоритма, используемого для создания модели.
При создании смешанной модели в модель добавляются два отдельных дерева, один для ARIMA и один для ARTXP. Если вы решили использовать только алгоритм ARTXP или только алгоритм ARIMA, у вас будет одно дерево, соответствующее данному алгоритму. Вы указываете, какой алгоритм следует использовать, задав параметр FORECAST_METHOD. Дополнительные сведения об использовании ARTXP, ARIMA или смешанной модели см. в статье "Алгоритм временных рядов Майкрософт".
На следующей схеме показан пример модели интеллектуального анализа данных временных рядов, созданной с параметрами по умолчанию, для создания смешанной модели. Чтобы упростить сравнение различий между двумя моделями, здесь модель ARTXP отображается слева от схемы, а модель ARIMA отображается в правой части схемы. В то время как ARTXP — это древовидная структура, которая разделяется на меньшие и меньшие ветви, структура, созданная алгоритмом ARIMA, больше похожа на пирамиду, построенную вверх от небольших компонентов.
Важно помнить, что информация организована в деревьях ARIMA и ARTXP совершенно разными способами, и следует учитывать два дерева как связанные только на корневом узле. Хотя два представления представлены в одной модели для удобства, они должны рассматриваться как две независимые модели. ARTXP представляет реальную структуру дерева, а ARIMA - нет.
При использовании средства просмотра дерева содержимого универсальной модели Майкрософт для просмотра модели, которая использует ARIMA и ARTXP, узлы для моделей ARTXP и ARIMA отображаются как дочерние узлы родительской модели временных рядов. Однако их можно легко определить по меткам, примененным к узлам.
Первый набор узлов помечен (все) и представляет результаты анализа алгоритмом ARTXP.
Второй набор узлов помечен ARIMA и представляет результаты анализа алгоритмом ARIMA.
Предупреждение
Имя (All) в дереве ARTXP сохраняется только для обратной совместимости. До SQL Server 2008 алгоритм временных рядов использовал один алгоритм для анализа, алгоритм ARTXP.
В следующих разделах объясняется, как узлы упорядочены в каждом из этих типов моделей.
Структура модели ARTXP
Алгоритм ARTXP создает модель, аналогичную модели деревьев принятия решений. Он группирует прогнозируемые атрибуты и разбивает их при обнаружении существенных различий. Поэтому каждая модель ARTXP содержит отдельную ветвь для каждого прогнозируемого атрибута. Например, в учебнике по интеллектуальному анализу данных уровня "Базовый" создается модель, которая прогнозирует объем продаж для нескольких регионов. В этом случае [Сумма] — это прогнозируемый атрибут, и для каждого региона создается отдельная ветвь. Если у вас есть два прогнозируемых атрибута [Amount] и [Quantity], для каждой комбинации атрибута и региона будет создана отдельная ветвь.
Верхний узел ветви ARTXP содержит те же сведения, что и в корневом узле дерева принятия решений. К ним относятся число дочерних элементов для этого узла (CHILDREN_CARDINALITY), количество случаев, удовлетворяющих условиям этого узла (NODE_SUPPORT), и различные описательные статистические показатели (NODE_DISTRIBUTION).
Если узел не имеет дочерних элементов, это означает, что не обнаружено значимых условий, которые оправдывали бы разделение случаев на дополнительные подгруппы. Ветвь заканчивается на этом этапе, и узел называется конечным узлом. Конечный узел содержит атрибуты, коэффициенты и значения, которые являются строительными блоками формулы ARTXP.
Некоторые ветви могут иметь дополнительные разделения, аналогичные модели деревьев принятия решений. Например, ветвь дерева, представляющего продажи для региона Европы, разбивается на две ветви. Разделение возникает при обнаружении условия, что приводит к значительной разнице между двумя группами. Родительский узел указывает имя атрибута, вызвавшего разделение, например [Сумма], и количество случаев, которые находятся в родительском узле. Конечные узлы содержат более подробные сведения: значение атрибута, например [Sales] >10 000 и [Sales] < 10 000), количество вариантов, поддерживающих каждое условие, и формулу ARTXP.
Замечание
Если вы хотите просмотреть формулы, можно найти полную формулу регрессии на уровне конечного узла, но не в промежуточном или корневом узле.
Структура модели ARIMA
Алгоритм ARIMA создает одну часть информации для каждого сочетания ряда данных (например, [ регион]) и прогнозируемый атрибут (например, [Объем продаж])- уравнение, описывающее изменение прогнозируемого атрибута с течением времени.
Уравнение для каждой серии является производным от нескольких компонентов, по одному для каждой периодической структуры, найденной в данных. Например, если у вас есть данные о продажах, собираемые ежемесячно, алгоритм может обнаруживать ежемесячные, квартальные или ежегодные периодические структуры.
Алгоритм выводит отдельный набор родительских и дочерних узлов для каждой периодичности, который он находит. Периодичность по умолчанию — 1, для одного среза времени и автоматически добавляется во все модели. Можно указать возможные периодические структуры, введя несколько значений в параметре PERIODICITY_HINT. Однако если алгоритм не обнаруживает периодическую структуру, он не будет выводить результаты для этого указания.
Каждая периодическая структура, которая выводится в содержимом модели, содержит следующие узлы компонентов:
Узел для авторегрессионного порядка (AR)
Узел для скользящего среднего (MA)
Сведения о значении этих терминов см. в статье "Алгоритм временных рядов Майкрософт".
Порядок различий является важной частью формулы и представлен в уравнении. Дополнительные сведения о том, как используется порядок разности, см. в техническом справочнике по алгоритму временных рядов Майкрософт.
Содержимое модели для временных рядов
В этом разделе приведены подробные сведения и примеры только для тех столбцов в содержимом модели интеллектуального анализа данных, которые имеют особую релевантность для моделей временных рядов.
Сведения о столбцах общего назначения в наборе строк схемы, таких как MODEL_CATALOG и MODEL_NAME, или описание терминологии модели интеллектуального анализа данных, см. в разделе "Содержимое модели интеллектуального анализа данных" (службы Analysis Services — интеллектуальный анализ данных).
MODEL_CATALOG
Имя базы данных, в которой хранится модель.
MODEL_NAME
Имя модели.
ATTRIBUTE_NAME
Прогнозируемый атрибут для ряда данных, представленный на узле. (То же значение, что и для MSOLAP_MODEL_COLUMN.)
NODE_NAME
Имя узла.
В настоящее время этот столбец содержит то же значение, что и NODE_UNIQUE_NAME, хотя это может измениться в будущих выпусках.
NODE_UNIQUE_NAME
Уникальное имя узла. Родительский узел модели всегда называется TS.
ARTXP: Каждый узел представлен TS, за которым следует шестнадцатеричное числовое значение. Порядок узлов не имеет значение.
Например, узлы ARTXP непосредственно под деревом TS могут быть нумерованы TS00000001-TS00000000b.
ARIMA: Каждый узел в дереве ARIMA представлен ta, за которым следует шестнадцатеричное числовое значение. Дочерние узлы содержат уникальное имя родительского узла, за которым следует другое шестнадцатеричное число, указывающее последовательность в узле.
Все деревья ARIMA структурированы точно так же. Каждый корень содержит узлы и правила именования, показанные в следующей таблице:
| Идентификатор и тип узла ARIMA | Пример имени узла |
|---|---|
| Корень ARIMA (27) | TA0000000b |
| Периодические структуры ARIMA (28) | TA0000000000000000000000 |
| ArIMA Auto Regressive (29) | TA0000000b000000000 |
| ARIMA Скользящая средняя (30) | TA0000000b000000001 |
NODE_TYPE
Модель временных рядов выводит следующие типы узлов в зависимости от алгоритма.
ARTXP:
| Идентификатор типа узла | Description |
|---|---|
| 1 (модель) | Временной ряд |
| 3 (интерьер) | Представляет внутреннюю ветвь в дереве временных рядов ARTXP. |
| 16 (дерево временных рядов) | Корень дерева ARTXP, соответствующего прогнозируемому атрибуту и ряду. |
| 15 (временные ряды) | Конечный узел в дереве ARTXP. |
ARIMA:
| Идентификатор типа узла | Description |
|---|---|
| 27 (корень ARIMA) | Верхний узел дерева ARIMA. |
| 28 (периодическая структура ARIMA) | Компонент дерева ARIMA, описывающий одну периодическую структуру. |
| 29 (ARIMA Autoregressive) | Содержит коэффициент для одной периодической структуры. |
| 30 (Скользящее среднее ARIMA) | Содержит коэффициент для одной периодической структуры. |
NODE_CAPTION
Метка или подпись, связанная с узлом.
Это свойство в первую очередь предназначено для отображения.
ARTXP: Содержит условие разделения узла, отображаемое в виде сочетания атрибутов и диапазона значений.
ARIMA: Содержит короткую форму уравнения ARIMA.
Для получения информации о формате уравнения ARIMA см. в разделе "Легенда для ARIMA".
CHILDREN_CARDINALITY
Количество прямых дочерних элементов, которые имеет узел.
PARENT_UNIQUE_NAME
Уникальное имя родительского узла. Возвращается значение NULL для любых узлов на уровне корня.
NODE_DESCRIPTION
Описание текстовых правил, разбиений или формул в текущем узле.
ARTXP: Дополнительные сведения см. в разделе "Общие сведения о дереве ARTXP".
ARIMA: Дополнительные сведения см. в разделе "Общие сведения о дереве ARIMA".
NODE_RULE
XML-описание правил, разделений или формул в текущем узле.
ARTXP: Обычно NODE_RULE соответствует NODE_CAPTION.
ARIMA: Дополнительные сведения см. в разделе "Общие сведения о дереве ARIMA".
MARGINAL_RULE
XML-описание разбиения или содержимого, относящееся к узлу.
ARTXP: Обычно правило MARGINAL_RULE соответствует описанию узла NODE_DESCRIPTION.
ARIMA: Всегда пусто; вместо этого используйте NODE_RULE.
NODE_PROBABILITY
ARTXP: Для узлов дерева всегда 1. Для листовых узлов вероятность достижения этого узла из корневого узла модели.
ARIMA: Всегда 0.
MARGINAL_PROBABILITY
ARTXP: Для узлов дерева всегда 1. Для листовых узлов вероятность достижения узла от непосредственного родительского узла.
ARIMA: Всегда 0.
NODE_DISTRIBUTION
Таблица, содержащая гистограмму вероятности узла. В модели временных рядов эта вложенная таблица содержит все компоненты, необходимые для сборки фактической формулы регрессии.
Дополнительные сведения о таблице распространения узлов в дереве ARTXP см. в разделе "Общие сведения о дереве ARTXP".
Дополнительные сведения о таблице распределения узлов в дереве ARIMA см. в разделе "Общие сведения о дереве ARIMA".
Если вы хотите просмотреть все константы и другие компоненты, представленные в удобочитаемом формате, используйте Средство просмотра временных рядов, щелкните узел и откройте Легенда анализа данных.
NODE_SUPPORT
Количество случаев, поддерживающих этот узел.
ARTXP: Для узла (все) указывает общее количество срезов времени, включенных в ветвь.
Для узлов терминала указывает количество срезов времени, включенных в диапазон, описываемый NODE_CAPTION. Количество временных интервалов в терминальных узлах всегда суммируется до значения NODE_SUPPORT для узла ветви (All).
ARIMA: Число случаев, поддерживающих текущую периодическую структуру. Значение опоры повторяется во всех узлах текущей периодической структуры.
MSOLAP_MODEL_COLUMN
Прогнозируемый атрибут для ряда данных, представленный на узле. (То же значение, что и для ATTRIBUTE_NAME.)
MSOLAP_NODE_SCORE
Числовое значение, характеризующее информационную ценность дерева или разбиения.
ARTXP: Значение всегда равно 0.0 для узлов без разделения. Для узлов с разделением значение представляет оценку интересности разделения.
Дополнительные сведения о методах оценки см. в разделе "Выбор компонентов" (интеллектуальный анализ данных).
ARIMA: Байесовский информационный критерий (BIC) модели ARIMA. Одна и та же оценка устанавливается на всех узлах ARIMA, связанных с уравнением.
MSOLAP_NODE_SHORT_CAPTION
ARTXP: Те же сведения, что и NODE_DESCRIPTION.
ARIMA: Те же сведения, что и NODE_CAPTION: то есть короткая форма уравнения ARIMA.
Общие сведения о дереве ARTXP
Модель ARTXP четко отделяет области данных, которые являются линейными от областей данных, разделенных на какой-то другой фактор. Когда изменения в прогнозируемом атрибуте могут быть непосредственно представлены как функция независимых переменных, формула регрессии вычисляется для представления этой связи.
Например, если существует прямая корреляция между временем и продажами для большинства рядов данных, каждая серия будет содержаться в дереве временных рядов (NODE_TYPE =16), у которых нет дочерних узлов для каждого ряда данных, только уравнение регрессии. Однако если связь не является линейной, ARTXP дерево временных рядов может ветвиться на дочерние узлы на основании условий, как и в модели дерева принятия решений. Просматривая содержимое модели в универсальном средстве просмотра дерева содержимого компании Microsoft, вы можете увидеть, где происходят разбиения, и как это влияет на линию тренда.
Чтобы лучше понять это поведение, можно просмотреть модель временных рядов, созданную в учебнике по интеллектуальному анализу данных уровня "Базовый". Эта модель, основанная на хранилище данных AdventureWorks, не использует особенно сложные данные. Поэтому в дереве ARTXP не существует большого количества разбиений. Однако даже эта относительно простая модель иллюстрирует три различных типа разделения:
Линия тренда [Сумма] для Тихоокеанского региона делится по временному ключу. Разделение по ключу времени означает, что в определенной точке времени наблюдается изменение тренда. Линия тренда сначала была линейной до определенной точки, после чего кривая приняла другую форму. Например, один временный ряд может продолжаться до 6 августа 2002 года, а другой временный ряд начинается после этой даты.
Линия тренда [Сумма] для региона Северной Америки разделяется на другую переменную. В этом случае тенденция для Северной Америки варьируется в зависимости от значения той же модели в Европе. Другими словами, алгоритм обнаружил, что при изменении значения для Европы значение для Северной Америки А также изменяется.
Линия тренда для региона Европы разветвляется.
Что означает каждое разделение? Интерпретация информации, передаваемой с помощью содержимого модели, — это искусство, которое требует глубокого понимания данных и его смысла в бизнес-контексте.
Очевидная связь между тенденциями в регионах Северной Америки и Европы может свидетельствовать лишь о том, что данные для Европы имеют большую энтропию, что вызывает ослабление тенденции для Северной Америки. Или, возможно, нет существенной разницы в оценке для двух, и корреляция может быть случайной, основанной просто на вычислениях Европы перед вычислениями Северной Америки. Тем не менее, вы можете просмотреть данные и убедиться, что корреляция является ложной, или исследовать, может ли какой-либо другой фактор участвовать.
Разделение по ключу времени означает статистически значимое изменение в градиенте линии графика. Это может быть вызвано математическими факторами, такими как поддержка каждого диапазона, или вычисления энтропии, необходимые для разделения. Таким образом, это разделение может быть не интересно с точки зрения смысла модели в реальном мире. Однако при просмотре периода времени, указанного в разделении, можно найти интересные корреляции, которые не представлены в данных, например повышение продаж или другое событие, которое началось в то время, и это может повлиять на данные.
Если данные содержат другие атрибуты, скорее всего, вы увидите более интересные примеры ветвления в дереве. Например, если вы отслеживали информацию о погоде и использовали ее в качестве атрибута для анализа, можно увидеть несколько разбиений в дереве, которые представляют сложное взаимодействие продаж и погоды.
Короче говоря, интеллектуальный анализ данных полезен для предоставления подсказок о том, где происходят потенциально интересные явления, но дальнейшее исследование и опыт бизнес-пользователей необходимы для точного интерпретации ценности информации в контексте.
Элементы формулы временных рядов ARTXP
Чтобы просмотреть полную формулу для дерева или ветви ARTXP, рекомендуется использовать легенду майнинга средства просмотра временных рядов Майкрософт, которая представляет все константы в формате, доступном для понимания.
В следующем разделе представлен пример уравнения и описаны основные термины.
Легенда майнинга данных для формулы ARTXP
В следующем примере показана формула ARTXP для одной части модели, как показано в легенде интеллектуального анализа данных. Чтобы просмотреть эту формулу, откройте модель [Прогнозирование], созданную в учебнике по интеллектуальному анализу данных в средстве просмотра временных рядов Майкрософт, перейдите на вкладку "Модель " и выберите дерево для серии данных R250: Европа.
Чтобы просмотреть уравнение, используемое в этом примере, щелкните узел, представляющий ряд дат на или после 07.05.2003.
Пример уравнения узла дерева:
Quantity = 21.322 -0.293 * Quantity(R250 North America,-7) + 0.069 * Quantity(R250 Europe,-1) + 0.023 * Quantity(R250 Europe,-3) -0.142 * Quantity(R750 Europe,-8)
В этом случае значение 21.322 представляет значение, прогнозируемое для Quantity, как функция следующих элементов уравнения.
Например, один элемент — Quantity(R250 North America,-7). Эта запись обозначает количество в регионе Северной Америки на t-7, за семь временных интервалов до текущего. Значение для этого ряда данных умножается на коэффициент -0,293. Коэффициент каждого элемента вычисляется во время процесса обучения и основывается на тенденциях, наблюдаемых в данных.
В этом уравнении существует несколько элементов, так как модель вычислила, что количество модели R250 в регионе Европы зависит от значений нескольких других рядов данных.
Содержимое модели для формулы ARTXP
В следующей таблице показаны те же сведения о формуле, при этом используется содержимое соответствующего узла, как это отображается в Средстве просмотра дерева контента Майкрософт (интеллектуальный анализ данных).
| ATTRIBUTE_NAME | ATTRIBUTE_VALUE | ПОДДЕРЖКА | ВЕРОЯТНОСТЬ | ОТКЛОНЕНИЕ | тип значения |
|---|---|---|---|---|---|
| Количество(R250 Европа,y-перехват) | 21.3223433563772 | 11 | 0 | 1.65508795539661 | 11 (перехват) |
| Количество(R250 Европа,-1) | 0.0691694140876526 | 0 | 0 | 0 | 7 (коэффициент) |
| Количество(R250 Европа,-1) | 20.6363635858123 | 0 | 0 | 182.380682874818 | 9 (статистика) |
| Количество(R750 Европа,-8) | -0.1421203048299 | 0 | 0 | 0 | 7 (коэффициент) |
| Количество(R750 Европа,-8) | 22.5454545333019 | 0 | 0 | 104.362130048408 | 9 (статистика) |
| Количество(R250 Европа,-3) | 0.0234095979448281 | 0 | 0 | 0 | 7 (коэффициент) |
| Количество(R250 Европа,-3) | 24.8181818883176 | 0 | 0 | 176.475304989169 | 9 (статистика) |
| Количество(R250 Северная Америка,-7) | -0.292914186039869 | 0 | 0 | 0 | 7 (коэффициент) |
| Количество(R250 Северная Америка,-7) | 10.36363640433 | 0 | 0 | 701.882534898676 | 9 (статистика) |
Как видно из сравнения этих примеров, содержимое модели интеллектуального анализа данных включает ту же информацию, что и в легенде майнинга, но с дополнительными столбцами для дисперсии и поддержки. Значение поддержки указывает количество случаев, поддерживающих тенденцию, описанную в этом уравнении.
Использование формулы временных рядов ARTXP
Для большинства бизнес-пользователей значение содержимого модели ARTXP заключается в том, что оно объединяет как представление дерева, так и линейное представление данных.
Если изменения прогнозируемого атрибута могут быть представлены в виде линейной функции независимых переменных, алгоритм автоматически вычислит уравнение регрессии и выдаст эту серию в отдельном узле.
Всякий раз, когда связь не может быть выражена как линейная корреляция, временные ряды ветвят, как дерево принятия решений.
Просматривая содержимое модели в средстве просмотра временных рядов Майкрософт , вы можете увидеть, где происходит разделение, и как это влияет на линию тренда.
Если прямая корреляция существует между временем и продажами для любой части данного ряда, самый простой способ получить формулу — это скопировать формулу из легенды интеллектуального анализа, а затем вставить её в документ или презентацию для объяснения модели. Кроме того, можно извлечь средние, коэффициенты и другие сведения из таблицы NODE_DISTRIBUTION для этого дерева и использовать ее для вычисления расширений тренда. Если вся серия демонстрирует согласованную линейную связь, уравнение содержится в узле (Все). Если в дереве есть ветвление, уравнение содержится в листовом узле.
Следующий запрос возвращает все листья ARTXP из модели анализа данных, вместе с вложенной таблицей NODE_DISTRIBUTION, содержащей уравнение.
SELECT MODEL_NAME, ATTRIBUTE_NAME, NODE_NAME,
NODE_CAPTION,
(SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE, [VARIANCE], VALUETYPE
FROM NODE_DISTRIBUTION) as t
FROM Forecasting.CONTENT
WHERE NODE_TYPE = 15
Общие сведения о дереве ARIMA
Каждая структура в модели ARIMA соответствует периодичности или периодической структуре. Периодическая структура — это шаблон данных, повторяющихся в рамках ряда данных. Некоторые незначительные вариации в шаблоне разрешены в статистических ограничениях. Периодичность измеряется в соответствии с единицами времени по умолчанию, которые использовались в обучающих данных. Например, если данные обучения предоставляют данные о продажах для каждого дня, единица времени по умолчанию составляет один день, а все периодические структуры определяются как указанное число дней.
Каждый период, обнаруженный алгоритмом, получает свой собственный узел структуры. Например, если вы анализируете ежедневные данные о продажах, модель может обнаружить периодические структуры, представляющие недели. В этом случае алгоритм создаст две периодические структуры в готовой модели: одну для ежедневного периода по умолчанию, обозначаемую как {1}, и одну в течение нескольких недель, указанную в {7}виде .
Например, следующий запрос возвращает все структуры ARIMA из модели добычи данных.
SELECT MODEL_NAME, ATTRIBUTE_NAME, NODE_NAME, NODE_CAPTION
FROM Forecasting.CONTENT
WHERE NODE_TYPE = 27
Пример результатов:
| MODEL_NAME | ATTRIBUTE_NAME | NODE_NAME | NODE_TYPE | NODE_CAPTION |
|---|---|---|---|---|
| Forecasting | M200 Европа:Количество | TA00000000 | двадцать семь | ARIMA (1,0,1) |
| Forecasting | M200 Северная Америка:Количество | TA00000001 | двадцать семь | ARIMA (1,0,4) X (1,1,4)(6) |
| Forecasting | M200 Pacific:Количество | TA00000002 | двадцать семь | ARIMA (2,0,8) X (1,0,0)(4) |
| Forecasting | M200 Pacific: Количество | TA00000002 | двадцать семь | ARIMA (2,0,8) X (1,0,0)(4) |
| Forecasting | R250 Европа:Количество | TA00000003 | двадцать семь | ARIMA (1,0,7) |
| Forecasting | R250 Северная Америка:Количество | TA00000004 | двадцать семь | ARIMA (1,0,2) |
| Forecasting | R250 Pacific:Количество | TA00000005 | двадцать семь | ARIMA (2,0,2) X (1,1,2)(12) |
| Forecasting | R750 Европа:Количество | TA00000006 | двадцать семь | ARIMA (2,1,1) X (1,1,5)(6) |
| Forecasting | T1000 Европа:Количество | TA00000009 | двадцать семь | ARIMA (1,0,1) |
| Forecasting | T1000 Северная Америка:Количество | TA00000000a | двадцать семь | ARIMA (1,1,1) |
| Forecasting | T1`000 Pacific:Quantity | TA0000000b | двадцать семь | ARIMA (1,0,3) |
В этих результатах, которые также можно просмотреть с помощью средства просмотра дерева содержимого Microsoft (интеллектуальный анализ данных), вы можете быстро определить, какие последовательности являются полностью линейными, какие имеют несколько периодических структур, и какие обнаружены периодичности.
Например, сокращённая форма уравнения ARIMA для серии M200 для Европы указывает, что был обнаружен лишь цикл по умолчанию или дневной цикл. Короткая форма уравнения представлена в столбце NODE_CAPTION.
Однако для серии M200 Северная Америка была найдена дополнительная периодическая структура. Узел TA00000001 имеет два дочерних узла, один с уравнением (1,0,4) и один с уравнением (1,1,4)(6). Эти уравнения объединяются и представлены в родительском узле.
Для каждой периодической структуры содержимое модели также предоставляет порядок и скользящее среднее значение в качестве дочерних узлов. Например, следующий запрос извлекает дочерние узлы одного из узлов, перечисленных в предыдущем примере. Обратите внимание, что столбец PARENT_UNIQUE_NAME должен быть заключен в скобки с целью отличия от зарезервированного ключевого слова с таким же именем.
SELECT *
FROM Forecasting.CONTENT
WHERE [PARENT_UNIQUE_NAME] = ' TA00000001'
Так как это дерево ARIMA, а не дерево ARTXP, нельзя использовать функцию IsDescendant (DMX) для возврата дочерних узлов этой периодической структуры. Вместо этого можно использовать типы атрибутов и узлов для фильтрации результатов и возврата дочерних узлов, которые предоставляют дополнительные сведения о том, как было создано уравнение, включая скользящие средние и порядок разницы.
SELECT MODEL_NAME, ATTRIBUTE_NAME, NODE_UNIQUE_NAME,
NODE_TYPE, NODE_CAPTION
FROM Forecasting.CONTENT
WHERE [MSOLAP_MODEL_COLUMN] ='M200 North America:Quantity'
AND (NODE_TYPE = 29 or NODE_TYPE = 30)
Пример результатов:
| MODEL_NAME | ATTRIBUTE_NAME | NODE_UNIQUE_NAME | NODE_TYPE | NODE_CAPTION |
|---|---|---|---|---|
| Forecasting | M200 Северная Америка:Количество | TA00000001000000010 | 29 | ARIMA {1,0.961832044807041} |
| Forecasting | M200 Северная Америка:Количество | TA00000001000000011 | 30 | ARIMA {1,-3.51073103693271E-02,2.15731642954099,-0.22031433327742,-1.3315147825858} |
| Forecasting | M200 Северная Америка:Количество | TA00000001000000000 | 29 | ARIMA {1,0.643565911081657} |
| Forecasting | M200 Северная Америка:Количество | TA00000001000000001 | 30 | ARIMA {1,1.45035399809581E-02,-4048928928392752E-02,-0.19203901352577,0.2420249764393} |
В этих примерах показано, что чем дальше вы углубляетесь в исследование дерева ARIMA, тем больше раскрывается деталей, но важная информация также объединяется и представляется в родительском узле.
Формула временных рядов для ARIMA
Чтобы просмотреть полную формулу для любого узла ARIMA, рекомендуется использовать легенду интеллектуального анализа данных средства просмотра временных рядов Майкрософт, которая представляет авторегрессионный порядок, скользящие средние и другие элементы уравнения, уже составленные в согласованном формате.
В этом разделе представлен пример уравнения и объясняется основные термины.
Легенда условных обозначений для формулы ARIMA
В следующем примере показана формула ARIMA для одной части модели, как отображается в легенде интеллектуального анализа данных. Чтобы просмотреть эту формулу, откройте модель прогнозирования с помощью средства просмотра временных рядов Майкрософт, перейдите на вкладку "Модель ", выберите дерево для серии данных R250: Европа , а затем щелкните узел, представляющий ряд дат или после 7/5/2003. Легенда добычи формирует все константы в удобочитаемом формате, показанном в этом примере:
Уравнение ARIMA:
ARIMA ({1,1},0,{1,1.49791920964142,1.10640053499397,0.888873034670339,-5.05429403071953E-02,-0.905265316720334,-0.961908900643379,-0.649991020901922}) Intercept:56.8888888888889
Эта развернутая форма ARIMA, которая включает значения коэффициентов и свободный член. Короткий формат для этого уравнения {1,0,7}, где 1 указывает период в виде количества срезов времени, 0 указывает порядок разницы терминов и 7 указывает количество коэффициентов.
Замечание
Константы вычисляются службами Analysis Services для вычислений дисперсии, но сама константа не отображается в пользовательском интерфейсе. Однако вы можете просмотреть дисперсию для любой точки в серии как функцию этой константы, если выбрать "Показать отклонения" в представлении диаграммы . Подсказка для каждого ряда данных показывает дисперсию для определенной прогнозируемой точки.
Содержимое модели для формулы ARIMA
Модель ARIMA соответствует стандартной структуре с различными сведениями, содержащимися в узлах различных типов. Чтобы просмотреть содержимое модели ARIMA, измените средство просмотра на универсальное средство просмотра содержимого Microsoft, а затем разверните узел с именем атрибута R250 Europe: Quantity.
Модель ARIMA для ряда данных содержит базовое периодическое уравнение в четырех разных форматах, которые можно выбрать в зависимости от приложения.
NODE_CAPTION: Отображает короткий формат уравнения. В коротком формате показано, сколько периодических структур представлено и сколько коэффициентов они имеют. Например, если короткий формат уравнения {4,0,6}равен, узел представляет одну периодическую структуру с 6 коэффициентами. Если короткий формат похож {2,0,8} x {1,0,0}(4), узел содержит две периодические структуры.
ОПИСАНИЕ УЗЛА: Отображает длинный формат уравнения, который также является формой уравнения, отображаемой в легенде майнинга. Длинная форма уравнения аналогична короткой форме, за исключением того, что фактические значения коэффициентов отображаются вместо подсчета.
NODE_RULE: Отображает XML-представление уравнения. В зависимости от типа узла представление XML может включать одно или несколько периодических структур. В следующей таблице показано, как узлы XML свернуты до более высоких уровней модели ARIMA.
| Тип узла | XML-содержимое |
|---|---|
| 27 (корень ARIMA) | Включает все периодические структуры для ряда данных и содержимое всех дочерних узлов для каждой периодической структуры. |
| 28 (периодическая структура ARIMA) | Определяет одну периодическую структуру, включая ее узел авторегрессионного термина и коэффициенты скользящего среднего. |
| 29 (ARIMA Autoregressive) | Перечисляет термины для одной периодической структуры. |
| 30 (Скользящее среднее ARIMA) | Выводит коэффициенты для одной периодической структуры. |
NODE_DISTRIBUTION: Отображает условия уравнения в вложенной таблице, которую можно запросить для получения определенных терминов. Таблица распространения узлов соответствует той же иерархической структуре, что и правила XML. То есть корневой узел серии ARIMA (NODE_TYPE = 27) содержит значение свободного члена и периодичности для полного уравнения, которые могут включать несколько периодичностей, в то время как дочерние узлы содержат только сведения, относящиеся к определенной периодической структуре или дочерним узлам этой периодической структуры.
| Тип узла | Свойство | Тип значения |
|---|---|---|
| 27 (корень ARIMA) | Перехватывать Периодичность |
11 |
| 28 (периодическая структура ARIMA) | Периодичность Автоматическое регрессивное порядок Порядок различий Скользящее среднее порядка |
12 13 15 14 |
| 29 (ARIMA Autoregressive) | Коэффициент (дополнение коэффициента) |
7 |
| 30 (Скользящее среднее ARIMA) | Значение в t Значение в t-1 ... Значение в t-n |
7 |
Значение для скользящего среднего порядка указывает количество скользящих средних в ряде. Как правило, скользящее среднее вычисляется n-1 раз, если в последовательности n членов, но количество может быть сокращено для облегчения вычислений.
Значение авторегрессионного порядка указывает количество авторегрессионных рядов.
Значение для порядка различий указывает, сколько раз сравниваются ряды или отличаются.
Перечисление возможных типов значений см. в разделе Microsoft.AnalysisServices.AdomdServer.MiningValueType.
Использование сведений о дереве ARIMA
Если вы используете прогнозы, основанные на алгоритме ARIMA в бизнес-решении, может потребоваться вставить уравнение в отчет, чтобы продемонстрировать метод, используемый для создания прогноза. С помощью заголовка можно представить формулы в коротком формате или описание, чтобы представить формулы в длинном формате.
Если вы разрабатываете приложение, использующее прогнозы временных рядов, возможно, полезно получить уравнение ARIMA из содержимого модели, а затем сделать собственные прогнозы. Чтобы получить уравнение ARIMA для любых конкретных выходных данных, можно запросить корень ARIMA для этого конкретного атрибута напрямую, как показано в предыдущих примерах.
Если вы знаете идентификатор узла, содержащего нужный ряд, у вас есть два варианта получения компонентов уравнения:
Формат вложенной таблицы: используйте DMX-запрос или запрос через клиент OLEDB.
XML-представление: используйте XML-запрос.
Замечания
Может быть трудно получить информацию из дерева ARTXP, так как информация для каждого разделения находится в другом месте в дереве. Таким образом, с моделью ARTXP необходимо получить все части, а затем выполнить некоторую обработку, чтобы восстановить полную формулу. Получение уравнения из модели ARIMA проще, так как формула была доступна во всем дереве. Сведения о создании запроса для получения этих сведений см. в примерах запросов модели временных рядов.
См. также
Содержимое модели интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных)
Алгоритм временных рядов Майкрософт
Примеры запросов модели временных рядов
Технический справочник по алгоритму временных рядов Майкрософт