Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Se aplica a:
SQL Server 2019 y versiones anteriores de Analysis Services
Azure Analysis Services
Fabric/Power BI Premium
Importante
La minería de datos estaba en desuso en SQL Server 2017 Analysis Services y ahora se descontinuó en SQL Server 2022 Analysis Services. La documentación no se actualiza para las características en desuso y descontinuadas. Para más información, consulte Compatibilidad con versiones anteriores de Analysis Services.
Todos los modelos de minería de datos usan la misma estructura para almacenar su contenido. Esta estructura se define según el conjunto de registros del esquema de contenido para minería de datos. Sin embargo, dentro de esa estructura estándar, los nodos que contienen información se organizan de maneras diferentes para representar varios tipos de árboles. En este tema se describe cómo se organizan los nodos y qué significa cada nodo para los modelos de minería de datos basados en el algoritmo de serie temporal de Microsoft.
Para obtener una explicación del contenido general del modelo de minería de datos que se aplica a todos los tipos de modelo, vea Contenido del modelo de minería de datos (Analysis Services - Minería de datos).
Al revisar este tema, es posible que le resulte útil seguir navegando por los contenidos de un modelo de serie temporal. Puede crear un modelo de serie temporal completando el tutorial Básico de minería de datos. El modelo que se crea en el tutorial es un modelo mixto que entrena los datos mediante los algoritmos ARIMA y ARTXP. Para obtener información sobre cómo ver el contenido de un modelo de minería de datos, consulte Visores de modelos de minería de datos.
Descripción de la estructura de un modelo de serie temporal
Un modelo de serie temporal tiene un único nodo primario que representa el modelo y sus metadatos. Debajo de ese nodo primario, hay uno o dos árboles de serie temporal, en función del algoritmo que usó para crear el modelo.
Si crea un modelo mixto, se agregan dos árboles independientes al modelo, uno para ARIMA y otro para ARTXP. Si decide usar solo el algoritmo ARTXP o solo el algoritmo ARIMA, tendrá un único árbol que corresponda a ese algoritmo. Especifique el algoritmo que se va a usar estableciendo el parámetro FORECAST_METHOD. Para obtener más información sobre si usar ARTXP, ARIMA o un modelo mixto, consulte Algoritmo de serie temporal de Microsoft.
En el diagrama siguiente se muestra un ejemplo de un modelo de minería de datos de serie temporal que se creó con la configuración predeterminada para crear un modelo mixto. Para que pueda comparar más fácilmente las diferencias entre los dos modelos, aquí se muestra el modelo ARTXP en el lado izquierdo del diagrama y el modelo ARIMA se muestra en el lado derecho del diagrama. Mientras que ARTXP es una estructura similar a un árbol que se divide en ramas más pequeñas y pequeñas, la estructura creada por el algoritmo ARIMA es más similar a una pirámide construida hacia arriba a partir de componentes más pequeños.
El punto importante que debe recordar es que la información se organiza dentro de los árboles ARIMA y ARTXP de maneras completamente diferentes, y debe considerar los dos árboles como relacionados solo en el nodo raíz. Aunque las dos representaciones se presentan en un modelo para mayor comodidad, deben tratarse como dos modelos independientes. ARTXP representa una estructura de árbol real, pero ARIMA no.
Cuando se usa el Visor de árbol de contenido del modelo genérico de Microsoft para ver un modelo que usa ARIMA y ARTXP, los nodos de los modelos ARTXP y ARIMA se presentan como nodos secundarios del modelo de serie temporal principal. Sin embargo, puede distinguirlos fácilmente por las etiquetas aplicadas a los nodos.
El primer conjunto de nodos se etiqueta (All) y representa los resultados del análisis por parte del algoritmo ARTXP.
El segundo conjunto de nodos se etiqueta como ARIMA y representa los resultados del análisis por parte del algoritmo ARIMA.
Advertencia
El nombre (All) del árbol ARTXP solo se conserva por motivos de compatibilidad con versiones anteriores. Antes de SQL Server 2008, el algoritmo de serie temporal usaba un único algoritmo para el análisis, el algoritmo ARTXP.
En las secciones siguientes se explica cómo se organizan los nodos dentro de cada uno de estos tipos de modelo.
Estructura de un modelo ARTXP
El algoritmo ARTXP crea un modelo similar a un modelo de árboles de decisión. Agrupa atributos predecibles y los divide cada vez que se encuentran diferencias significativas. Por lo tanto, cada modelo ARTXP contiene una rama independiente para cada atributo de predicción. Por ejemplo, el tutorial básico de minería de datos crea un modelo que predice la cantidad de ventas de varias regiones. En este caso, [Amount] es el atributo de predicción y se crea una rama independiente para cada región. Si tuviera dos atributos predecibles, [Amount] y [Quantity],, se crearía una rama independiente para cada combinación de un atributo y una región.
El nodo superior de la rama ARTXP contiene la misma información que se encuentra en un nodo raíz del árbol de decisión. Esto incluye el número de nodos hijos de ese nodo (CHILDREN_CARDINALITY), el número de casos que cumplen las condiciones de este nodo (NODE_SUPPORT) y una variedad de estadísticas descriptivas (NODE_DISTRIBUTION).
Si el nodo no tiene hijos, esto significa que no se encontraron condiciones significativas que justificaran la división de los casos en nuevos subgrupos. La rama termina en este punto y el nodo se denomina nodo hoja. El nodo hoja contiene los atributos, coeficientes y valores que son los bloques de creación de la fórmula ARTXP.
Algunas ramas pueden tener divisiones adicionales, similares a un modelo de árboles de decisión. Por ejemplo, la rama del árbol que representa las ventas de la región de Europa se divide en dos ramas. Una división se produce cuando se encuentra una condición que provoca una diferencia significativa entre los dos grupos. El nodo primario indica el nombre del atributo que provocó la división, como [Amount] y cuántos casos hay en el nodo primario. Los nodos hoja proporcionan más detalles: el valor del atributo, como [Sales] >10 000 frente a [Sales] < 10 000), el número de casos que admiten cada condición y la fórmula ARTXP.
Nota:
Si desea ver las fórmulas, puede encontrar la fórmula de regresión completa en el nivel de nodo hoja, pero no en un nodo intermedio o raíz.
Estructura de un modelo ARIMA
El algoritmo ARIMA crea un solo fragmento de información para cada combinación de una serie de datos (como [Región]) y un atributo de predicción (como [Sales Amount]), la ecuación que describe el cambio del atributo de predicción a lo largo del tiempo.
La ecuación de cada serie se deriva de varios componentes, uno para cada estructura periódica que se encontró en los datos. Por ejemplo, si tiene datos de ventas que se recopilan mensualmente, el algoritmo podría detectar estructuras periódicas mensuales, trimestrales o anuales.
El algoritmo genera un conjunto independiente de nodos primarios y secundarios para cada periodicidad que encuentra. La periodicidad predeterminada es 1, para un único segmento de tiempo y se agrega automáticamente a todos los modelos. Puede especificar posibles estructuras periódicas escribiendo varios valores en el parámetro PERIODICITY_HINT. Sin embargo, si el algoritmo no detecta una estructura periódica, no generará resultados para esa sugerencia.
Cada estructura periódica que se genera en el contenido del modelo contiene los siguientes nodos de componente:
Un nodo para el orden autorregresivo (AR)
Un nodo para la media móvil (MA)
Para obtener información sobre el significado de estos términos, vea Algoritmo de serie temporal de Microsoft.
El orden de diferencia es una parte importante de la fórmula y se representa en la ecuación. Para obtener más información sobre cómo se usa el orden de diferencia, consulte Referencia técnica del algoritmo de serie temporal de Microsoft.
Contenido del modelo para series temporales
En esta sección se proporcionan detalles y ejemplos solo para esas columnas del contenido del modelo de minería de datos que tienen especial relevancia para los modelos de serie temporal.
Para obtener información sobre las columnas de uso general del conjunto de filas de esquema, como MODEL_CATALOG y MODEL_NAME, o para obtener explicaciones de la terminología del modelo de minería de datos, vea Contenido del modelo de minería de datos (Analysis Services - Minería de datos).
MODEL_CATALOG
Nombre de la base de datos donde se almacena el modelo.
MODEL_NAME
Nombre del modelo.
ATTRIBUTE_NAME
Atributo de predicción de la serie de datos representada en el nodo. (El mismo valor que para MSOLAP_MODEL_COLUMN).
NODE_NAME
El nombre del nodo.
Actualmente, esta columna contiene el mismo valor que NODE_UNIQUE_NAME, aunque esto podría cambiar en futuras versiones.
NODE_UNIQUE_NAME
Nombre único del nodo. El nodo primario del modelo siempre se denomina TS.
ARTXP: Cada nodo se representa mediante TS seguido de un valor numérico hexadecimal. El orden de los nodos no es importante.
Por ejemplo, los nodos ARTXP directamente debajo del árbol de TS se pueden numerar TS00000001-TS00000000b.
ARIMA: Cada nodo de un árbol ARIMA se representa mediante TA seguido de un valor numérico hexadecimal. Los nodos secundarios contienen el nombre único del nodo primario seguido de otro número hexadecimal que indica la secuencia dentro del nodo.
Todos los árboles ARIMA están estructurados exactamente iguales. Cada raíz contiene los nodos y la convención de nomenclatura que se ejemplifica en la tabla siguiente:
| Identificador y tipo de nodo ARIMA | Ejemplo de nombre de nodo |
|---|---|
| Raíz ARIMA (27) | TA0000000b |
| Estructura Periódica ARIMA (28) | TA0000000b00000000 |
| ARIMA Auto Regresiva (29) | TA0000000b000000000 |
| Promedio móvil ARIMA (30) | TA0000000b000000001 |
NODE_TYPE
Un modelo de serie temporal genera los siguientes tipos de nodo, en función del algoritmo.
ARTXP:
| Id. de tipo de nodo | Description |
|---|---|
| 1 (Modelo) | Serie temporal |
| 3 (Interior) | Representa una rama interior dentro de un árbol de series temporales ARTXP. |
| 16 (árbol de serie temporal) | Raíz del árbol ARTXP que corresponde a un atributo y serie predecibles. |
| 15 (serie temporal) | Nodo hoja en el árbol ARTXP. |
ARIMA:
| Id. de tipo de nodo | Description |
|---|---|
| 27 (raíz ARIMA) | Nodo superior de un árbol ARIMA. |
| 28 (Estructura periódica ARIMA) | Componente de un árbol ARIMA que describe una única estructura periódica. |
| 29 (ARIMA Autoregressive) | Contiene un coeficiente para una única estructura periódica. |
| 30 (MEDIA móvil ARIMA) | Contiene un coeficiente para una única estructura periódica. |
NODE_CAPTION
Etiqueta o título asociado al nodo.
Esta propiedad es principalmente para fines de visualización.
ARTXP: Contiene la condición de división para el nodo, que se muestra como una combinación de atributo y intervalo de valores.
ARIMA: Contiene la forma abreviada de la ecuación ARIMA.
Para obtener información sobre el formato de la ecuación ARIMA, consulte Guía de Minería para ARIMA.
CHILDREN_CARDINALITY
Número de hijos directos que tiene el nodo.
PARENT_UNIQUE_NAME
Nombre único del elemento primario del nodo. Se devuelve NULL para cualquier nodo en el nivel raíz.
NODE_DESCRIPTION
Descripción en el texto de las reglas, divisiones o fórmulas del nodo actual.
ARTXP: Para obtener más información, vea Descripción del árbol ARTXP.
ARIMA: Para obtener más información, vea Descripción del árbol ARIMA.
NODE_RULE
Descripción XML de las reglas, divisiones o fórmulas en el nodo actual.
ARTXP: El NODE_RULE normalmente corresponde al NODE_CAPTION.
ARIMA: Para obtener más información, vea Descripción del árbol ARIMA.
MARGINAL_RULE
Descripción XML de la división o el contenido que es específico de ese nodo.
ARTXP: El MARGINAL_RULE se corresponde generalmente con el NODE_DESCRIPTION.
ARIMA: Siempre en blanco; use NODE_RULE en su lugar.
NODE_PROBABILITY
ARTXP: Para los nodos de árbol, siempre es 1. En el caso de los nodos hoja, la probabilidad de alcanzar el nodo desde el nodo raíz del modelo.
ARIMA: Siempre 0.
MARGINAL_PROBABILITY
ARTXP: Para los nodos de árbol, siempre es 1. Para los nodos hoja, la probabilidad de alcanzar el nodo desde el nodo primario inmediato.
ARIMA: Siempre 0.
NODE_DISTRIBUTION
Tabla que contiene el histograma de probabilidad del nodo. En un modelo de serie temporal, esta tabla anidada contiene todos los componentes necesarios para ensamblar la fórmula de regresión real.
Para obtener más información sobre la tabla de distribución de nodos en un árbol ARTXP, vea Descripción del árbol ARTXP.
Para obtener más información sobre la tabla de distribución de nodos en un árbol ARIMA, vea Descripción del árbol ARIMA.
Si desea ver todas las constantes y otros componentes compuestos en un formato legible, use el Visor de series temporales, haga clic en el nodo y abra la leyenda de minería de datos.
NODE_SUPPORT
Número de casos que admiten este nodo.
ARTXP: Para el nodo (Todos), indica el número total de segmentos de tiempo incluidos en la rama.
En el caso de los nodos de terminal, indica el número de segmentos de tiempo que se incluyen en el intervalo descrito por NODE_CAPTION. El número de segmentos de tiempo de los nodos de terminal siempre suma al valor NODE_SUPPORT del nodo de rama (Todos).
ARIMA: Recuento de casos que admiten la estructura periódica actual. El valor de soporte se repite en todos los nodos de la estructura periódica actual.
MSOLAP_MODEL_COLUMN
Atributo de predicción de la serie de datos representada en el nodo. (El mismo valor que para ATTRIBUTE_NAME).
MSOLAP_NODE_SCORE
Valor numérico que caracteriza el valor de información del árbol o división.
ARTXP: El valor siempre es 0,0 para los nodos sin una división. En el caso de los nodos con una división, el valor representa la puntuación de interés de la división.
Para obtener más información sobre los métodos de puntuación, consulte Selección de características (minería de datos).
ARIMA: Puntuación del criterio de información bayesiano (BIC) del modelo ARIMA. La misma puntuación se establece en todos los nodos ARIMA relacionados con la ecuación.
MSOLAP_NODE_SHORT_CAPTION
ARTXP: La misma información que el NODE_DESCRIPTION.
ARIMA: La misma información que el NODE_CAPTION: es decir, la forma abreviada de la ecuación ARIMA.
Descripción del árbol ARTXP
El modelo ARTXP separa claramente las áreas de los datos que son lineales de las áreas de los datos que se dividen en algún otro factor. Siempre que los cambios en el atributo de predicción se puedan representar directamente como una función de las variables independientes, se calcula una fórmula de regresión para representar esa relación.
Por ejemplo, si hay una correlación directa entre el tiempo y las ventas de la mayoría de las series de datos, cada serie se incluiría dentro de un árbol de serie temporal (NODE_TYPE =16) que no tiene nodos secundarios para cada serie de datos, solo una ecuación de regresión. Sin embargo, si la relación no es lineal, un árbol de series temporales ARTXP puede dividirse en nodos secundarios según las condiciones, al igual que un modelo de árbol de decisión. Al ver el contenido del modelo en el Visor de árbol de contenido genérico de Microsoft , puede ver dónde se producen las divisiones y cómo afecta a la línea de tendencia.
Para comprender mejor este comportamiento, puede revisar el modelo de serie temporal creado en el Tutorial básico de minería de datos. Este modelo, basado en el almacenamiento de datos AdventureWorks, no usa datos especialmente complejos. Por lo tanto, no hay muchas divisiones en el árbol ARTXP. Sin embargo, incluso este modelo relativamente simple ilustra tres tipos diferentes de divisiones:
La línea de tendencia [Amount] para la región del Pacífico se desglosa según la clave de tiempo. Una división en la clave de tiempo significa que hay un cambio en la tendencia en un momento dado. La línea de tendencia era lineal solo hasta un punto determinado y, a continuación, la curva presupone una forma diferente. Por ejemplo, una serie temporal puede continuar hasta el 6 de agosto de 2002 y otra serie temporal comienza después de esa fecha.
La línea de tendencia [Amount] de la región Norteamérica se divide en otra variable. En este caso, la tendencia para Norteamérica se divide en función del valor del mismo modelo en la región de Europa. En otras palabras, el algoritmo detectó que cuando cambia el valor de Europa, también cambia el valor de Norteamérica A.
La línea de tendencia de la región de Europa se divide en sí misma.
¿Qué significa cada división? Interpretar la información transmitida por el contenido del modelo es un arte que requiere un profundo conocimiento de los datos y su significado en el contexto empresarial.
El vínculo aparente entre las tendencias de las regiones de Norteamérica y Europa puede indicar únicamente que la serie de datos para Europa tiene más entropía, lo que hace que la tendencia para Norteamérica parezca más débil. O bien, podría no haber ninguna diferencia significativa en la puntuación de los dos, y la correlación podría ser accidental, basándose simplemente en la computación de Europa antes de calcular Norteamérica. Sin embargo, es posible que quiera revisar los datos y asegurarse de si la correlación es falsa o investigar para ver si algún otro factor podría estar implicado.
La división en la clave temporal significa que hay un cambio estadísticamente significativo en el gradiente de la línea. Esto podría deberse a factores matemáticos como la compatibilidad con cada rango o los cálculos de entropía necesarios para la división. Por lo tanto, esta división podría no ser interesante en términos del significado del modelo en el mundo real. Sin embargo, al revisar el período de tiempo indicado en la división, es posible que encuentre correlaciones interesantes que no están representadas en los datos, como una promoción de ventas u otro evento que comenzó en ese momento y que pueden haber afectado a los datos.
Si los datos contenían otros atributos, es muy probable que vea ejemplos más interesantes de bifurcación en el árbol. Por ejemplo, si realiza un seguimiento de la información meteorológica y la usó como atributo para el análisis, es posible que vea varias divisiones en el árbol que representan la interacción compleja de las ventas y el clima.
En resumen, la minería de datos es útil para proporcionar sugerencias sobre dónde se producen fenómenos potencialmente interesantes, pero es necesaria una investigación más detallada y la experiencia de los usuarios empresariales para interpretar con precisión el valor de la información en el contexto.
Elementos de la fórmula de serie temporal ARTXP
Para ver la fórmula completa de un árbol o rama ARTXP, se recomienda usar la Leyenda de Minería del Visor de Series Temporales de Microsoft, que presenta todas las constantes en un formato legible.
En la siguiente sección se presenta una ecuación de ejemplo y se explican los términos básicos.
Leyenda de minería para una fórmula ARTXP
En el ejemplo siguiente se muestra la fórmula ARTXP para una parte del modelo, tal como se presenta en la Leyenda de minería. Para ver esta fórmula, abra el modelo [Previsión] que creó en el Tutorial básico de minería de datos en el visor de Serie temporal de Microsoft, haga clic en la pestaña Modelo y seleccione el árbol de la serie de datos R250: Europa.
Para ver la ecuación usada para este ejemplo, haga clic en el nodo que representa la serie de fechas en o después del 7/5/2003.
Ejemplo de ecuación de nodo de árbol:
Quantity = 21.322 -0.293 * Quantity(R250 North America,-7) + 0.069 * Quantity(R250 Europe,-1) + 0.023 * Quantity(R250 Europe,-3) -0.142 * Quantity(R750 Europe,-8)
En este caso, el valor 21.322 representa el valor que se predice para Quantity como función de los siguientes elementos de la ecuación.
Por ejemplo, un elemento es Quantity(R250 North America,-7). Esta notación significa la cantidad para la región de Norteamérica en t-7, o siete intervalos de tiempo antes del intervalo de tiempo actual. El valor de esta serie de datos se multiplica por el coeficiente -0,293. El coeficiente de cada elemento se deriva durante el proceso de entrenamiento y se basa en las tendencias de los datos.
Hay varios elementos en esta ecuación porque el modelo ha calculado que la cantidad del modelo R250 en la región de Europa depende de los valores de varias otras series de datos.
Contenido del modelo para una fórmula ARTXP
En la tabla siguiente se muestra la misma información para la fórmula, usando el contenido del nodo pertinente como se muestra en el Visor de árbol de contenido genérico de Microsoft (minería de datos).
| ATTRIBUTE_NAME | ATTRIBUTE_VALUE | SOPORTE TÉCNICO | PROBABILIDAD | VARIANZA | VALUETYPE |
|---|---|---|---|---|---|
| Cantidad(R250 Europa, y-intercept) | 21.3223433563772 | 11 | 0 | 1.65508795539661 | 11 (Interceptación) |
| Cantidad(R250 Europe,-1) | 0.0691694140876526 | 0 | 0 | 0 | 7 (coeficiente) |
| Quantity(R250 Europe,-1) | 20.6363635858123 | 0 | 0 | 182.380682874818 | 9 (Estadísticas) |
| Cantidad(R750 Europa,-8) | -0.1421203048299 | 0 | 0 | 0 | 7 (coeficiente) |
| Cantidad (R750 Europe,-8) | 22.5454545333019 | 0 | 0 | 104.362130048408 | 9 (Estadísticas) |
| Cantidad(R250 Europe,-3) | 0.0234095979448281 | 0 | 0 | 0 | 7 (coeficiente) |
| Quantity(R250 Europe,-3) | 24,8181818883176 | 0 | 0 | 176.475304989169 | 9 (Estadísticas) |
| Quantity(R250 Norteamérica,-7) | -0.292914186039869 | 0 | 0 | 0 | 7 (coeficiente) |
| Quantity(R250 América del Norte,-7) | 10.36363640433 | 0 | 0 | 701.882534898676 | 9 (Estadísticas) |
Como puede ver al comparar estos ejemplos, el contenido del modelo de minería contiene la misma información que está disponible en la Leyenda de Minería, pero con columnas adicionales para varianza y apoyo. El valor de soporte indica el recuento de casos que respaldan la tendencia descrita por esta ecuación.
Uso de la fórmula de serie temporal ARTXP
Para la mayoría de los usuarios empresariales, el valor del contenido del modelo ARTXP es que combina una vista de árbol y una representación lineal de los datos.
Si los cambios en el atributo de predicción se pueden representar como una función lineal de las variables independientes, el algoritmo calculará automáticamente la ecuación de regresión y generará esa serie en un nodo independiente.
Siempre que la relación no se puede expresar como una correlación lineal, la serie temporal se bifurca como un árbol de decisión.
Al examinar el contenido del modelo en el Visor de serie temporal de Microsoft , puede ver dónde se produce la división y cómo afecta a la línea de tendencia.
Si existe una correlación directa entre el tiempo y las ventas de cualquier parte de la serie de datos, la manera más fácil de obtener la fórmula es copiar la fórmula de la leyenda de minería de datos y, a continuación, pegarla en un documento o presentación para ayudar a explicar el modelo. Como alternativa, puede extraer la media, el coeficiente y otra información de la tabla de NODE_DISTRIBUTION para ese árbol y usarla para calcular extensiones de la tendencia. Si toda la serie muestra una relación lineal coherente, la ecuación se encuentra en el nodo (Todos). Si hay alguna bifurcación en el árbol, la ecuación se encuentra en el nodo hoja.
La siguiente consulta devuelve todos los nodos hoja ARTXP de un modelo de minería, junto con la tabla anidada NODE_DISTRIBUTION, que contiene la ecuación.
SELECT MODEL_NAME, ATTRIBUTE_NAME, NODE_NAME,
NODE_CAPTION,
(SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE, [VARIANCE], VALUETYPE
FROM NODE_DISTRIBUTION) as t
FROM Forecasting.CONTENT
WHERE NODE_TYPE = 15
Descripción del árbol ARIMA
Cada estructura de un modelo ARIMA corresponde a una estructura periódica o periódica. Una estructura periódica es un patrón de datos que se repite en toda la serie de datos. Se permite alguna variación menor en el patrón, dentro de los límites estadísticos. La periodicidad se mide según las unidades de tiempo predeterminadas que se usaron en los datos de entrenamiento. Por ejemplo, si los datos de entrenamiento proporcionan datos de ventas para cada día, la unidad de hora predeterminada es un día y todas las estructuras periódicas se definen como un número especificado de días.
Cada período detectado por el algoritmo obtiene su propio nodo de estructura. Por ejemplo, si está analizando los datos de ventas diarias, el modelo podría detectar estructuras periódicas que representan semanas. En este caso, el algoritmo creará dos estructuras periódicas en el modelo terminado: una para el período diario predeterminado, que se indica como {1}y una para semanas, indicadas por {7}.
Por ejemplo, la consulta siguiente devuelve todas las estructuras ARIMA de un modelo de minería de datos.
SELECT MODEL_NAME, ATTRIBUTE_NAME, NODE_NAME, NODE_CAPTION
FROM Forecasting.CONTENT
WHERE NODE_TYPE = 27
Resultados de ejemplo:
| MODEL_NAME | ATTRIBUTE_NAME | NODE_NAME | NODE_TYPE | NODE_CAPTION |
|---|---|---|---|---|
| Forecasting | M200 Europe:Cantidad | TA00000000 | 27 | ARIMA (1,0,1) |
| Forecasting | M200 Norteamérica:Cantidad | TA00000001 | 27 | ARIMA (1,0,4) X (1,1,4)(6) |
| Forecasting | M200 Pacific:Cantidad | TA00000002 | 27 | ARIMA (2,0,8) X (1,0,0)(4) |
| Forecasting | M200 Pacific:Cantidad | TA00000002 | 27 | ARIMA (2,0,8) X (1,0,0)(4) |
| Forecasting | R250 Europe:Cantidad | TA00000003 | 27 | ARIMA (1,0,7) |
| Forecasting | R250 América del Norte: Cantidad | TA00000004 | 27 | ARIMA (1,0,2) |
| Forecasting | R250 Pacific:Cantidad | TA00000005 | 27 | ARIMA (2,0,2) X (1,1,2)(12) |
| Forecasting | R750 Europa: Cantidad | TA00000006 | 27 | ARIMA (2,1,1) X (1,1,5)(6) |
| Forecasting | T1000 Europe:Cantidad | TA00000009 | 27 | ARIMA (1,0,1) |
| Forecasting | T1000 Norteamérica:Cantidad | TA00000000a | 27 | ARIMA (1,1,1) |
| Forecasting | T1`000 Pacific:Quantity | TA0000000b | 27 | ARIMA (1,0,3) |
A partir de estos resultados, que también puede examinar mediante el Visor de árboles de contenido genérico de Microsoft (minería de datos), puede saber de un vistazo qué series son completamente lineales, que tienen varias estructuras periódicas y cuáles son las periodicidades detectadas.
Por ejemplo, la forma abreviada de la ecuación ARIMA para la serie M200 Europa indica que solo se detectó el ciclo predeterminado o diario. La forma abreviada de la ecuación se proporciona en la columna NODE_CAPTION.
Sin embargo, para la serie M200 Norteamérica, se encontró una estructura periódica adicional. El nodo TA00000001 tiene dos nodos secundarios, uno con la ecuación (10,4) y otro con la ecuación (1,1,1,4)(6). Estas ecuaciones se concatenan y se presentan en el nodo primario.
Para cada estructura periódica, el contenido del modelo también proporciona el orden y la media móvil como nodos secundarios. Por ejemplo, la consulta siguiente recupera los nodos secundarios de uno de los nodos enumerados en el ejemplo anterior. Tenga en cuenta que la columna, PARENT_UNIQUE_NAME, debe incluirse entre corchetes para distinguirla de la palabra clave reservada del mismo nombre.
SELECT *
FROM Forecasting.CONTENT
WHERE [PARENT_UNIQUE_NAME] = ' TA00000001'
Dado que se trata de un árbol ARIMA, no un árbol ARTXP, no se puede usar la función IsDescendant (DMX) para devolver los nodos secundarios de esta estructura periódica. En su lugar, puede usar los tipos de atributo y nodo para filtrar los resultados y devolver los nodos secundarios que proporcionan más detalles sobre cómo se creó la ecuación, incluidos los promedios móviles y el orden de diferencia.
SELECT MODEL_NAME, ATTRIBUTE_NAME, NODE_UNIQUE_NAME,
NODE_TYPE, NODE_CAPTION
FROM Forecasting.CONTENT
WHERE [MSOLAP_MODEL_COLUMN] ='M200 North America:Quantity'
AND (NODE_TYPE = 29 or NODE_TYPE = 30)
Resultados de ejemplo:
| MODEL_NAME | ATTRIBUTE_NAME | NODE_UNIQUE_NAME | NODE_TYPE | NODE_CAPTION |
|---|---|---|---|---|
| Forecasting | M200 Norteamérica:Cantidad | TA00000001000000010 | 29 | ARIMA {1,0.961832044807041} |
| Forecasting | M200 Norteamérica:Cantidad | TA00000001000000011 | 30 | ARIMA {1,-3.51073103693271E-02,2.15731642954099,-0.22031434327742,-1.3315151478258758} |
| Forecasting | M200 Norteamérica:Cantidad | TA00000001000000000 | 29 | ARIMA {1,0.643565911081657} |
| Forecasting | M200 Norteamérica:Cantidad | TA00000001000000001 | 30 | ARIMA {1,1.45035399809581E-02,-4.4048928392752E-02,-0.19203901352577,0.242202497643993} |
Estos ejemplos ilustran que cuanto más exploras el árbol ARIMA, más detalles se revelan, pero la información importante también se combina y se presenta en el nodo padre.
Fórmula de serie temporal para ARIMA
Para ver la fórmula completa de cualquier nodo ARIMA, se recomienda usar la Leyenda de Minería del Microsoft Time Series Viewer, que presenta el orden autorregresivo, las medias móviles y otros elementos de la ecuación ya compuestos en un formato coherente.
En esta sección se presenta una ecuación de ejemplo y se explican los términos básicos.
Leyenda de minería de datos para la fórmula ARIMA
En el ejemplo siguiente se muestra la fórmula ARIMA para una parte del modelo, tal como se muestra en la Leyenda de Minería. Para ver esta fórmula, abra el modelo de previsión mediante el visor de series temporales de Microsoft, haga clic en la pestaña Modelo , seleccione el árbol de la serie de datos R250: Europa y, a continuación, haga clic en el nodo que representa la serie de fechas en o después del 7/5/2003. La leyenda de minería de datos compone todas las constantes en un formato legible, que se muestra en este ejemplo:
Ecuación ARIMA:
ARIMA ({1,1},0,{1,1.49791920964142,1.10640053499397,0.888873034670339,-5.05429403071953E-02,-0.905265316720334,-0.961908900643379,-0.649991020901922}) Intercept:56.8888888888889
Esta ecuación es el formato ARIMA largo, que incluye los valores de los coeficientes y el intercepto. El formato corto de esta ecuación sería {1,0,7}, donde 1 indica el período como recuento de segmentos de tiempo, 0 indica el orden de diferencia de términos y 7 indica el número de coeficientes.
Nota:
Analysis Services calcula una constante para calcular la varianza, pero la propia constante no se muestra en ninguna parte de la interfaz de usuario. Sin embargo, puede ver la varianza de cualquier punto de la serie como función de esta constante si selecciona Mostrar desviaciones, en la vista Gráfico . El tooltip de cada serie de datos muestra la variación de un punto específico predicho.
Contenido del modelo para la fórmula ARIMA
Un modelo ARIMA sigue una estructura estándar, con información diferente contenida en nodos de distintos tipos. Para ver el contenido del modelo para el modelo ARIMA, cambie el visor al Visor de árbol de contenido genérico de Microsoft y, a continuación, expanda el nodo que tiene el nombre del atributo R250 Europe: Quantity.
Un modelo ARIMA para una serie de datos contiene la ecuación periódica básica en cuatro formatos diferentes, entre los que puede elegir en función de la aplicación.
NODE_CAPTION: Muestra el formato corto de la ecuación. El formato corto indica cuántas estructuras periódicas se representan y cuántos coeficientes tienen. Por ejemplo, si el formato corto de la ecuación es {4,0,6}, el nodo representa una estructura periódica con 6 coeficientes. Si el formato corto es algo similar a {2,0,8} x {1,0,0}(4), el nodo contiene dos estructuras periódicas.
DESCRIPCIÓN DEL NODO: Muestra el formato largo de la ecuación, que también es la forma de la ecuación que aparece en la Leyenda de Minería. La forma larga de la ecuación es similar a la forma abreviada, salvo que los valores reales de los coeficientes se muestran en lugar de contarse.
NODE_RULE: Muestra una representación XML de la ecuación. En función del tipo de nodo, la representación XML puede incluir estructuras únicas o varias periódicas. En la tabla siguiente se muestra cómo se acumulan los nodos XML hasta niveles superiores del modelo ARIMA.
| Tipo de nodo | Contenido XML |
|---|---|
| 27 (raíz ARIMA) | Incluye todas las estructuras periódicas de la serie de datos y el contenido de todos los nodos secundarios para cada estructura periódica. |
| 28 (Estructura periódica ARIMA) | Define una única estructura periódica, incluido su nodo de término autorregresivo y sus coeficientes de media móvil. |
| 29 (ARIMA Autoregressive) | Enumera los términos de una única estructura periódica. |
| 30 (MEDIA móvil ARIMA) | Enumera los coeficientes de una sola estructura periódica. |
NODE_DISTRIBUTION: Muestra los términos de la ecuación en una tabla anidada, que puede consultar para obtener términos específicos. La tabla de distribución de nodos sigue la misma estructura jerárquica que las reglas XML. Es decir, el nodo raíz de la serie ARIMA (NODE_TYPE = 27) contiene el valor de interceptación y las periodicidades de la ecuación completa, que pueden incluir varias periodicidades, mientras que los nodos secundarios solo contienen información específica de una determinada estructura periódica o a los nodos secundarios de esa estructura periódica.
| Tipo de nodo | Atributo | Tipo de valor |
|---|---|---|
| 27 (raíz ARIMA) | Interceptar Periodicidad |
11 |
| 28 (Estructura periódica ARIMA) | Periodicidad Orden regresivo automático Orden de diferencias Orden medio móvil |
12 13 15 14 |
| 29 (ARIMA Autoregressive) | Coeficiente (complemento del coeficiente) |
7 |
| 30 (MEDIA móvil ARIMA) | Valor en t Valor en t-1 ... Valor en t-n |
7 |
El valor del orden de media móvil indica el número de medias móviles en una serie. Por lo general, la media móvil se calcula n-1 veces si hay n términos en una serie, pero el número de veces se puede reducir para facilitar el cálculo.
El valor del orden autorregresivo indica el número de series autorregresivas.
El valor del orden de diferencia indica cuántas veces se comparan las series o se diferencian.
Para obtener una enumeración de los posibles tipos de valor, vea Microsoft.AnalysisServices.AdomdServer.MiningValueType.
Uso de la información del árbol ARIMA
Si usa predicciones basadas en el algoritmo ARIMA de una solución empresarial, es posible que desee pegar la ecuación en un informe para demostrar el método que se usó para crear la predicción. Puede usar el título para presentar las fórmulas en formato corto o la descripción para presentar las fórmulas en formato largo.
Si va a desarrollar una aplicación que usa predicciones de series temporales, es posible que le resulte útil obtener la ecuación ARIMA del contenido del modelo y, a continuación, realizar sus propias predicciones. Para obtener la ecuación ARIMA para cualquier salida determinada, puede consultar la raíz ARIMA para ese atributo concreto directamente, como se muestra en los ejemplos anteriores.
Si conoce el identificador del nodo que contiene la serie que desea, tiene dos opciones para recuperar los componentes de la ecuación:
Formato de tabla anidada: use una consulta DMX o una consulta a través del cliente OLEDB.
Representación XML: utilice una consulta XML.
Observaciones
Puede ser difícil recuperar información de un árbol ARTXP, ya que la información de cada división está en un lugar diferente dentro del árbol. Por lo tanto, con un modelo ARTXP, debe obtener todas las piezas y, a continuación, realizar algún procesamiento para reconstituir la fórmula completa. Recuperar una ecuación de un modelo ARIMA es más fácil porque la fórmula se ha puesto a disposición en todo el árbol. Para obtener información sobre cómo crear una consulta para recuperar esta información, vea Ejemplos de consultas del modelo de serie temporal.
Véase también
Contenido del modelo de minería de datos (Analysis Services - Minería de datos)
Algoritmo de serie temporal de Microsoft
Ejemplos de consultas del modelo de serie temporal
Referencia técnica del algoritmo de serie temporal de Microsoft