Partilhar via


Conteúdo do modelo de mineração para modelos de regressão logística

Aplica-se a: SQL Server 2019 e anteriores Analysis Services Azure Analysis Services Fabric/Power BI Premium

Importante

A mineração de dados foi preterida no SQL Server 2017 Analysis Services e agora descontinuada no SQL Server 2022 Analysis Services. A documentação não é atualizada para recursos preteridos e descontinuados. Para saber mais, consulte Compatibilidade com versões anteriores do Analysis Services.

Este tópico descreve conteúdos de modelos de mineração específicos para modelos que utilizam o algoritmo Microsoft Logistic Regression. Para uma explicação de como interpretar estatísticas e estrutura partilhadas por todos os tipos de modelos, e definições gerais de termos relacionados com o conteúdo de modelos de mineração, veja Mining Model Content (Serviços de Análise - Mineração de Dados).

Compreensão da Estrutura de um Modelo de Regressão Logística

Um modelo de regressão logística é criado utilizando o algoritmo Microsoft Neural Network com parâmetros que restringem o modelo para eliminar o nó oculto. Portanto, a estrutura global de um modelo de regressão logística é quase idêntica à de uma rede neural: cada modelo tem um único nó pai que representa o modelo e os seus metadados, e um nó especial de estatística marginal (NODE_TYPE = 24) que fornece estatísticas descritivas sobre as entradas usadas no modelo.

Além disso, o modelo contém uma sub-rede (NODE_TYPE = 17) para cada atributo previsível. Tal como num modelo de rede neural, cada sub-rede contém sempre dois ramos: um para a camada de entrada e outro ramo que contém a camada oculta (NODE_TYPE = 19) e a camada de saída (NODE_TYPE = 20) para a rede. A mesma sub-rede pode ser usada para múltiplos atributos se forem especificados como apenas previsíveis. Atributos previsíveis que também são entradas podem não aparecer na mesma subrede.

No entanto, num modelo de regressão logística, o nó que representa a camada escondida está vazio e não tem descendentes. Assim, o modelo contém nós que representam saídas individuais (NODE_TYPE = 23) e entradas individuais (NODE_TYPE = 21), mas não nós ocultos individuais.

Estrutura do conteúdo para o modelo de regressão logística

Por padrão, um modelo de regressão logística é apresentado no Microsoft Neural Network Viewer. Com este visualizador personalizado, podes filtrar os atributos de entrada e os seus valores, e ver graficamente como afetam as saídas. As dicas no visualizador mostram-lhe a probabilidade e a elevação associadas a cada par de valores de entrada e saída. Para mais informações, consulte Navegar por um Modelo Usando o Microsoft Neural Network Viewer.

Para explorar a estrutura das entradas e sub-redes, e para ver estatísticas detalhadas, pode usar o visualizador de Árvore de Conteúdo Genérico da Microsoft. Pode clicar em qualquer nó para expandi-lo e ver os nós filhos, ou consultar os pesos e outras estatísticas contidas no nó.

Conteúdo do Modelo para um Modelo de Regressão Logística

Esta secção fornece detalhes e exemplos apenas para as colunas no conteúdo do modelo de mineração que têm relevância particular para regressão logística. O conteúdo do modelo é quase idêntico ao de um modelo de rede neural, mas descrições que se aplicam a modelos de redes neurais podem ser repetidas nesta tabela para maior conveniência.

Para informações sobre colunas de uso geral no conjunto de linhas do esquema, como MODEL_CATALOG e MODEL_NAME, que não são aqui descritas, ou para explicações da terminologia dos modelos de mineração, consulte Mining Model Content (Analysis Services - Data Mining).

CATÁLOGO_DE_MODELOS
Nome da base de dados onde o modelo está armazenado.

MODEL_NAME
Nome do modelo.

ATTRIBUTE_NAME
Os nomes do atributo que corresponde a este nó.

Node Content
Raiz do modelo Blank
Estatísticas marginais Blank
Camada de entrada Blank
Nó de entrada Nome do atributo de entrada
Camada oculta Blank
Camada de saída Blank
Nó de saída Nome do atributo de saída

NODE_NAME
O nome do nó. Atualmente, esta coluna contém o mesmo valor que NODE_UNIQUE_NAME, embora isso possa mudar em futuras versões.

NODE_UNIQUE_NAME
O nome exclusivo do nó.

Para mais informações sobre como os nomes e IDs fornecem informações estruturais sobre o modelo, consulte a secção, Utilização de Nomes de Nós e IDs.

NODE_TYPE
Um modelo de regressão logística produz os seguintes tipos de nós:

ID de Tipo de Nó Description
1 Model.
17 Nó organizador para a sub-rede.
18 Nó organizador para a camada de entrada.
19 Nó organizador para a camada oculta. A camada oculta está vazia.
20 Organizador para a camada de saída.
21 Nó de atributo de entrada.
23 Nó de atributo de saída.
24 Nó de estatísticas marginais.

NODE_CAPTION
Um rótulo ou uma legenda associada ao nó. Nos modelos de regressão logística, está sempre em branco.

CARDINALIDADE_FILHOS
Uma estimativa do número de filhos que o nó tem.

Node Content
Raiz do modelo Indica a contagem de nós filhos, que inclui pelo menos 1 rede, 1 nó marginal necessário e 1 camada de entrada necessária. Por exemplo, se o valor for 5, existem 3 sub-redes.
Estatísticas marginais Sempre 0.
Camada de entrada Indica o número de pares atributo-valores de entrada que foram usados pelo modelo.
Nó de entrada Sempre 0.
Camada oculta Num modelo de regressão logística, sempre 0.
Camada de saída Indica o número de valores de saída.
Nó de saída Sempre 0.

PARENT_UNIQUE_NAME
O nome único do progenitor do nó. NULL é devolvido para quaisquer nós ao nível de raiz.

Para mais informações sobre como os nomes e IDs fornecem informações estruturais sobre o modelo, consulte a secção, Utilização de Nomes de Nós e IDs.

NODE_DESCRIPTION
Uma descrição intuitiva do nó.

Node Content
Raiz do modelo Blank
Estatísticas marginais Blank
Camada de entrada Blank
Nó de entrada Nome do atributo de entrada
Camada oculta Blank
Camada de saída Blank
Nó de saída Se o atributo de saída for contínuo, contém o nome do atributo de saída.

Se o atributo de saída for discreto ou discretizado, contém o nome do atributo e o valor.

NODE_RULE
Uma descrição em XML da regra que está embutida no nó.

Node Content
Raiz do modelo Blank
Estatísticas marginais Blank
Camada de entrada Blank
Nó de entrada Um fragmento XML contendo a mesma informação que a coluna NODE_DESCRIPTION.
Camada oculta Blank
Camada de saída Blank
Nó de saída Um fragmento XML contendo a mesma informação que a coluna NODE_DESCRIPTION.

MARGINAL_RULE
Para modelos de regressão logística, está sempre em branco.

NODE_PROBABILITY
A probabilidade associada a este nó. Para modelos de regressão logística, sempre 0.

PROBABILIDADE_MARGINAL
A probabilidade de chegar ao nó a partir do nó pai. Para modelos de regressão logística, sempre 0.

NODE_DISTRIBUTION
Uma tabela aninhada que contém informação estatística para o nó. Para obter informações detalhadas sobre o conteúdo desta tabela para cada tipo de nó, consulte a seção Compreender a Tabela NODE_DISTRIBUTION em Mining Model Content for Neural Network Models (Analysis Services - Data Mining).

NODE_SUPPORT
Para modelos de regressão logística, sempre 0.

Observação

As probabilidades de suporte são sempre 0 porque a saída deste tipo de modelo não é probabilística. A única coisa significativa para o algoritmo são os pesos; Portanto, o algoritmo não calcula probabilidade, suporte ou variância.

Para obter informações sobre o suporte nos casos de treino para valores específicos, consulte o nó de estatísticas marginais.

MSOLAP_MODEL_COLUMN

Node Content
Raiz do modelo Blank
Estatísticas marginais Blank
Camada de entrada Blank
Nó de entrada Nome do atributo de entrada.
Camada oculta Blank
Camada de saída Blank
Nó de saída Nome do atributo de entrada.

MSOLAP_NODE_SCORE
Nos modelos de regressão logística, sempre 0.

MSOLAP_NODE_SHORT_CAPTION
Nos modelos de regressão logística, está sempre em branco.

Utilização de nomes e IDs de nós

A nomeação dos nós num modelo de regressão logística fornece informações adicionais sobre as relações entre nós no modelo. A tabela seguinte mostra as convenções para os IDs atribuídos aos nós em cada camada.

Tipo de nó Convenção para ID de nó
Raiz do modelo (1) 00000000000000000.
Nó de estatística marginal (24) 10000000000000000
Camada de entrada (18) 30000000000000000
Nó de entrada (21) Começa em 600000000000000000
Sub-rede (17) 20000000000000000
Camada oculta (19) 40000000000000000
Camada de saída (20) 50000000000000000
Nó de saída (23) Começa em 8000000000000000

Pode usar estes IDs para determinar como os atributos de saída estão relacionados com atributos específicos da camada de entrada, visualizando a tabela NODE_DISTRIBUTION do nó de saída. Cada linha dessa tabela contém um ID que aponta para um nó específico de atributo de entrada. A tabela NODE_DISTRIBUTION também contém o coeficiente desse par entrada-saída.

Ver também

Algoritmo de Regressão Logística da Microsoft
Mineração de Conteúdo de Modelos para Modelos de Redes Neuronais (Serviços de Análise - Mineração de Dados)
Exemplos de Consultas para Modelos de Regressão Logística
Referência Técnica do Algoritmo de Regressão Logística da Microsoft