通过


逻辑回归模型的模型内容挖掘

适用于: SQL Server 2019 及更早版本的 Analysis Services Azure Analysis Services Fabric/Power BI Premium

重要

SQL Server 2017 Analysis Services 中弃用了数据挖掘,现已在 SQL Server 2022 Analysis Services 中停止使用。 文档不会更新为已弃用和已停用的功能。 若要了解详细信息,请参阅 Analysis Services 向后兼容性

本主题介绍特定于使用Microsoft逻辑回归算法的模型的挖掘模型内容。 有关如何解释所有模型类型共享的统计信息和结构的说明,以及与挖掘模型内容相关的术语的一般定义,请参阅挖掘模型内容(Analysis Services - 数据挖掘)。

了解逻辑回归模型的结构

逻辑回归模型是使用Microsoft神经网络算法创建,其中包含约束模型以消除隐藏节点的参数。 因此,逻辑回归模型的整体结构与神经网络的整体结构几乎相同:每个模型都有一个表示模型及其元数据的父节点,以及一个特殊的边际统计信息节点(NODE_TYPE = 24),该节点提供有关模型中使用的输入的描述性统计信息。

此外,模型还包含每个可预测属性的子网(NODE_TYPE = 17)。 就像在神经网络模型中一样,每个子网始终包含两个分支:一个用于输入层,另一个分支包含隐藏层(NODE_TYPE = 19)和输出层(NODE_TYPE = 20)。 如果将多个属性指定为“仅预测”,则同一子网可用于多个属性。 也是输入的可预测属性可能不会出现在同一子网中。

但是,在逻辑回归模型中,表示隐藏层的节点为空,并且没有子级。 因此,模型包含表示单个输出(NODE_TYPE = 23)和单个输入(NODE_TYPE = 21)但不包含单个隐藏节点的节点。

逻辑回归模型内容结构

默认情况下,逻辑回归模型显示在 Microsoft神经网络查看器中。 使用此自定义查看器,可以筛选输入属性及其值,并以图形方式查看它们如何影响输出。 查看器中的工具提示显示与每对输入和输出值关联的概率和提升度。 有关详细信息,请参阅 使用Microsoft神经网络查看器浏览模型

若要浏览输入和子网的结构,并查看详细的统计信息,可以使用Microsoft泛型内容树查看器。 可以单击任意节点来展开该节点并查看子节点,或查看节点中包含的权重和其他统计信息。

逻辑回归模型的模型内容

本部分仅针对挖掘模型内容中与逻辑回归具有特定相关性的列提供详细信息和示例。 模型内容与神经网络模型的内容几乎相同,但应用于神经网络模型的说明可能在此表中重复,以便于方便。

有关架构行集中的常规用途列(如MODEL_CATALOG和MODEL_NAME这样的未在此处描述的列),或有关挖掘模型术语解释,请参阅挖掘模型内容(Analysis Services - 数据挖掘)。

模型目录
存储模型的数据库的名称。

MODEL_NAME
模型的名称。

ATTRIBUTE_NAME
与此节点对应的属性的名称。

Node Content
模型根节点 空白
边际统计信息 空白
输入层 空白
输入节点 输入属性名称
隐藏层 空白
输出层 空白
输出节点 输出属性名称

NODE_NAME
节点的名称。 目前,此列包含与NODE_UNIQUE_NAME相同的值,但这可能会在未来版本中更改。

NODE_UNIQUE_NAME
节点的唯一名称。

有关名称和 ID 如何提供有关模型的结构信息的详细信息,请参阅“ 使用节点名称和 ID”部分。

NODE_TYPE
逻辑回归模型输出以下节点类型:

节点类型 ID Description
1 Model.
17 子网的组织者节点。
18 输入层的组织者节点。
19 隐藏层的调控节点。 隐藏层为空。
20 输出层的组织者节点。
21 输入属性节点。
23 输出属性节点。
24 边际统计节点。

NODE_CAPTION
与节点关联的标签或标题。 在逻辑回归模型中,始终为空。

CHILDREN_CARDINALITY
估计节点具有的子级数。

Node Content
模型根节点 指示子节点计数,其中包括至少 1 个网络、1 个所需的边际节点和 1 个所需的输入层。 例如,如果值为 5,则有 3 个子网。
边际统计信息 始终为 0。
输入层 指示模型使用的输入属性值对的数目。
输入节点 始终为 0。
隐藏层 在逻辑回归模型中,始终为 0。
输出层 指示输出值的数目。
输出节点 始终为 0。

父唯一名称
节点父级的唯一名称。 根级别的任何节点都返回 NULL。

有关名称和 ID 如何提供有关模型的结构信息的详细信息,请参阅“ 使用节点名称和 ID”部分。

节点描述
节点的用户友好说明。

Node Content
模型根节点 空白
边际统计信息 空白
输入层 空白
输入节点 输入属性名称
隐藏层 空白
输出层 空白
输出节点 如果输出属性是连续的,则包含输出属性的名称。

如果输出属性是离散的或离散化的,则包含属性的名称和值。

节点规则
嵌入在节点中的规则的 XML 说明。

Node Content
模型根节点 空白
边际统计信息 空白
输入层 空白
输入节点 包含与NODE_DESCRIPTION列相同的信息的 XML 片段。
隐藏层 空白
输出层 空白
输出节点 包含与NODE_DESCRIPTION列相同的信息的 XML 片段。

MARGINAL_RULE
对于逻辑回归模型,始终为空。

节点概率
与此节点关联的概率。 对于逻辑回归模型,始终为 0。

边际概率
从父节点到达节点的概率。 对于逻辑回归模型,始终为 0。

NODE_DISTRIBUTION
包含节点统计信息的嵌套表。 有关每个节点类型之此表内容的详细信息,请参阅 《神经网络模型挖掘模型内容(Analysis Services - 数据挖掘)》 中的章节“了解 NODE_DISTRIBUTION 表”。

节点支持
对于逻辑回归模型,始终为 0。

注释

支持概率始终为 0,因为此模型类型的输出不是概率性的。 算法唯一有意义的是权重;因此,算法不会计算概率、支持或方差。

若要获取有关特定值的训练用例中的支持的信息,请参阅边际统计节点。

MSOLAP_MODEL_COLUMN

Node Content
模型根节点 空白
边际统计信息 空白
输入层 空白
输入节点 输入属性名称。
隐藏层 空白
输出层 空白
输出节点 输入属性名称。

MSOLAP_NODE_SCORE
在逻辑回归模型中,始终为 0。

MSOLAP_NODE_SHORT_CAPTION
在逻辑回归模型中,始终为空。

使用节点名称和 ID

逻辑回归模型中节点的命名提供有关模型中节点之间的关系的其他信息。 下表显示了分配给每个层中的节点的 ID 的约定。

节点类型 节点 ID 的约定
模型根目录 (1) 00000000000000000.
边际统计节点(24) 10000000000000000
输入层 (18) 30000000000000000
输入节点 (21) 从 600000000000000000 开始
子网 (17) 20000000000000000
隐藏层 (19) 40000000000000000
输出层 (20) 50000000000000000
输出节点 (23) 从 800000000000000000 开始

可以通过查看输出节点的NODE_DISTRIBUTION表,使用这些 ID 来确定输出属性如何与特定的输入层属性相关。 该表中的每一行都包含一个指向特定输入属性节点的 ID。 NODE_DISTRIBUTION表还包含该输入输出对的系数。

另请参阅

Microsoft逻辑回归算法
神经网络模型的模型内容挖掘(Analysis Services - 数据挖掘)
逻辑回归模型查询示例
Microsoft逻辑回归算法技术参考