在本课中,您将向您在第 1 课:创建自行车买家挖掘结构中创建的 Bike Buyer 挖掘结构添加两个新的挖掘模型。 通过这些挖掘模型,可以使用一个模型浏览数据,并使用另一个模型创建预测。
若要了解潜在客户如何按其特征进行分类,将基于 Microsoft聚类分析算法创建挖掘模型。 在后面的课程中,你将探讨此算法如何查找共享类似特征的客户群集。 例如,你可能会发现某些客户倾向于彼此靠近,骑自行车上下班,并具有类似的教育背景。 可以使用这些群集更好地了解不同客户的相关方式,并使用信息创建面向特定客户的营销策略。
若要预测潜在客户是否可能购买自行车,你将基于 Microsoft决策树算法创建挖掘模型。 此算法将浏览与每个潜在客户关联的信息,并查找在预测他们是否会购买自行车时有用的特征。 然后,它将以前的自行车购买者的特征值与新的潜在客户进行比较,以确定新潜在客户是否可能购买自行车。
修改数据挖掘结构语句
若要将挖掘模型添加到挖掘结构,请使用 ALTER MINING STRUCTURE (DMX) 语句。 语句中的代码可以分为以下部分:
确定挖掘结构
命名挖掘模型
定义关键列
定义输入列和可预测列
标识算法和参数更改
下面是 ALTER MINING MODEL 语句的通用示例:
ALTER MINING STRUCTURE [<mining structure name>]
ADD MINING MODEL [<mining model name>]
(
[<key column>],
<mining model columns>,
) USING <algorithm name>( <algorithm parameters> )
WITH FILTER (<expression>)
代码的第一行识别现有的挖掘结构,以便添加挖掘模型。
ALTER MINING STRUCTURE [<mining structure name>]
代码的下一行将为即将添加到挖掘结构的挖掘模型命名:
ADD MINING MODEL [<mining model name>]
有关在 DMX 中命名对象的信息,请参阅标识符(DMX)。
后续代码行定义挖掘结构中将由挖掘模型使用的列。
[<key column>],
<mining model columns>
只能使用挖掘结构中已存在的列,列表中的第一列必须是挖掘结构中的键列。
代码的下一行定义生成挖掘模型的挖掘算法和可在算法上设置的算法参数:
) USING <algorithm name>( <algorithm parameters> )
有关可以调整的算法参数的详细信息,请参阅 Microsoft决策树算法 和 Microsoft聚类分析算法。
可以使用以下语法指定挖掘模型中的列用于预测:
<mining model column> PREDICT
代码的最后一行(可选)定义在训练和测试模型时应用的筛选器。 有关如何将筛选器应用于挖掘模型的详细信息,请参阅“挖掘模型筛选器”(Analysis Services - 数据挖掘)。
课程任务
在本课中,你将执行以下任务:
使用Microsoft决策树算法将决策树挖掘模型添加到 Bike Buyer 结构
使用Microsoft聚类分析算法将聚类分析挖掘模型添加到 Bike Buyer 结构
由于想要查看所有事例的结果,因此你尚未向任一模型添加筛选器。
将决策树挖掘模型添加到结构
第一步是基于Microsoft决策树算法添加挖掘模型。
添加决策树挖掘模型
在 对象资源管理器中,右键单击 Analysis Services 实例,指向 “新建查询”,然后单击 DMX 打开查询编辑器和新的空白查询。
将 ALTER MINING STRUCTURE 语句的泛型示例复制到空白查询中。
替换以下内容:
<mining structure name>替换为:
[Bike Buyer]替换以下内容:
<mining model name>替换为:
Decision Tree替换以下内容:
<mining model columns>,替换为:
( CustomerKey, [Age], [Bike Buyer] PREDICT, [Commute Distance], [Education], [Gender], [House Owner Flag], [Marital Status], [Number Cars Owned], [Number Children At Home], [Occupation], [Region], [Total Children], [Yearly Income]在这种情况下,该
[Bike Buyer]列已指定为 PREDICT 列。替换以下内容:
USING <algorithm name>( <algorithm parameters> )替换为:
Using Microsoft_Decision_Trees WITH DRILLTHROUGH使用 WITH DRILLTHROUGH 语句可以探索用于生成挖掘模型的事例。
生成的语句现在应如下所示:
ALTER MINING STRUCTURE [Bike Buyer] ADD MINING MODEL [Decision Tree] ( CustomerKey, [Age], [Bike Buyer] PREDICT, [Commute Distance], [Education], [Gender], [House Owner Flag], [Marital Status], [Number Cars Owned], [Number Children At Home], [Occupation], [Region], [Total Children], [Yearly Income] ) USING Microsoft_Decision_Trees WITH DRILLTHROUGH在“ 文件 ”菜单上,单击“ 保存 DMXQuery1.dmx As”。
在“ 另存为 ”对话框中,浏览到相应的文件夹,并命名该文件
DT_Model.dmx。在工具栏上,单击“ 执行 ”按钮。
将聚类分析挖掘模型添加到结构
现在可以根据Microsoft聚类分析算法将挖掘模型添加到 Bike Buyer 挖掘结构。 由于聚类分析挖掘模型将使用挖掘结构中定义的所有列,因此可以通过省略挖掘列的定义,使用快捷方式将模型添加到结构。
添加聚类挖掘模型
在 对象资源管理器中,右键单击 Analysis Services 实例,指向 新建查询,然后单击 DMX,以打开查询编辑器,同时新建一个空白查询。
将 ALTER MINING STRUCTURE 语句的泛型示例复制到空白查询中。
替换以下内容:
<mining structure name>替换为:
[Bike Buyer]替换以下内容:
<mining model>替换为:
Clustering Model删除以下内容:
( [<key column>], <mining model columns>, )替换以下内容:
USING <algorithm name>( <algorithm parameters> )替换为:
USING Microsoft_Clustering完整语句现在应如下所示:
ALTER MINING STRUCTURE [Bike Buyer] ADD MINING MODEL [Clustering] USING Microsoft_Clustering在“ 文件 ”菜单上,单击“ 保存 DMXQuery1.dmx As”。
在“ 另存为 ”对话框中,浏览到相应的文件夹,并命名该文件
Clustering_Model.dmx。在工具栏上,单击“ 执行 ”按钮。
在下一课中,你将处理模型和挖掘结构。