在本教程中,您将学习如何使用数据挖掘扩展插件 (DMX) 查询语言来创建、定型和浏览挖掘模型。 然后,您将使用这些挖掘模型创建预测,确定客户是否将购买自行车。
挖掘模型将从 AdventureWorksDW2012 示例数据库中包含的数据创建,该数据库存储虚构公司 Adventure Works Cycles 的数据。 Adventure Works Cycles 是一家大型跨国制造公司。 公司生产金属和复合材料的自行车,产品远销北美、欧洲和亚洲市场。 公司总部设在华盛顿州的伯瑟尔市,拥有 290 名雇员,而且拥有多个活跃在世界各地的地区性销售团队。
教程方案
Adventure Works Cycles 决定通过创建使用数据挖掘功能的自定义应用程序来扩展其数据分析。 自定义应用程序的目的是能够:
输入潜在客户的特定特征并预测这些客户是否将购买自行车。
输入潜在客户的列表及其特征,并预测哪些客户将购买自行车。
在第一种情况下,客户数据由客户注册页面提供,在第二种情况下,Adventure Works Cycles 营销部门提供了潜在客户列表。
此外,市场部还请求了将现有客户根据各种特征(例如,他们的居住地、孩子个数以及上下班路程)分组到不同类别中。 他们要查看这些群集是否可用于帮助确定特定的客户类型。 这将需要另外的挖掘模型。
Microsoft SQL Server Analysis Services 提供了多个可用于完成这些任务的工具:
DMX 查询语言
SQL Server Management Studio 中的查询编辑器
数据挖掘扩展插件(DMX)是由 Analysis Services 提供的查询语言,可用于创建和使用挖掘模型。 Microsoft决策树算法创建可用于预测某人是否会购买自行车的模型。 生成的模型可以将单个客户或客户表作为一个输入。 Microsoft聚类分析算法可以根据共享特征创建客户的分组。 本教程的目的是提供将在自定义应用程序中使用的 DMX 脚本。
有关详细信息:数据挖掘解决方案
挖掘结构和挖掘模型
在开始创建 DMX 语句之前,必须了解 Analysis Services 用于创建挖掘模型的主要对象。 挖掘结构是一种数据结构,它定义生成挖掘模型的数据域。 单个挖掘结构可以包含多个共享相同域的挖掘模型。 挖掘模型可向挖掘结构所代表的数据应用挖掘模型算法。
挖掘结构的构造块是挖掘结构列,这些列对数据源所包含的数据进行说明。 这些列包含诸如数据类型、内容类型以及数据分发方式等信息。
挖掘模型必须包含挖掘结构中所述的键列,以及其余列的子集。 挖掘模型定义每个列的用法以及用于创建挖掘模型的算法。 例如,在 DMX 中,您可以将一列指定为键列或 PREDICT 列。 如果有一列未指定,则会将该列假定为一个输入列。
在 DMX 中,有两种创建挖掘模型的方式。 您可以使用 CREATE MINING MODEL 语句同时创建挖掘结构以及关联的挖掘模型,也可以首先使用 CREATE MINING STRUCTURE 语句创建挖掘结构,然后使用 ALTER STRUCTURE 语句向结构中添加挖掘模型。 下表对这些方法进行了说明。
创建挖掘模型
使用此语句可以创建挖掘结构以及关联的同名挖掘模型。 挖掘模型名称后追加有“Structure”,以便与挖掘结构区分开。 如果要创建包含单一挖掘模型的挖掘结构,则此语句将非常有用。
有关详细信息,请参阅 CREATE MINING MODEL (DMX)。
更改数据挖掘结构
使用此语句可以向服务器中已存在的挖掘结构中添加挖掘模型。 如果要创建包含多个不同挖掘模型的挖掘结构,则此语句将非常有用。 由于各种原因,您可能需要在单一挖掘结构中添加多个挖掘模型。 例如,可以创建使用不同算法的多个挖掘模型来判断哪种算法效果最佳。 可以创建使用相同算法的多个挖掘模型,但通过将每一个挖掘模型中的一个参数设置为不同的值来查找最佳参数设置。
有关详细信息,请参阅 ALTER MINING STRUCTURE (DMX)。
因为您将创建包含多个挖掘模型的挖掘结构,因此使用本教程中的第二种方法。
详细信息
数据挖掘扩展插件 (DMX) 参考, 了解 DMX Select 语句、 DMX 预测查询的结构和用法
学习内容
本教程分为以下几课:
第 1 课:创建自行车购买者挖掘结构
在本课中,您将学习如何使用 CREATE 语句创建挖掘结构。
第 2 课:向自行车购买者挖掘结构添加挖掘模型
在本课中,您将学习如何使用 ALTER 语句向挖掘结构中添加挖掘模型。
第 3 课:处理自行车购买者挖掘结构
在本课中,您将学习如何使用 INSERT INTO 语句处理挖掘结构及其关联的挖掘模型。
第 4 课:浏览自行车购买者挖掘模型
在本课中,您将学习如何使用 SELECT 语句浏览挖掘模型的内容。
第 5 课:执行预测查询
在本课中,您将学习如何使用 PREDICTION JOIN 语句根据挖掘模型创建预测。
要求
执行本教程前,请确保安装了下列各项:
Microsoft SQL Server
Microsoft SQL Server 2005 Analysis Services (SSAS)、SQL Server 2008 Analysis Services (SSAS)、SQL Server 2014 Analysis Services (SSAS) 或 SQL Server Analysis Services
AdventureWorksDW2012 数据库。 为了增强安全性,默认情况下将不安装该示例数据库。 若要安装Microsoft SQL Server 的官方示例数据库,请访问 Microsoft SQL 示例数据库 页,然后选择要安装的数据库。
注意
查看教程时,建议将“下一个主题”和“上一主题”按钮添加到文档查看器工具栏。