第 3 课:处理自行车购买者数据挖掘结构

在本课中,你将使用 AdventureWorksDW2012 示例数据库中的 INSERT INTO 语句和 vTargetMail 视图来处理在第 1 课中创建的挖掘结构和挖掘模型 :创建自行车买家挖掘结构和第2 课:将挖掘模型添加到自行车购买者挖掘结构

处理挖掘结构时,Analysis Services 会读取源数据并生成支持挖掘模型的结构。 处理挖掘模型时,挖掘结构定义的数据将通过所选的数据挖掘算法传递。 该算法搜索趋势和模式,然后将此信息存储在挖掘模型中。 因此,挖掘模型不包含实际源数据,而是包含算法发现的信息。 有关处理挖掘模型的详细信息,请参阅处理要求和注意事项(数据挖掘)。

仅当更改结构列或更改源数据时,才需要重新处理挖掘结构。 如果将挖掘模型添加到已处理的挖掘结构,则可以使用 INSERT INTO MINING MODEL 语句来训练新的挖掘模型。

列车结构模板

若要训练挖掘结构及其关联的挖掘模型,请使用 INSERT INTO (DMX) 语句。 语句中的代码可以分为以下部分:

  • 确定挖掘结构

  • 列出挖掘结构中的列

  • 定义训练数据

下面是 INSERT INTO 语句的一般示例:

INSERT INTO MINING STRUCTURE [<mining structure name>]  
(  
   <mining structure columns>  
)  
OPENQUERY([<datasource>],'<SELECT statement>')  

代码的第一行标识要训练的挖掘结构:

INSERT INTO MINING STRUCTURE [<mining structure name>]  

代码的下一行指定了由挖掘结构定义的列。 必须列出挖掘结构中的每个列,并且每个列必须映射到源查询数据中包含的列。

(  
   <mining structure columns>  
)  

代码的最后一行定义将用于训练挖掘结构的数据:

OPENQUERY([<datasource>],'<SELECT statement>')  

在本课中,你将用于 OPENQUERY 定义源数据。 有关定义源查询的其他方法的信息,请参阅 <源数据查询>

课程任务

在本课中,你将执行以下任务:

  • 处理自行车买家数据挖掘结构

处理预测挖掘结构

使用 INSERT INTO 处理挖掘结构

  1. 对象资源管理器中,右键单击 Analysis Services 实例,指向 “新建查询”,然后单击 “DMX”。

    查询编辑器打开后,将包含一个新的空白查询。

  2. 将 INSERT INTO 语句的泛型示例复制到空白查询中。

  3. 替换以下内容:

    [<mining structure name>]   
    

    替换为:

    Bike Buyer  
    
  4. 替换以下内容:

    <mining structure columns>  
    

    替换为:

    [Customer Key],  
    [Age],  
    [Bike Buyer],  
    [Commute Distance],  
    [Education],  
    [Gender],  
    [House Owner Flag],  
    [Marital Status],  
    [Number Cars Owned],  
    [Number Children At Home],  
    [Occupation],  
    [Region],  
    [Total Children],  
    [Yearly Income]  
    
  5. 替换以下内容:

    OPENQUERY([<datasource>],'<SELECT statement>')  
    

    替换为:

    OPENQUERY([Adventure Works DW],  
       'SELECT CustomerKey, Age, BikeBuyer,  
             CommuteDistance,EnglishEducation,  
             Gender,HouseOwnerFlag,MaritalStatus,  
             NumberCarsOwned,NumberChildrenAtHome,   
             EnglishOccupation,Region,TotalChildren,  
             YearlyIncome   
        FROM dbo.vTargetMail')  
    

    OPENQUERY 语句引用 Adventure Works DW 2012 多维数据源,以访问视图 vTargetMail。 该视图包含将用于训练挖掘模型的源数据。

    完整语句现在应如下所示:

    INSERT INTO MINING STRUCTURE [Bike Buyer]  
    (  
       [Customer Key],  
       [Age],  
       [Bike Buyer],  
       [Commute Distance],  
       [Education],  
       [Gender],  
       [House Owner Flag],  
       [Marital Status],  
       [Number Cars Owned],  
       [Number Children At Home],  
       [Occupation],  
       [Region],  
       [Total Children],  
       [Yearly Income]     
    )  
    OPENQUERY([Adventure Works DW],  
       'SELECT CustomerKey, Age, BikeBuyer,  
             CommuteDistance,EnglishEducation,  
             Gender,HouseOwnerFlag,MaritalStatus,  
             NumberCarsOwned,NumberChildrenAtHome,   
             EnglishOccupation,Region,TotalChildren,  
             YearlyIncome   
        FROM dbo.vTargetMail')  
    
  6. 在“ 文件 ”菜单上,单击“ 保存 DMXQuery1.dmx As”。

  7. 在“ 另存为 ”对话框中,浏览到相应的文件夹,并命名该文件 Process Bike Buyer Structure.dmx

  8. 在工具栏上,单击“ 执行 ”按钮。

在下一课中,你将探索添加到本课程中挖掘结构的挖掘模型中的内容。

下一课

第 4 课:浏览自行车买家挖掘模型