[SQL SERVER][SSAS] Data Mining(3)

[SQL SERVER][SSAS] Data Mining(3)

5.驗證模型:這步驟就是要驗證相關模型預測是否正確(Data Mining 中的一個重要步驟)。

 

輸入選擇:

image

預測值=1。可預測資料行=Bike Buyer。

 

增益圖:

增益圖會繪製隨機猜測模型及理想的模型。

我們的模型會於隨機猜測與理想或完美預測之間。

image

image

現在你可以看出 vTargetMail(決策模型) 預測高於TM_Clustering(群集模型)預測。

 

前面我們判斷出決策模型預測較為正確,

現在行銷部門想要了解購買自行車是否和性別特性有關,

我們就來建立一個依據客戶性別模型。

 

新增決策樹模型

image

輸入TM_Decision_Tree_Male。

 

image

設定模型篩選器。

 

image

資料行:Gender 、運算子: = 、 值 :M。

確認後執行處理和部署。

 

針對 女性 請重複上訴動作,結果如下。

image

檢視結果,並評估篩選過之模型的正確性請參考之前的文章。

 

模型篩選性別後,結果有些有趣的差異。

男性: 45>=年紀<59 、家中小孩等於0、年收入>=26000、不在北美洲、汽車數量不等於1、全部小孩數量=2 最有購買力。

image

女性: 38>=年紀<45 、汽車數量等於0、家中小孩不等於3、其中又以家中小孩等於0、年紀>=41 最有購買力。

image

 

6.建立處理和預測

我們將會建立一個查詢來預測哪些客戶最有可能購買自行車。

一旦您識別出購買自行車機率很高的客戶之後,您將會鑽研採礦模型中案例的詳細資料,

以擷取這些客戶的名稱和連絡資訊。

 

採礦模型預測:

選擇輸入資料表

image

ProspectiveBuyer (dbo)。

 

image

結構資料行會自行對應輸入資料表資料行。

 

修改連接

image image

將可預測的資料行 [Bike Buyer] 對應到輸入資料表資料行。

 

ProspectiveBuyer新增具名計算:

此運算式將會從輸入資料表的 BirthDate 資料行中計算客戶的年齡。

由於[Age] 已被識別為用來預測自行車購買能力的最具影響力資料行,

所以它必須同時存在於模型和輸入資料表中。

image

image

運算式:DATEDIFF(YYYY,[BirthDate],getdate())。

 

重新設定 AGE 連接對應

image

 

設計預測查詢:我們將查詢出最有可能購買自行車的潛在客戶

設計查詢可參考 MSDN 這裡就不多說了。

image

 

修改一下查詢,針對機率排序大到小

image

 

設計後選擇結果

image

image

可以透過第一個資料行(Expression) 判斷潛在客戶,

而你也有客戶電話、姓名、住址..等,這樣你就可以請行銷部門展開銷售活動。

 

採礦結構上使用鑽研:

由於行銷部門決定,他們也想要傳送郵件給五年以前曾經購買自行車的客戶。

而我將使用鑽研來顯示擁有比較舊的自行車之客戶的姓名和地址,達到這個需求。

 

設定 AllowDrillThrough= true

image

 

採礦模型檢視器選擇案例背景=1,並針對38~45節點鑽研

image

 

透過鑽研視窗檢視相關資料

image

 

 

 

 

參考

資料採礦延伸模組 (DMX) 函數參考