商業智能在CRM中的應用
本文以企業管理信息系統為基礎,從探討CRM本身的特點出發,結合數據挖掘的原理、SQLSERVER2005的BI平臺中的分析服務和報表服務,進行一個實例的分析。對CRM系統的一些關鍵性領域存在的問題,提出期望的解決方法。
一、背景思考
(一)商業智能概述
商業智能(Business Intelligence,簡稱BI)的概念最早是Gartner Group的Howard Dresner于1996年提出來的。商業智能概念涵蓋了查詢報表、數據分析、數據挖掘、數據備份和恢復等所有以幫助企業決策為目的的技術及其應用。
商業智能的關鍵是從實際的營運數據中,進行數據預處理,然后抽取(Extraction)、轉換(Transformation)和裝載(Load),即ETL過程,利用各種技術或工具,最終得到一個企業級的決策信息。
對于零售行業的決策信息獲得,通過一個比較形象的,更貼近我們零售企業日常應用的過程來表現,即數據庫的知識發現(Knowledge Discovery in Database,KDD )。而在科研中稱的“知識發現”,在工程領域也常被稱為“數據挖掘”。
下圖展示了知識發現的過程:
(二)CRM概述
在布賴恩•伍爾夫的基礎性研究《Measured marketing》中描述到,統計中發現消費額在前30%的顧客貢獻的消費額是75%,而消費額后30%的顧客貢獻的消費額僅僅是3%。這足以說明顧客在購買能力上的不均等性。以顧客為中心的零售經濟學的宗旨是讓顧客滿意,將企業的有限的資源投入到最有價值的顧客身上,為自己的忠誠顧客提升更有價值的服務。這和零售產出管理是異曲同工的。
而對于一個客戶關系管理系統,其主旨也在于幫助企業通過技術手段,分析客戶的行為和他們的價值,以提供更優的消費服務及客戶體驗。
通常,CRM系統分為分析型、運營型、協作型。對于一個零售企業的客戶關系管理系統,通常是以各種介質的卡作為載體去綁定顧客的身份,從而貼近顧客,服務顧客。所以對于一個零售企業的客戶關系管理必然會涉及到卡管理,同時涵蓋客戶分析和溝通等。
通常對于數據分析的需求,可以分為:
1、客戶概況分析:客戶的層次、風險、愛好、習慣等;
2、客戶忠誠度分析:基于類別管理,考查客戶類別轉移和變節,及考查經濟忠誠和關系忠誠;
3、客戶利潤分析:不同客戶所消費的產品的邊緣利潤、總利潤額、凈利潤等;
4、客戶性能分析:不同客戶所消費的產品按種類、渠道、銷售地點等指標劃分的銷售額;
5、客戶未來分析:尋找客戶數量、類別等情況的未來發展趨勢,以爭取客戶;
6、客戶產品分析:主要針對商品的關聯分析,及涉及的供應鏈優化;
7、客戶促銷分析:包括郵報或降價等促銷活動的管理。
二、應用實例
(一)顧客類別管理
本實例的目的是創建一個簡單的顧客分類,在顧客分類的基礎上,進行相應的商品品類購買的分析。
基于顧客類別管理的理論,不可能在分析時直接針對單一顧客進行分析,肯定是對同一類別的顧客,進行相應的消費行為習慣分析等。這就如同商品要進行品類管理的道理一樣。當只有進行顧客的類別管理時,才能去考查類別人數轉移量,這是會員管理成效的一個重要指標。也只有這樣,才能對變節率等指標進行
考查。
我們通常進行的顧客分類,都是利用客單量或購物頻次劃一根線,來界定分類的象限。而真正的顧客聚類,通常考慮了客單、頻次或者收入等等綜合因素而實現。通過簡單的劃線式分類,無法達到“人以群分”的效果。
(二)聚類分析
聚類算法有能力發現用來對數據進行分組的隱性變量,因此對于零售行業來說,聚類算法是一種非常流行的數據挖掘技術。
對于聚類算法來說,常用的有兩種:K-平均和K-中心點。
在SQLSERVER2005 BI Development Studio中的聚類算法也有兩種,K-means算法和EM算法,這兩種都是屬于K-平均算法的。
K-means算法是以距離值的平均值對聚類成員進行分配,每個對象是在一個聚類中,聚類和聚類之間互不重疊, 通常被認為是硬聚類。而EM算法試用概率進行度量,一個點可能屬于多個聚類,每個聚類有不同的概率,聚類之間是可以重疊的,通常被稱為軟聚類。對于離散屬性的聚類是適合使用EM算法的。
Microsoft的聚類算法有一個可收縮原理,對于一個可收縮的框架,當進行重復訓練時,對于不會在聚類之間移動的數據,都把他們壓縮,不加載到內存,這樣就壓縮了內存空間。
SLQ Server Analysis Services有兩個主要的數據挖掘對象:挖掘結構和挖掘模型。挖掘結構用來定義挖掘問題的對象,而挖掘模型是挖掘算法對挖掘結構的具體應用。
本節中下面的例子,是在SQL Server Analysis Services服務的平臺上,新建的一個analysis services項目, 應用可收縮的k-means聚類算法模型,以某大型超市近半年的會員消費數據基礎,只通過客單量和頻次兩個維度,對會員進行簡單分類。總共分成了4類會員。在后面報表應用時,將簡單的以A、B、C、D來標識。首先如下圖顯示:
需值得注意的是,在進行數據預處理的時候,須先進行數據的清洗。將一些垃圾數據清除,將需要的數據進行加工。
對于SLQ Server Analysis Services的挖掘結果的發布,可以直接通過DMX語言進行查詢,或者通過SQLSERVER2005 BI Development Studio來創建報表模型來展示。報表模型的使用在下一節中敘述。這里先說明下DMX語言的使用。
數據挖掘擴展插件 (DMX) 是一種語言,在 Microsoft SQL Server 2005 Analysis Services (SSAS) 中可以使用該語言創建和處理數據挖掘模型。可以使用 DMX 創建新數據挖掘模型的結構、為這些模型定型并對其進行瀏覽、管理和預測。DMX 由數據定義語言 (DDL) 語句、數據操作語言 (DML) 語句以及函數和運算符構成。譬如在上例中如何找到哪些是“B類會員”的:
SELECT t.cardcode From [Guestsort] PREDICTION JOIN OPENQUERY([Hd31],
'SELECT [cardcode],[pjkdl],[pjkdpc] FROM [dbo].[guestsort] ') AS t
ON [Guestsort].[Pjkdl] = t.[pjkdl] AND [Guestsort].[Pjkdpc] = t.[pjkdpc]
where Cluster() = 'B類會員'
當然如果不想這部分會員的分類叫“B類會員”,而改稱為“白銀會員”或其他稱呼,那么也是可以通過DMX語言來修改挖掘模型的內容得到。
(三)報表發布
上一節提到了發布數據可以通過Reporting Services來展示。Reporting Services提供了一個創建定制報表的機制,這個報表通常包含文本和圖形,可以通過HTML、Email、打印形式和Microsoft Office文檔發布。基于Web的報表可以是交互式的,通過增加報表參數實現交互目的。
本節中下面的例子,是基于顧客類別管理的基礎上,對A、B、C、D不同類別的顧客所關心、購買的商品品類進行的統計分析。如果將這個過程進一步細分的話,那就是針對商品級別的關聯規則的應用,這個在這里不進行討論。這里只是通過商品品類和會員類別的矩陣式展示,較簡單地體現Reporting Services的功能。
同樣在SQLSERVER2005 BI Development Studio可以去創建一個Reporting Services項目。數據源可以是關系數據庫,也可以是Analysis Services等。具體的過程不描述了,從數據源中最終的報表文本或圖形等,進行生成、部署,最終可以通過web的方式進行瀏覽。 下圖示意了一個簡單數據的發布:
通過web展示的矩陣格式,行代表商品類別,列代表會員類別,以顯示不同類別會員對不同品類商品的購買情況。
同時上圖也示意了一個交互的過程,可以通過用戶指定的商品類別來查看感興趣的數據。比如查看中類3000的商品被A、B、C、D四類會員的購買頻次及品類金額情況。當然也可以增加其他的查詢條件。
對感興趣的類別支持樹形結構的自由展開,下鉆到小類,子類。如上圖的30000小類和30001小類就展開明細到各自的子類中。
對于報表的結果可以導出到XML,HTML,PDF,EXCEL等等文件中。
報表平臺支持同時也支持對各種角色的權限管理及日常的訂閱服務等。
三、應用前景
從目前的實際應用來看,聚類分析作為數據挖掘的一種算法模型,還有很多需要值得去調整的地方,譬如:如何數據預處理,如何剔除大型促銷等,造成的數據異動……
而對于CRM本身的7大分析需求,也需要更多地挖掘模型進行實踐。比如考查顧客類別轉移時,可以使用序列聚類算法。產品分析時,可以使用關聯規則。而對于同一種業務場景,應用不同算法也將得到不同的結果。因此可以通過挖掘準確性圖表,對挖掘模型本身進行不斷的修正。
可以預期在未來的應用過程中,結合商業智能理論的應用,通過顧客關系管理,將為顧客帶來更美好的消費體驗,給零售商帶來更多的銷售提升。