數(shù)據(jù)挖掘技術(shù)在客戶管理中的應(yīng)用研究
數(shù)據(jù)挖掘的主要技術(shù)手段包括關(guān)聯(lián)規(guī)則挖掘、分類分析、聚類分析、估計(jì)、預(yù)測(cè)、時(shí)序模式和偏差分析等。支持上述技術(shù)的核心研究?jī)?nèi)容是相應(yīng)的數(shù)據(jù)挖掘算法研究,包括貝葉斯算法、決策樹、時(shí)序算法、聚類算法、關(guān)聯(lián)算法、神經(jīng)網(wǎng)絡(luò)算法和回歸算法。
2 數(shù)據(jù)挖掘的核心價(jià)值與應(yīng)用分析
在企業(yè)客戶管理中應(yīng)用數(shù)據(jù)挖掘技術(shù),不僅使客戶管理更高效、更實(shí)用,還能預(yù)測(cè)客戶將來的各種消費(fèi)行為,為企業(yè)實(shí)施更精確的客戶管理和市場(chǎng)營(yíng)銷提供決策依據(jù)??蛻艄芾硎荂RM系統(tǒng)的一部分,但比CRM系統(tǒng)有關(guān)客戶部分的功能更詳細(xì)、更齊全、更完善、更符合企業(yè)的實(shí)際需要。
客戶管理的目標(biāo)非常明確,防范老客戶流失,從老客戶那里獲取更大的價(jià)值。
目前企業(yè)客戶管理應(yīng)用比較混亂,大致分為3種情況:①以業(yè)務(wù)系統(tǒng)為主,客戶管理為輔的信息系統(tǒng),如進(jìn)銷存系統(tǒng)、ERP系統(tǒng)等,以實(shí)現(xiàn)業(yè)務(wù)為核心內(nèi)容,但往往會(huì)涉及到一部分客戶信息,嚴(yán)格來講,這部分軟件不屬于客戶管理范疇。②以銷售、市場(chǎng)營(yíng)銷為核心內(nèi)容的信息系統(tǒng),如銷售管理系統(tǒng)等,以實(shí)現(xiàn)銷售計(jì)劃為核心,重點(diǎn)最大限度的促進(jìn)銷售,更多的關(guān)注客戶的消費(fèi)心理、消費(fèi)行為,注重提升客戶的忠誠(chéng)度,但這不是客戶系統(tǒng)的全部?jī)?nèi)容。③CRM系統(tǒng),它是一個(gè)比較龐大的客戶關(guān)系管理信息系統(tǒng),主要包括銷售、銷售過程、客戶管理、客戶分析等若干模塊,相對(duì)于大多數(shù)企業(yè)而言,成本較高。同時(shí),操作型CRM較多,分析型CRM較少。
客戶管理的混亂,為企業(yè)利用客戶關(guān)系帶來了不便,也為挖掘客戶關(guān)系中的有價(jià)值信息增加了難度。
3 挖掘算法的選擇與建模
當(dāng)企業(yè)建立起數(shù)據(jù)倉(cāng)庫(kù)后??刹捎貌煌臄?shù)據(jù)挖掘算法為客戶管理提供直接、有效的數(shù)據(jù)與參考。企業(yè)活動(dòng)中,與客戶管理相關(guān)業(yè)務(wù)大多與銷售過程有關(guān),包括客戶購(gòu)物、企業(yè)營(yíng)銷、客戶分類管理和銷售預(yù)測(cè)等。對(duì)客戶購(gòu)物行為的分析,可以為個(gè)性化營(yíng)銷提供客觀依據(jù),最有效的營(yíng)銷是針對(duì)有消費(fèi)興趣潛力的客戶群,通過挖掘關(guān)聯(lián)關(guān)系,尋找有價(jià)值的客戶分類,能夠提高客戶管理的有效性。
數(shù)據(jù)挖掘雖然是一個(gè)智能的數(shù)據(jù)分析工具,但其準(zhǔn)確性會(huì)受到多個(gè)方面因素的影響,如數(shù)據(jù)的準(zhǔn)確性、合法性、算法選擇的準(zhǔn)確性、輸人選擇的正確性等,在實(shí)際應(yīng)用中,不同的人、不同的挖掘策略與方案將會(huì)有不同的結(jié)果,應(yīng)用業(yè)務(wù)人員和數(shù)據(jù)挖掘人員一起。共同探討正確性。下面針對(duì)上述具體應(yīng)用,提出可行的挖掘方案,以供參考。
3.1 挖掘客戶購(gòu)物行為信息的算法與模型
用戶在挑選商品時(shí),往往存在一個(gè)習(xí)慣:先挑選最需要的商品,然后根據(jù)商品推薦或興趣來挑選其他商品,市場(chǎng)營(yíng)銷人員中可以分析每個(gè)用戶的購(gòu)物行為和愛好,為將來的個(gè)性化營(yíng)銷提供依據(jù),并為每個(gè)客戶提供最具人性化的營(yíng)銷方式,這要使用序列聚類算法。
實(shí)現(xiàn)此功能需要兩個(gè)基本信息,一是訂單信息,關(guān)注客戶的一次購(gòu)物行為;二是訂單產(chǎn)品明細(xì),主要關(guān)注商品放入訂單的先后順序。
在業(yè)務(wù)庫(kù)中,有客戶企業(yè)表、客戶訂單表、訂單產(chǎn)品明細(xì)表、產(chǎn)品信息表4個(gè)業(yè)務(wù)表,如圖1所示,在創(chuàng)建數(shù)據(jù)倉(cāng)庫(kù)后,客戶企業(yè)表、產(chǎn)品信息表將變成維表。訂單表、訂單產(chǎn)品明細(xì)將變成事實(shí)表,把不需要的字段刪除,并把不合理的數(shù)據(jù)進(jìn)行清理、轉(zhuǎn)換,采用微軟序列聚類算法即可實(shí)現(xiàn)此功能需求。
其數(shù)據(jù)挖掘模型如下:
根據(jù)以往的銷售歷史,分析用戶的銷售行為,其重點(diǎn)在于歷史數(shù)據(jù)中每個(gè)訂單要有產(chǎn)品購(gòu)買的先后順序,結(jié)合序列聚類算法即可完成,此模型的輸入列是訂單編號(hào),預(yù)測(cè)列是一個(gè)嵌套表,包括產(chǎn)品序號(hào)和產(chǎn)品編號(hào)(或名稱)兩個(gè)可預(yù)測(cè)試列。
3.2 挖掘消費(fèi)興趣實(shí)現(xiàn)有效營(yíng)銷的算法與模型
企業(yè)進(jìn)行新產(chǎn)品宣傳或促銷時(shí),有效做法是把信息發(fā)送給感興趣的客戶,而不是發(fā)給所有人,基于以前所做的客戶檔案和客戶對(duì)產(chǎn)品調(diào)查的反饋結(jié)果,采用數(shù)據(jù)挖掘算法可以找出那些感興趣的客戶,即節(jié)省成本,又提高效率。
此功能的關(guān)鍵是根據(jù)以前所做的產(chǎn)品調(diào)查反饋信息,預(yù)測(cè)哪些因素影響客戶的購(gòu)買,并分析愿意購(gòu)買客戶的特征,基于這些特征,把客戶表里的所有信息重新篩選一遍,只向那些具有購(gòu)買特征的客戶發(fā)送營(yíng)銷信息。
實(shí)現(xiàn)此功能的算法有4個(gè):貝葉斯、決策樹、神經(jīng)網(wǎng)絡(luò)、聚類,基于驗(yàn)證考慮,盡可能采用每一種算法來測(cè)試,以獲得更準(zhǔn)確的分析數(shù)據(jù),如圖2所示,其數(shù)據(jù)模型如下:
也可以采用決策樹、聚類、神經(jīng)網(wǎng)絡(luò)算法,分別對(duì)應(yīng)如下:
(1)Microsoft_Decision_Trees:決策樹
(2)Microsoft_Clustering:聚類
(3)Microsoft_Neural_Network:神經(jīng)網(wǎng)絡(luò)
根據(jù)以往的調(diào)查數(shù)據(jù),可以分析出這些輸入列與可預(yù)測(cè)列(是否購(gòu)買)之間的關(guān)系,找那些已購(gòu)買產(chǎn)品或愿意購(gòu)買產(chǎn)品的客戶重要特征,然后把促銷信息、新產(chǎn)品信息發(fā)給具有這些重要特征的客戶。
3.3 挖掘有價(jià)值的客戶分類信息的算法與模型
客戶分類比較復(fù)雜,不同企業(yè)采用不同的標(biāo)準(zhǔn),按行業(yè)、地區(qū)、性質(zhì)對(duì)客戶分類,是一種比較常見的簡(jiǎn)單方法,但不能準(zhǔn)確反映出其對(duì)客戶的影響,采用數(shù)據(jù)挖掘中的聚類算法,可以給出歷史客戶中最能影響客戶分類的關(guān)鍵因素,并把客戶細(xì)分成更多的組,以使每個(gè)組里的客戶具有更多的相似性和特征;微軟聚類算法可以解決此類問題。如圖3所示。
其數(shù)據(jù)模型如下:
不需要指定輸出列,只需要定義輸入列即可,其余的都交給數(shù)據(jù)挖掘算法去完成。算法會(huì)自動(dòng)依據(jù)歷史數(shù)據(jù),找出不同輸人列分類之間的差異,從而給出最合適的分類依據(jù),采用不同的算法,得出的結(jié)果可能會(huì)不同,這需要業(yè)務(wù)人員去驗(yàn)證其正確性。
影響數(shù)據(jù)挖掘結(jié)果主要有以下幾個(gè)因素:一是數(shù)據(jù)的準(zhǔn)確性,二是合適的算法。數(shù)據(jù)的準(zhǔn)確性必須在建立數(shù)據(jù)倉(cāng)庫(kù)時(shí),要保證數(shù)據(jù)的真實(shí)性和正確性,如果是碼表,則必須保證碼表的轉(zhuǎn)換是合法的數(shù)據(jù)。若結(jié)果與歷史情況不符,則必須驗(yàn)證數(shù)據(jù)挖掘的每一個(gè)步驟都正確,包括數(shù)據(jù)的來源、ETL過程、數(shù)據(jù)倉(cāng)庫(kù)的更新、挖掘算法、輸入列、輸出列、閾值及值的微調(diào)等。
4 評(píng)估與總結(jié)
研究的創(chuàng)新點(diǎn)在于以一套完整的、符合中國(guó)國(guó)情的企業(yè)客戶管理理論為基礎(chǔ),結(jié)合先進(jìn)的軟件技術(shù)、數(shù)據(jù)挖掘技術(shù),為企業(yè)如何快速、高效的實(shí)施企業(yè)客戶管理提供有力的參考與借鑒。充分討論了數(shù)據(jù)挖掘技術(shù)所帶來的重大意義,以及在客戶管理中應(yīng)用的步驟和方法,并給出具體的實(shí)例做為參考。
但是數(shù)據(jù)挖掘不是萬(wàn)能的,得出的結(jié)論也不是一成不變的,隨著數(shù)據(jù)的變化、時(shí)間的推移,運(yùn)行的結(jié)果也在變化。這需要技術(shù)人員、分析人員、業(yè)務(wù)人員、管理人員討論分析,并逐步修正數(shù)據(jù)挖掘的算法與閾值,以使數(shù)據(jù)挖掘應(yīng)用在任一時(shí)刻與現(xiàn)實(shí)相接近,從而保證結(jié)論的成功率。