Coremo 液壓動(dòng)力液壓制動(dòng)器的工業(yè)應(yīng)用的制動(dòng)系統(tǒng)
數(shù)據(jù)挖掘技術(shù)在營銷中的應(yīng)用模式
營銷需要解決的問題是:哪些用戶是某個(gè)產(chǎn)品或者營銷活動(dòng)的目標(biāo)用戶?或者是每個(gè)用戶適合推薦什么產(chǎn)品?前者是找目標(biāo)用戶,后者是為用戶推薦產(chǎn)品,兩者是類似的。我們可以利用數(shù)據(jù)挖掘技術(shù)對(duì)顧客的購買行為和歷史的規(guī)律進(jìn)行分析和挖掘,從而定位目標(biāo)用戶群體,實(shí)現(xiàn)以顧客為中心的營銷。
1、營銷方法論
以顧客行為數(shù)據(jù)為基礎(chǔ),結(jié)合數(shù)據(jù)挖掘技術(shù)和不同營銷手段,建立營銷流程,形成從數(shù)據(jù)分析、預(yù)測模型、模型營銷應(yīng)用以及后續(xù)監(jiān)測和評(píng)估的閉環(huán)。
如下圖1是營銷方法論,將數(shù)據(jù)挖掘和營銷活動(dòng)有機(jī)的連接形成了營銷閉環(huán)。
數(shù)據(jù)挖掘是指從大量數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程。在營銷中我們常用的數(shù)據(jù)挖掘的算法有:聚類、分類、關(guān)聯(lián)。
1)聚類
聚類是一種無監(jiān)督的學(xué)習(xí)算法,也就是說聚類不需要”結(jié)果變量“,它可以通過對(duì)自變量的探索自動(dòng)告訴你應(yīng)該分成多少類。聚類的基本原理是根據(jù)樣本自身的屬性,用數(shù)學(xué)方法按照某種相似性或差異性指標(biāo),定量地確定樣本之間的親疏關(guān)系,并按這種親疏關(guān)系程度對(duì)樣本進(jìn)行聚類。
聚類在營銷中的應(yīng)用
某電商公司進(jìn)口食品類目需要探索不同消費(fèi)者群體特征,我們結(jié)合近半年購買進(jìn)口食品類目的顧客的購買品類、購物方式、購物時(shí)間等因素通過聚類進(jìn)行分類,找出每類用戶的特征。通過聚類我們分成了11組,可以看出每一組人群特征,從而針對(duì)不同的組實(shí)現(xiàn)營銷。
2)分類
分類是一種有監(jiān)督的學(xué)習(xí)方法,分類屬于預(yù)測性模型,是通過對(duì)過去數(shù)據(jù)的學(xué)習(xí)來判斷未來某種行為。例如在電商客戶中事先定義好顧客是否流失,如果我們要預(yù)測未來一段時(shí)間某個(gè)顧客是否流失,這時(shí)就要構(gòu)建分類模型。分類學(xué)習(xí)方法所使用的數(shù)據(jù)集稱為訓(xùn)練集,訓(xùn)練集中每一個(gè)個(gè)體都有明確的類別,通過訓(xùn)練集中的數(shù)據(jù)表現(xiàn)出來的特征,為每一個(gè)類找到一種準(zhǔn)確的描述或者模型。
分類在營銷中的應(yīng)用
小王的目的是通過下周天氣預(yù)報(bào)尋找什么時(shí)候人們會(huì)打高爾夫,他了解到人們決定是否打球的原因主要取決于天氣情況。而天氣狀況有晴,云和雨;氣溫用華氏溫度表示;相對(duì)濕度用百分比;還有有無風(fēng)。如此,我們便可以構(gòu)造一棵決策樹,如下(根據(jù)天氣這個(gè)分類決策這天是否合適打網(wǎng)球):
從上面分類樹種我們可以看出人們打高爾夫的條件是:晴天并且濕度小于70或者多云天氣或者雨天不刮風(fēng),這三種情況人們打高爾夫的概率會(huì)比較大。
決策樹是是分類模型常用的方法之一,其優(yōu)點(diǎn)是容易理解、預(yù)測準(zhǔn)確度高。除了決策樹我們還可以利用logistic回歸,神經(jīng)網(wǎng)絡(luò)、貝葉斯分類器、SVM等算法構(gòu)建分類模型。
3)關(guān)聯(lián)
關(guān)聯(lián)分析是從大量數(shù)據(jù)中發(fā)現(xiàn)項(xiàng)集之間有趣的關(guān)聯(lián)和相關(guān)聯(lián)系。關(guān)聯(lián)分析的一個(gè)典型例子是購物籃分析。該過程通過發(fā)現(xiàn)顧客放入其購物籃中的不同商品之間的聯(lián)系,分析顧客的購買習(xí)慣。通過了解哪些商品頻繁地被顧客同時(shí)購買,這種關(guān)聯(lián)的發(fā)現(xiàn)可以幫助零售商制定營銷策略。
在數(shù)據(jù)挖掘當(dāng)中,通常用“支持度”(support)和“置性度”(confidence)兩個(gè)概念來量化事物之間的關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則A->B的支持度support=P(AB),指的是事件A和事件B同時(shí)發(fā)生的概率。置信度confidence=P(B|A)=P(AB)/P(A),指的是發(fā)生事件A的基礎(chǔ)上發(fā)生事件B的概率。同時(shí)滿足小支持度閾值和小置信度閾值的規(guī)則稱為強(qiáng)規(guī)則。比如:Computer=>antivirus_software,其中support=2%,confidence=60%,表示的意思是所有的商品交易中有2%的顧客同時(shí)買了電腦和殺毒軟件,并且購買電腦的顧客中有60%也購買了殺毒軟件。
關(guān)聯(lián)規(guī)則在營銷中應(yīng)用
某電商公司的類目運(yùn)營通過找出二級(jí)類目之間的關(guān)聯(lián)性,來指導(dǎo)跨類目的聯(lián)合促銷。我們通過訂單數(shù)據(jù)利用關(guān)聯(lián)規(guī)則計(jì)算關(guān)聯(lián)性結(jié)果如下:
根據(jù)上述的關(guān)聯(lián)規(guī)則,我們?cè)谧龃黉N活動(dòng)時(shí),可以考慮將廚房調(diào)料和紙質(zhì)品、廚房調(diào)料和糧油、餅干和堅(jiān)果等相關(guān)產(chǎn)品一起捆綁銷售。