必須要掌握的資料分析模型——購物籃模型

--

要想做好資料分析📂必定要理解和熟悉掌握各類資料分析模型,但網路上的大部分文章只是給你羅列出了有哪幾種資料分析模型及對應理論,並未用例項來輔助說明。

很多時候,看完就只是看完,並沒有深刻理解這種分析模型,等到下次要開始分析資料了,又是一臉懵,然後再去收藏夾裡翻文章。

學東西在精不在多,今天就分享1個常用的資料分析模型 — — 購物籃分析模型,並附上應用例項,希望能讓大家真正掌握這個分析模型,並在之後分析資料時能自己把模型靈活用起來!

購物籃分析模型原理

購物籃分析(Basket Analysis)是商品分析中常用的一種數據分析手段,經典案例“啤酒和紙尿褲搭配售賣”就是一種購物籃分析。

不知道大家去逛超市時有沒有發現,超市裡常會把嬰兒的紙尿褲和啤酒放在一起售賣。其實原因也很簡單,超市經過資料分析發現,買尿不溼的家長以父親居多,如果他們在買尿不溼的同時恰好看到了啤酒,就會有很大的機率購買,從而就能提高啤酒的銷售量。

看到這,你可能會覺得這不是常識嗎?為什麼還是個資料分析模型。

其實不然。雖然這種現象你看過去是常識,但這種透過研究使用者消費資料,將不同商品之間進行關聯,並挖掘二者之間聯絡的分析方法,就叫做商品關聯分析法,即購物籃分析模型。需要透過「支援度」、「置信度」、「提升度」三個指標判斷商品之間的關聯程度,常用於零售行業。

購物籃分析(Basket Analysis)也叫做商品關聯分析法。關聯這個詞大家應該都很好理解,就是反映某個事物與其他事物之間相互依存關係。

在購物籃分析中的定義是,通過對顧客的購買記錄資料庫進行某種規則的挖掘,最終發現顧客群體的購買習慣的內在共性。

這個模型一般是用來找出顧客購買行為的模式:
①比如使用者買了A商品,是否會對B商品產生什麼影響?
②不同的使用者是否具有不同的購買模式?
③哪些產品應該放在一起進行捆綁銷售?

在分析案例前,先解釋下這三個指標分別代表的意思和計算方法。

「支援度」:A商品和B商品同時被購買的機率,顯然支援度越大,商品間關聯性越強。

計算公式:同時購買A和B訂單數 / 總購買訂單數

今天共有10筆訂單,其中同時購買可樂和薯片的次數是7次,那麼可樂+薯片組合的支援度就是7/10=70%。

「置信度」:因為購買了A所以購買了B的機率,注意與支援度區分。

計算公式:同時購買A和B訂單數 / 購買A的訂單數

今天共有10筆訂單,其中購買可樂的次數是4,同時購買可樂和薯片的次數是3,則其置信度是3/4=75%

「提升度」:先購買A對購買B的提升作用,用來判斷商品組合方式是否具有實際價值,大於1說明該組合方式有效,小於1則說明無效。

計算公式:支援度 / ( (購買A次數/總購買訂單數)*(購買B次數/總購買訂單數) )

今天共有10筆訂單,購買可樂的次數是8,購買薯片的次數是6,購買可樂+薯片的次數是6,那麼提升度是0.6 /(0.8*0.6)>1,因此可樂+薯片的組合方式是有效的。

講完購物籃模型的原理和計算公式,只能大概掌握一些皮毛,接下來就帶各位用例項來應用一下購物籃分析模型,加深印象。

案例分析

以我們最為熟悉的超市為例。案例背景是A集團超市最近在準備週年大促,需要根據近3個月A集團超市旗下各門店商品銷售明細,來確定哪些商品需要組合起來捆綁促銷。

先不急著分析,先理清一下思路,要解決這個問題,我們需要從以下五個步驟進行思考。

第一步:確定使用工具、資料來源

使用工具:FineBI資料分析工具

資料來源:A集團超市商品銷售總表

A超市商品銷售總表

第二步:計算指標

根據上述計算公式可知,我們需要計算

①總購買訂單數 ②同時購買A和B的訂單數 ③分別購買A和B的訂單數

接下來,我們就利用FineBI工具來逐個計算。

①總購買訂單數

要計算總購買訂單數,首先我們要先勾選「單據編碼」,新增分組彙總,設定彙總方式為「去重計數」,對單據編碼個數求和,從而輕鬆計算出總購買訂單數。

②計算同時購買A和B訂單數

要計算同時購買A和B的訂單數,就需要複製一列相同的商品類別,將兩列合併在一起,就可以分出比如A+A、A+B、B+A等的商品組合。

讓表左右合併,而後選擇並集合並,合併依據為單據編碼。

將商品名稱作為A商品,集團商品總表-商品名稱作為B商品。顯然,不需要類似 A+A 的組合,因此需要將該資料過濾掉,輸入函式【商品名稱!=集團商品銷售總表-商品名稱】即可。

③計算分別購買A和B的訂單數

新增左右合併,並將合併結果命名為「購買A的次數」,B商品同理計算。

第三步:計算支援度、置信度、提升度

得到上面三個指標後,我們就可以開始計算支援度、置信度、提升度了。

支援度=同時購買A和B訂單數/總購買訂單數,新增列。置信度,提升度同理,就不列舉了。

第四步:資料分析

計算得到支援度、置信度、提升度的結果後,我們就可以開始進行資料分析了。

使用FineBI的自定義圖表,分析商品間的關聯程度,用顏色的深淺和具體計算數字來表示關聯程度的高低。

商品關聯分析
商品支援度分析
商品置信度分析
商品提升度分析

第五步:得出分析結論

(1)微爽日用衛生巾和家之寓圓形夾曬架的支援度(同時購買機率)最高,為5.95。且購買家之寓圓形夾曬架後又購買微爽日用衛生巾的置信度較高,為0.27,大於平均置信度,因此兩者被一起購買的機率很大,可放置在貨架的相鄰位置,刺激顧客購買慾。

(2)本地小白菜和香妃蜜瓜的置信度最高,為0.42。因此可將小白菜和香妃蜜瓜放在果蔬貨架的相鄰位置或捆綁銷售。

(3)青蔥和雪碧的提升度最高,為8.44。即購買雪碧後對購買青蔥有較大的提升作用,但考慮到青蔥和雪碧的購買量都較大,且都為常備品,基於實際情況來說,不適合捆綁銷售。

(4)鹽津鋪子和嘉士利威化餅的提升度較高,為4.54,大於1。兩個都為零食貨櫃商品,因此可考慮捆綁銷售。

總結

經過上述五個步驟,我們可以得出初步的分析結論。當然,最後的零售促銷方案還是得根據超市的實際情況來判斷合不合適(例如分析結論中的青蔥和雪碧),資料只能輔助我們的決策,而不能直接給予決策。

文章來源:李啟方
文章連結:https://zhuanlan.zhihu.com/p/404056422

※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。各位也可以關注我的Facebook,按讚我的臉書並私訊「10」,送你十週入門數據分析電子書唷!期待你與我互動起來~

文章推薦

餅圖變形記,肝了3000字,收藏就是學會!

MySQL必須掌握4種語言!

太實用了!4種方法教你輕鬆製作互動式儀表板!

跟資料打交道的人都得會的這8種資料模型,滿足工作中95%的需求

妙呀!一行Python程式碼

回顧十週入門數據分析系列文:

關注數據君的臉書:

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。按贊我的臉書,會有豐富資料包贈送唷!

--

--

數據分析那些事
數據分析那些事

Written by 數據分析那些事

這是一個專注於數據分析職場的內容部落格,聚焦一批數據分析愛好者,在這裡,我會分享數據分析相關知識點推送、(工具/書籍)等推薦、職場心得、熱點資訊剖析以及資源大盤點,希望同樣熱愛數據的我們一同進步! 臉書會有更多互動喔:https://www.facebook.com/shujvfenxi/

No responses yet