小心陷阱!資料分析的常見誤區,你有踩雷嗎?

--

資料是客觀的,但解讀資料的人是主觀的。如果對資料產生誤解,導致分析結果和事實不符,則可能造成決策失誤。資料分析中常見的誤區可以簡單分為意識誤區邏輯誤區兩大類。

今天來給大家分類介紹幾個在資料分析過程常見的誤區,幫助大家更好地規避它們!

意識誤區

1、資料分析很高大上

許多人在提到資料分析時,就覺得那只是少數掌握高階的分析方法或是分析技能的人的事情。

其實不然,真理至簡。在分析方法上,我們常說的四象限分析、SPAN圖、SWOT分析,都是經過驗證的簡單有效的分析模型,我們根據不同情況用這些模型,就是站在“前人的肩膀”上做分析。

在分析工具上,做資料分析也並不要求大家都掌握 Python、精通演算法,只要有合適的分析方法,找到關鍵性的指標,我們每個人都能用BI、Excel這樣的簡易工具完成分析。

2、 需要大數據才能支撐分析

日常我們聽到資料分析,往往都和大數據這個詞掛鉤,但實際上兩者並無任何依賴關係,更多是在炒作大數據這個概念。

分析需要的是特定資料,而不是更多的資料。大數據在很多情況下,其實是無法人力剔除髒資料的情況下的方案,透過放大資料量,減少這些內容的影響。但是如果我們的樣本,已經可以反映全量資料,那就已經直接進行分析,並且得到的結論也具有足夠的可信度。

3、與實際業務脫鉤

分析是無止境的,因為有著無窮無盡的變數,但是我們做分析是帶有明確目的性的,不要為了分析而分析。

解決這個誤區最管用的辦法,首先要找到最核心的指標(北極星指標),比如我們當前核心目標是app促活;再明確我們能做的事情,比如分析發現給的紅包力度越大,使用者越頻繁使用,留存率越好,但這明顯不是可行方案。那我們最終的結論很可能是長期透過運營內容,週期性透過紅包促活,這樣才能保證合理的獲客成本,實現良性的迴圈。

4、過分依賴資料過分依賴資料

過分依賴資料過分依賴資料一方面,會讓我們自己做很多沒有價值的資料分析;另一方面,也會限制產品經理本身應有的靈感和創意。

資料分析是達到目標的一個科學手段,但不是唯一的手段,而且過分依賴資料也會變得不科學。當資料缺失或是問題簡單時,資料分析並不是必要的步驟。假如你去造一個汽車,分析以往馬車的情況意義不大,甚至限制了對汽車舒適度和速度的想象。

邏輯誤區

1、辛普森悖論

先透過一個案例瞭解一下什麼是辛普森悖論:

這個表格中,不管是商學院,還是法學院,男生的錄取比例都比女生高很多,但是總體來看,女生錄取率卻是男生的兩倍。這種在分組比較中都佔優勢的一方,在總評中有時反而是失勢的一方的情況,就是辛普森悖論。

再舉一個例子,A 應用的使用者每日平均訪問時長提升了,因此我們得到了結論,使用者的粘性提升了,大家做的真棒!

但這是真的嗎,如果此時我們把使用者根據型別拆分來看,可能會得到如下的結論。

這能反映什麼呢?核心使用者和非核心使用者的日均訪問時長都沒有變化,似乎與之前的結論相悖。

此時我們就可以進一步分析,去檢視核心和非核心使用者的佔比情況。我們可以看到核心使用者佔比提升了,哦,原來是核心使用者佔比高,所以整體來看,拉高了日均訪問時長,此時又忍不住想誇一句大家做得真棒!

但這難道就是真的嗎,我們需要再看一下各類使用者的具體數量。

此時我們才得到了真正的結論,原來是非核心使用者減少了,有大批使用者的流失,才讓我們的指標看上去顯得變好了。

在這個問題中,我們就不只是看最終日均訪問時長結果,更應該加上使用者數這個觀測指標,或是透過合理的規劃,將使用者數的作用體現在最終指標裡。

迴避辛普森悖論的方法是:斟酌個別分組的權重,以一定的係數去消除以分組資料基數差異所造成的影響;瞭解該情境是否存在其他潛在要因而綜合考慮。

2、因果陷阱

在介紹因果陷阱之前,先給大家舉日常生活中經常會看到的觀點:打籃球能讓人長高、喝咖啡可以長壽、不吃早飯容易變胖、會撒嬌的女人更好命……然而事實真的是這樣嘛?下面我們來分別給出這幾個常見觀點隱藏的因果陷阱:

3、倖存者偏差

在講述倖存者偏差的之前,先給大家舉幾個例子:

🔶Amazon上賣極限運動裝置的商家,尤其賣降落傘、滑翔傘的賣家好評都是滿的,從來沒有差評。(出事故的人:“我倒是想有差評的機會”);

🔶別人家的孩子都比你強。(日常接觸會放大瑕疵,偶爾接觸會放大優點);

🔶讀書無用論、成功學。(天時地利人和缺一不可,哪怕只從自己身上看,態度勤奮可以爭取,挫折都可以模仿,但頭腦遠見幾乎不能複製。)

倖存者偏差出現的原因是邏輯和統計上的錯誤,本質是統計時忽略了樣本的隨機性和全面性,用區域性樣本代替了總體隨機樣本,從而對總體的描述出現偏差。當然倖存者偏差還很大程度上反映了人性的弱點,人性總是會讓我們忽略或篩選資訊,最終導致倖存者偏差。

要避免倖存者偏差有一下幾個方法:

🔷關注沉默的資料,當我們已經習慣了在熱搜上看到年入百萬、豪車豪宅,tiktok的崛起讓「沉默證據」發力:原來下沉市場才是更為廣闊的人群。

🔷學習數學統計知識,避免公式錯誤。就像講述辛普森悖論裡的案例,表面欣欣向榮,其實暗藏了使用者流失的風險。

🔷提升認知水平和邏輯思維能力,發生倖存者偏差很大程度是因為認知不夠寬廣,只知道表面資訊,沒抓住關鍵資訊,最後導致判斷失誤。

文章來源:帆軟大師兄
文章連結:https://mp.weixin.qq.com/s/OisAq1i6RU8TO9La6DB9FA

※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。各位也可以關注我的Facebook,按讚我的臉書並私訊「10」,送你十週入門數據分析電子書唷!期待你與我互動起來~

文章推薦

餅圖變形記,肝了3000字,收藏就是學會!

MySQL必須掌握4種語言!

太實用了!4種方法教你輕鬆製作互動式儀表板!

跟資料打交道的人都得會的這8種資料模型,滿足工作中95%的需求

妙呀!一行Python程式碼

回顧十週入門數據分析系列文:

關注數據君的臉書:

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。按贊我的臉書,會有豐富資料包贈送唷!

--

--

數據分析那些事
數據分析那些事

Written by 數據分析那些事

這是一個專注於數據分析職場的內容部落格,聚焦一批數據分析愛好者,在這裡,我會分享數據分析相關知識點推送、(工具/書籍)等推薦、職場心得、熱點資訊剖析以及資源大盤點,希望同樣熱愛數據的我們一同進步! 臉書會有更多互動喔:https://www.facebook.com/shujvfenxi/

No responses yet