會工具懂方法,但分析還是沒思路?這5點讓你擁有資料分析思維

文章來源:三元方差

資料分析師究竟要掌握哪些技能?

大部分的資料分析教學都會教你excel,Python,sql,機器學習,還有一些分析方法比如對比分析、漏斗分析、留存分析等等技能。

但是,很多人掌握了這麼多工具和技能,依然做不好資料分析。面對具體的業務問題,我們還是容易兩眼一抹黑。

就像我們大部分人學習英語,都會學習單詞、語法、音標等等,但是一開口就跪了。

而英語母語的人就算不懂語法是什麼,卻能如同擡手睜眼一樣自然地用英語表達。

這其中的區別,便是因為英語母語的人擁有“英語思維”。

想要做好資料分析也一樣,單單會工具和技能是不夠的,還必須擁有資料分析思維。

資料思維決定了你如何思考問題,如何搭配這些分析方法,如何得出結論,如何確定問題。

那麼究竟什麼是分析思維呢?我認為有以下幾個方面。

1、說事實,而不是觀點

資料分析師第一個要訓練的思維方式便是:只說事實,不說觀點。

事實和觀點這兩個名詞看起來區別很大。但實際上在生活中我們經常會將兩者混淆。

比如說你的同事告訴你:最近的轉化率大幅下降。

這句話到底是事實還是觀點呢?

很顯然這句話是觀點。究竟下降多少算大幅下降?也許你認為的大幅下降在我看來變化並不大。

那麼如果他說:轉化率下降了。

這句話是事實還是觀點呢?

這句話看起來已經非常像事實了,但是實際上它依然屬於觀點。

有這樣一種情況,轉化率在短期內它看起來是下降的,但是你站在宏觀的層面上,以月為單位甚至以年為單位,它是它是上漲的,那麼你究竟說他是上漲還是下跌呢?

那麼什麼是事實?

週一到週三的轉化率持續下降,週三相比周一已經下跌了5%。

這句話就是事實,這句話不同的人都能理解,不會出現歧義。

只有分清楚觀點和事實才有繼續分析的可能性。

因為觀點的溝通會出現誤差,而事實則不會。如果我們用觀點進行溝通,自然會出現大量的誤解。

如果連背景都沒有理解清楚,後續的分析也就無從談起。

2、用客觀標準代替主觀判斷

但是單純只有資料,對業務問題的分析沒有什麼幫助。

畢竟我們得知道這個資料到底帶來了哪些業務資訊。

所以最後事實還是要歸納成“觀點”。

不過如果我們用主觀判斷資料的好壞,那麼還是回到了原來的老路上去。

那麼週三相比周一轉化率下跌了5%,這個資料到底表現如何呢?

想要解讀出觀點,我們需要先找到一個標準。

標準怎麼找?

1.可以是老闆定的標準,看資料是否符合老闆心中的標準。雖然這也是拍腦袋,不過老闆畢竟是老闆,他們心中有些戰略構想是建立在某些條件滿足的基礎上的。所以沒什麼說的,如果老闆不滿意,那這資料肯定是有問題的。

2.可以看行業和競品的平均標準,看資料下降是否是行業的普遍現象。

3.看企業過去的平均水平,可以在歷史資料中找到類似場景下的資料情況,和自己的過去對比。

然後我們通過資料和這些標準進行對比,得出一個觀點。

比如我們可以分析每週的情況,看歷史上是否存在這一的趨勢,平均下跌是多少?

如果歷史上每週三都會下跌,平均下跌7%,那麼我們就可以認為目前資料比較正常,沒有問題。

這樣得出的結論全都是客觀的,如果你不找標準,而用主觀判斷資料的好壞,那麼不同部門的人會溝(shuai)通(guo)很久。

3、不預設立場

人們總是習慣於通過自己的現存經驗和知識去判斷未知事物。

這本身是進化帶來的優勢,它能讓人在資訊不完備的情況下迅速做出決斷並付諸實施。

這種預設立場的思維在原始人的時代很有價值,其優勢在於:

第一,不浪費寶貴的能量,大腦是能量消耗大戶;

第二,快速決斷,避免因為低效決斷而錯失機會,這一點在避免傷害時尤為重要。

在資料分析的場景下,我們需要儘可能地找出真實原因。此時這種預設立場的決斷方式會造成許多錯誤,因為現有經驗和知識在應對未知事物時是不足的,是有偏差的。

而且不同崗位的人還會存在“屁股決定腦袋”的現象。

如果出現了業務問題,關聯的業務方往往預設一個立場:這事沒有看起來那麼糟,或者這事和我沒關係。

比如轉化率下降了,業務方的反應往往是這個資料下降肯定跟自己無關。

自己的運營活動明明做的很成功,轉化率下降一定是行業因素、使用者質量等等其他因素導致的。於是為了證明這個觀點,他們順著這個預設的前提,找到一些相關的證據來解釋轉化率下降的現實。

實際上,想要證明一個觀點,只要你肯去找,不管觀點多麼荒謬,總能找到支援你的理由。

不僅辛普森悖論這種統計學的把戲可以得出完全相反的結論,即使最簡單的“真話不全說”的方法,也能達到這種目的。

比如,我說兩個比較荒誕的列子。

1.把正例說成反例。

我想要證明一種物質是有害的,我列舉出以下論點:

1.它是酸雨的主要成分;

2.對泥土流失有促進作用;

3.過多的攝取可能導致各種不適;

4.面板與其固體形式長時間的接觸會導致嚴重的組織損傷;

5.吸入該物質容易引發窒息;

6.處在氣體狀態時,它能引起嚴重灼傷;

7.在不可救治的癌症病人腫瘤中已經發現該物質;

怎麼樣,你會不會覺得這是一種非常危險的物質,實際上上面描述的是“水”。

2.想要把反例說成正例也沒問題。

比如中國男足,想要把男足描述成世界強隊行不行?當然行。

1.哥斯大黎加是世界盃史上為數不多能夠戰勝中國隊的國家

2.即使是巴西隊這樣的世界強隊也僅戰勝過中國隊一次

3.自2002年韓日世界盃後,中國隊在世界盃正賽上不敗紀錄已經延續12年

4.縱觀漫長的世界盃史,中國隊也僅輸過三次

5.中國隊從未在世界盃點球大戰中失利過

6.中國隊在領先的情況下從未丟過球

你看,只要你想證明一件事,總能找出一些證據。

所以,預設立場再去找證據是一件相當不靠譜的事。

資料分析部門一般獨立於業務部門之外,這樣可以確保資料分析師沒有業績壓力,分析具有獨立性。

因為資料分析的獨立性,所以最終問題究竟是在產品上、運營上或者市場上,資料分析師不會有明顯的偏向,只認客觀資料。

同樣是轉化率下降了,資料分析師的職責就是找出下降的真實原因。他們要梳理出和轉化相關聯的各個環節,獲取資料,根據資料推演出合理的結論。

有些資深的資料分析師有一定的業務敏感度,他們會提出一些可能性很大的假設。比如他們猜測可能是運營出現了問題,那麼就需要找到一些資料來驗證這個假設。

但是假設驗證和預設立場不同。

預設立場,是要找到證據來證明猜想,一個數據不行,那就換另一個數據。直到能證明這個觀點為止。

而驗證假設,則是事先規劃驗證這個假設需要的資料。如果資料最終不符合假設,那麼就拋棄這個假設。

好的資料分析師,能夠根據客觀資料,隨時拋棄舊的假設,並建立新的假設。

拋棄固有的思維定式,這是非常反人性的,這也是為什麼說資料分析需要專業訓練的原因。

4、演繹而不是歸納

邏輯思維方法分為歸納法和演繹法。

歸納法是從特殊到一般的推理,是從結果找原因的方法。

也就是說,通過觀察很多個別事物的特殊性,然後概括出同類事物的特徵。

但是我們一般不可能觀察到這個事物的所有樣本。所以歸納法得出的結論是不確定正確性的。

你有沒有聽過這個故事:

在一個火雞飼養場裡,一隻火雞發現,不管是豔陽高照還是狂風暴雨,不管是天熱還是天冷,不管是星期三和星期四,每一天上午的9點鐘,主人都會準時出現,並給它餵食。

於是,它得出了一個驚天大定律:“主人總是在上午9點鐘給我餵食。”

時間來到聖誕節的前一天,上午9點,主人又一次準時出現,但是這一次,主人帶來的並不是食物,而是把它變成了食物….

這個是英國哲學家伯特蘭·羅素提出的一個問題,被稱為「羅素的火雞」,用來諷刺那些歸納主義通過有限的觀察,得出自以為正確的結論。

大部分人思考問題,會優先使用歸納法。因為這是人類認識世界的方法,這是人性決定的。

比如一月到三月的成交金額連續上升,初級分析師往往會說:成交金額呈現上升的趨勢。

這句話的潛臺詞是,預計交易金額在四月份也會上升。

這是典型的歸納法思維:因為過去是這樣的,所以未來應該也會繼續這樣。這和那隻火雞的思維其實也沒有什麼本質的差別。

而且這和沒分析一樣,你把資料丟給業務方,他們也能看出目前呈現上漲的趨勢。

如果想要做好資料分析,就不能濫用歸納法,這點依然很反人性。

那我們用演繹法,如何思考這個問題的呢?

演繹法是從一般到特殊的推理,是從原因找結果的方法。

要想預測四月份的成交金額會如何,首先需要分析前三個月的成交金額為什麼會上漲?當時的背景是什麼?上漲需要哪些條件?

四月份的這些條件是否依然存在?如果維持成交金額上漲的條件不變,我們才能說四月份會繼續延續這種上漲的勢頭。

經過演繹法推理的結論才是合理的,而且我們通過深挖找出了內部的原因,這才是業務人員想要知道的。

資料分析的價值就體現在這。

5、找出背後的邏輯

資料分析師是需要大量的邏輯思維訓練,但我們自己做好還不夠,我們的工作必需和業務方溝通,幫助他們解決實際的業務問題。

但是很多業務人員沒有考慮清楚就跑來溝通,他們的需求可能充滿了邏輯問題,這時我們就需要幫對方理清思路,找出對方表述背後的邏輯。

資料分析師往往會聽到業務方這樣問:本週的轉化率相比上週已經下降了5%,怎麼辦?

這句話聽起來感覺沒什麼問題,實際上邏輯並不是特別嚴密。

首先,這句話的前半部分很好地表達了事實,值得表揚。如果前半句是一個觀點,我們還要先找到事實。

但是這句話的後半句有問題,後半句的“怎麼辦”,放在這個語境中,潛臺詞其實是這樣的:

  • 本週轉化率相比上週下降了5%
  • 這是個不好的情況
  • 需要解決這個問題
  • 怎麼辦?

相比最開始的表述,我們分析出這句話中間出現了兩個衍生的問題。

問題1:轉化率下降5%真的是不好的情況嗎?

這就涉及到了標準了,之前提到了我們要找到一個客觀標準,通過標準解決出資料的業務含義。

因此我們首先要協助業務方找到一個標準。

問題2:如果資料表現真的不好,那麼這是現在急需解決的問題嗎?

這個問題的答案也是不一定。

商業世界要解決的問題太多,在同一時刻,永遠存在著各種各樣的問題。

業的資源是有限的,不可能同時解決所有的問題。問題的解決必然有輕重緩急之分。

那麼憑什麼要先解決轉化率的問題,而不是解決引流的問題、留存的問題、活躍度的問題?

資料分析師必須瞭解企業當前的戰略方向,把有限的資源投入到更重要的方向上。

如果上面這兩個隱藏的問題不想清楚,就開始分析怎麼辦,那麼這類分析師的工作往往會費力不討好,做很多低績效的工作。

技藝理性需要長時間的練習

說到這兒你有沒有覺得,分析師的工作和法律工作者非常的像。

法官只看事實,一切都講證據。

法官需要標準,標準就是法律文字。即使被告的行為看起來多麼地不符合社會道德,只要法律沒有規定不允許,那麼法官就不能認為有罪。

法官不預設立場,法律的原則是無罪推斷,任何人在未經證實和判決有罪之前,都視其無罪。

法官要用演繹法推斷。法官的判決講究證據鏈完整。證據鏈中的鏈字,就有一環扣一環的含義在其中。很明顯就是需要用演繹法來進行分析。

最後律師要理清當事人的邏輯,大部分人是說不清一件事的,當事人在律師的引導下把事情逐漸還原。

法律史上有一個非常著名的故事,可以為我們帶來一些啟發。

在1608年,英國國王詹姆斯召見了法官,提出一項要求:既然法官只是國王的代理人,國王自然有權直接裁決訴訟案。

但大法官柯克反對說:國王本人不能裁決任何案件。

詹姆斯一世說:“法律以理性為基礎,除了法官之外,我和其他人一樣具有理性,為什麼就不可以裁決訴訟案?”

柯克大法官很聰明,先誇了國王一番:“確實,上帝賦予了陛下卓越的技巧和高超的天賦;”

接著,他又說:

“但陛下對於英格蘭本土的法律並沒有研究,而涉及陛下之臣民的生命或遺產、或貨物、或財富的案件,不應當由自然的理性,而應當依據技藝理性和法律的判斷來決定,而法律是一門需要長時間地學習和歷練的技藝,只有在此之後,一個人才能對它有所把握。”

這個故事中非常重要的觀點就是“自然理性”不等同於“技藝理性”,而技藝理性是需要長時間的專業練習的。

資料分析也一樣。

總結

很多人想要資料分析速成。

他們認為“自然理性”加上“分析工具和方法”就能做好資料分析。

分析工具、分析方法等技能確實可以速成,但是資料分析的能力不是自然理效能夠駕馭的。

想要做一個好的資料分析師,必須擁有資料分析的思維,這是一種“技藝理性”,有一點反人性,必須花大量的時間訓練才能掌握。

如果你學會了很多資料分析的工具和技巧,依然做不好資料分析。

建議嘗試練習本文提到的思維。

要點很簡單,堅持,堅持,堅持。

關注數據君的臉書:

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。按贊我的臉書,會有豐富資料包贈送唷!

Written by

這是一個專注於數據分析職場的內容部落格,聚焦一批數據分析愛好者,在這裡,我會分享數據分析相關知識點推送、(工具/書籍)等推薦、職場心得、熱點資訊剖析以及資源大盤點,希望同樣熱愛數據的我們一同進步! 臉書會有更多互動喔:https://www.facebook.com/shujvfenxi/

這是一個專注於數據分析職場的內容部落格,聚焦一批數據分析愛好者,在這裡,我會分享數據分析相關知識點推送、(工具/書籍)等推薦、職場心得、熱點資訊剖析以及資源大盤點,希望同樣熱愛數據的我們一同進步! 臉書會有更多互動喔:https://www.facebook.com/shujvfenxi/

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store