一圖帶你看懂:資料分析、資料探勘、資料產品,到底有什麼不同?

自己從事資料工作多年,幹過大多的資料崗位,成為管理者後,也帶過很多的人,關於各類資料崗位人才的關鍵素質,自己也形成了一套看法。

正如智商是多基因作用的結果一樣,要成為某類資料崗位的人才,肯定也是多因素決定的結果。

但每類資料崗位還是有其特定要求,而能適配這些特點的人更能在這些崗位脫穎而出,我這裡就結合自己的實踐,談談五類崗位最關鍵的要求和各自工作內容的區分。

圖片來源於leecode

資料分析師最關鍵的素質,是要有“下立地,上頂天”的氣質。

“下立地“就是要接地氣,要有足夠的取數實踐,具備較強的業務和資料敏感性。

很多合作伙伴的大牛深諳資料分析的討論,方法論牛逼,PPT寫得很好,但一般實操還是不行,主要的制約因素就是資料能力,資料分析工作一般不會外包,主要在於外包人員很難長期的“接地氣”。

資料理解能力不是說你知道有這個表和這個欄位就可以了,也不是看看資料字典就可以了,而是要能知其所以然,要能追根溯源資料是怎麼來的,要能知道這個資料是否真實的反映了業務的實際狀況。

同樣一個業務口徑,往往可以採取多種資料口徑,而要辨析清楚這個差別,選擇到最適合的,一定要有足夠的取數實踐。

“上頂天”就是膽子要大,臉皮要厚,能說會寫,敢於跟上級去溝通互動。

“下立地”在迫使你成為一個內向的人,“上頂天”則迫使你成為一個外向的人,資料分析師一定是能夠達到很好平衡的人。

在跟上級的互動中,資料分析師會始終處於學習期,不斷接受上級的指示,然後消化吸收,然後反饋,然後再接受指示,如此迭代……,這才是資料分析師真正的成長之路。

所有的資料分析技巧和方法論,都可以在跟上級的互動中學到,這些才是真功夫,不用刻意去學習什麼金字塔理論,老闆的言傳身教就是最好的方法論。

這種能達到“下立地,上頂天”的資料分析師,最後大多突破了資料分析師這個崗位本身,成為一名優秀的管理者,我數了下自己欣賞的很多資料分析師,後來大多成為了主管,即使是到了其他部門也是晉升迅速。

資料分析其實是數字化時代每個人都要具備的能力,擁有資料分析的技能不僅是為了滿足領導的決策需要,更要能直接指導生產。

我總是建議資料分析師有機會一定要到各個實際業務崗位磨練一下,因為現實世界並不是靠系統上儲存的那些資料所能完全反映的,如果你始終囿於一隻資料團隊內部,只喜歡跟資料打交道,那隻能做一顆螺絲釘。

所謂成也資料分析師,敗也資料分析師。

資料探勘師最關鍵的素質,不是模型能力,而是要有產品思維。

企業中真正有價值的資料探勘師往往不是技術最強的那個。自己曾經管理過很多的資料探勘工程師,每當需要評定每個資料探勘師的業績時,技術能力最強的常常排在後面,而評價最高的往往是有想法,願配合的那個人,那個人甚至不會R或Python,只會點EXCEL的技能。

當前大多企業的數字化水平一般,資料探勘工程師面臨的環境並不友好,大多企業資料探勘師面臨的最大挑戰,其實是要能夠找到資料模型在企業生產流程的真正應用場景,規模化這些場景,創造出真正的價值。

現實中的資料探勘師一定是能理解業務,熟悉流程,懂得系統,會做分析,還會運營,不要只會對著電腦猛幹,圍繞著AUC,ROC,F1這些指標閉門造車。

資料探勘師要能把模型當成一個產品去運營,具備產品的思維和方法,能設定目標並找出實現的道路,能正確的識別問題、並找出最合適的解決方案(不僅限於技術方案),帶領團隊把大問題化解為小問題,最終完成專案。

也就是說,其能在整個產品的生命週期從頭到尾將一個模型產品負責到底,在筆者做成功的幾個資料探勘專案中,無一例外遵循了以上的原則,凡是不遵循的,全部失敗了。

數倉模型工程師最關鍵的素質,是要有工匠精神。

數倉模型的好壞直接決定了應用的效能,其也是資料中臺的核心內容,但對於數倉模型工程師的挑戰也特別大,這是由數倉模型的生態位決定的。

數倉模型夾在基礎資料和上層應用之間,承上啟下的價值巨大,但也是最容易被忽略和替代的。

因為上層應用完全可以繞過數倉模型,直接基於基礎資料完成應用模型的建設,雖然應用要花點代價做自己的個性模型,但架不住快和靈活啊,對於單個應用來講,其沒有驅動力去配合數倉模型工程師完成中臺模型的構建,即使這種行為從長期來講損害企業利益。

正是由於這個背景,數倉模型工程師前期沒啥成就感,很難被理解,做的工作非常枯燥。

一:要對企業的資料資產要有全域性的理解,這個不下苦功夫不行。

二:要對垃圾的原始資料做清洗,這個沒點執著的精神不行。

三:要基於對業務和資料的充分理解進行領域、概念、邏輯和物理建模,並且要在沒有業務推動的情況下去沉澱最佳化。

四:要厚著臉皮去推銷自己的成果,可能還要建章立制。

最後,技術也沒啥好研究的,維度和關係建模都是幾十年前的東東了。

數倉模型是在做長遠的正確的事情,沒有足夠的耐心很容易放棄。筆者帶過的很多數倉模型師,要麼去做報表取數了,要麼去做應用去了,即使做維護也好啊。

資料倉庫領域的怪現象就是,數倉專案一旦完成,數倉模型就基本停滯發展了,5年都沒有什麼改變,因為人都跑完了。

但數倉模型一旦做好了,價值也非常大,因為底層模型做好了,其效能可以輻射到所有的應用,否則就不會有資料中臺了。

這讓我想起孔子對得意門生顏回的評價:“吾與回言終日,不違,如愚。退兒省其私,亦足以發,回也不愚。”

孔子的意思是:“我和顏回談論一整天,他從不提反對意見和疑問,就像一個愚笨的人。可是,我注意觀察他課後的情況、卻發現他很能發揮我所講的內容,顏回並不愚笨啊。“

數倉模型工程師無需顯山露水,更不能賣弄聰明走捷徑,好的模型都是自己一步一個腳印運營出來的,但正是這些模型構成了資料中臺真正的底蘊,所謂大智若愚。

資料產品經理最關鍵的素質,是要對於資料有深刻的理解。

資料產品經理是產品經理的一個子集,但到底是與資料相關的素質重要,還是與產品經理相關的素質重要呢?

這裡我從客戶的視角出發給出兩個看法。

第一個是有關資料產品主要內涵的,我覺得客戶對於資料產品有兩大訴求,一種是以資訊展示為主,解決資訊快速獲取的問題,比如報表和指標,另一種是以資訊加工為主,解決精準度的問題,比如洞察、營銷或風控,而以流程為核心的大多數產品,即使有一些資料的內容,也不屬於資料產品的範疇。

第二個是有關資料產品核心能力的,在我們運營的所有資料產品中,雖然前期客戶會關注這些資料產品的互動、功能和體驗,但如果客戶是來真的,最終還是會聚焦到資料上來,客戶對我們最大的訴求,最終都是資料質量問題或者是模型準確度問題,其他所有的問題,都是可以解決的。

資料產品經理如果不理解資料,解決上述問題的效率還是很低的。

當前垂直行業是資料產品最大的藍海市場,但要切入垂直行業,資料產品經理除了要去理解這個行業的業務,更要能思考自己的資料和模型能為這些行業提供什麼樣的差異化價值,這才是資料產品成功的關鍵。

雖然資料產品從名稱看,似乎是產品的一個子集,但從客戶的訴求看,兩者則是完全不一樣的東西,純資料產品跟功能型產品的差異,就好比OLTP跟OLAP系統的差異一樣,有天壤之別。

OLAP已經成為了一種正規化,資料產品也一樣,其核心就是資料,而不是流程或者其它。

很多企業是沒有取數工程師這個崗位的,記得我剛進單位的時候,乾的是SQL取數的工作,但崗位名字卻叫作開發工程師,很多企業把取數工程師納入了資料分析師的範疇,這個不太合適,還有的叫作BI工程師,也是怪怪的,考慮到幹取數工作的同學基數實在很大,因此我還是要說說這個崗位需要的最關鍵素質。

FineBI

取數工程師最關鍵的素質,我認為是“開天闢地”,“開天”是主動性訓練,“闢地”就是尋求多樣性。

我帶過的大多數下屬都經歷過取數工程師這個階段,取數雖然技術天花板不高,但透過取數可以讓你迅速理解公司的業務和資料,這是後續從事資料相關工作的一個基礎。

但成也取數,敗也取數,透過簡單的被動取數實踐能提升的業務和資料的能力是有限的,一般在6個月-2年內迅速達到天花板,再進一步就非常困難了,很多取數人員掌握的技術只是簡單的SQL一項。

“開天”是指取數工程師應該採取更為主動的姿態去學習取數。

一:是要能主動請纓,儘可能地拓展業務支撐的範圍,這樣可以讓自己擁有更廣的業務和資料視野,千萬不要坐井觀天。

二:是要能主動溯源,即能透過血緣分析等手段知道任意資料的來龍去脈,因為取數接觸的表大都是被“閹割”過的模型,這些模型在提升便利性的同時,也過濾掉了大量的有價值資訊,理解了資料的底層可以讓你的取數能力超越大多數人。

三:是要能主動思考,即儘可能去理解業務人員取數的業務背景及業務人員的分析思路,然後給出更好的取數方法,業務人員對有想法的取數人員會肅然起敬。

“闢地”是指取數工程師始終要探索其他崗位的可能性,因為取數工程師其實是資料從業者的一箇中間狀態,其離真正的技術有點遠,離真正的業務也有點遠,你不可能靠取數去直接實現資料驅動業務的理想。

當你具備一定的資料基礎後,一定要尋求從事更貼近業務和技術的資料崗位,無論是資料分析師、資料探勘師、資料產品經理或者資料開發工程師等等,“開天”之後的取數工程師,一定會獲得這種機會,我沒有見過不成功的,只見過不努力的。

就先講這五個崗位,其他的崗位有機會再談,這其實也是見仁見智的事情。

轉載自:我的資料人才觀 by 大魚先生

※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。各位也可以關注我的Facebook,按讚我的臉書並私訊「10」,送你十週入門數據分析電子書唷!期待你與我互動起來~

文章推薦

淺談資料分析的魅力和能力要求!

4 款 MySQL 調優工具,公司大神都在用!

如何避免分析兩分鐘,運行兩小時?這是一份SQL優化大全

這是一個專注於數據分析職場的內容部落格,聚焦一批數據分析愛好者,在這裡,我會分享數據分析相關知識點推送、(工具/書籍)等推薦、職場心得、熱點資訊剖析以及資源大盤點,希望同樣熱愛數據的我們一同進步! 臉書會有更多互動喔:https://www.facebook.com/shujvfenxi/