漂亮≠好,看多了網路上的視覺化報表,是不是總覺得老闆喜歡酷炫的報表?事實上以我的經驗來說老闆只想:一眼,清晰、明確地看到他想看的數據,這才是他最關注的東西。然後說不定他會順便誇下:這報表做得不錯,很漂亮唷。如果做的太過花哨,老闆只覺得扎眼。(報表美化不如直接去做設計師XDD)

首先我要告訴你一句話:想要做好Excel報表,一定要記住,報表是先做乾淨,再做漂亮。

先把報表做乾淨

要知道報表美化只是錦上添花的一件事,報表的最終目的是傳達我們想要傳達的數據。

在正式美化之前,你需要調整好這些細節:

1、去零

誰也不想開啟一份Excel表格,滿屏密密麻麻的數據撲面而來,裡面還摻雜著不少0,把表格裡的零值去掉,整個表格會清晰不少。

  • 對整個工作表去零
    點選【檔案】 — 【選項】,在彈出的【Excel選項】視窗中,選擇【高階】,然後找到【在具有零值的儲存格中顯示零】,並將前面的勾選給去掉。
  • 對區域性儲存格去零
    可以使用替換,把表格的零值替換成空或是短橫線,為了區域性去零,需要把【選項】裡的【儲存格匹配】勾選起來,否則單元格里只要數字有帶0的就會全部被替換掉。

2、去掉####

很多不熟悉Excel的同學髮現儲存格出現“####”之後,大概率都用滑鼠一個一個拖拽吧?內容顯示不全時,儲存格中便會顯示出“####”,的確讓整個圖表看起來既沒有資訊量又不專業。但手動修改花費時間太長,非常不划算。

解決辦法:
利用Excel的“格式”選單 — — “自動調整列高”和“自動調整欄寬”兩個功能,或者Ctrl+A全選該表格,在需要調整的列或者欄中雙擊,防止出現“####”這種尷尬的內容。

Image for post
Image for post

3、快速分開擠成一團的的資料

絕大多數人都會遇到這種情況 — — 從word文件或者其他文件複製貼上資料到Excel,在Excel的資料全部擠在一欄……你可以笨拙(蠢)的一個一個把它們填充到不同的儲存格中,但顯然不太現實。

解決方法:
其實針對這種“亂成一團”的資料,使用Excel的分行功能,就能完美解決:點選“資料” — — “資料剖析”,設定好後你會看到,資料乖乖回到了不同的儲存格中去。(省時省力,一次搞定,工作效率就是這麼上來的。)

Image for post
Image for post

還有設定電話號碼顯示格式、刪除重複值、小數變整數……等等諸如此類,這些礙眼的小細節一定要糾正掉。(如果不知道怎麼修改,搜尋引擎是個好東西,建議多用。)

現在我們可以對報表進行最後一步的優化,以做到圖表清晰:

1、資料對齊

老生常談了,不多贅述。最保險就是資料左對齊,表頭合併居中

2、格式一致

保持儲存格內資料的字型、字號與格式一致。
對於性質相同的表格,格式保持一致。(如何快速統一表格樣式?右鍵點選某工作表的標籤,選擇“選定全部工作表”之後進行編輯,完成後再點選“取消組合工作表”就行了。)

3、一些細節設定

框線美化:淡色框/填色橫紋比無框更靠譜。
刪除Excel灰線:檢視 — — 去掉網格線的勾,取消後就沒有了灰色的網格線,變成白茫茫的一片。
限制寬度:標題40、正文30。會使表格看起來不那麼擁擠。
字型修改:一般可以用微軟雅黑(但有版權,未購買企業不能對外使用),阿里巴巴普惠/思源都是不錯的免費字型。行、欄標題請加粗。
圖表避免使用傾斜標籤
注:以上的操作均為核對完畢資料的準確性後所做的表格美化,一定要確保資料的準確性!再開始美化!!!(敲黑板)別等做完了,發現了資料缺漏重複,剛做好的樣式又被打亂。

報表美化升級

1、報表配色

(1)在做報表時,可以遵循的原則是:首部顏色最深,中間部分雙色分佈。

(2)在圖表方面,尤其配色上,平時多看一些行業研究報告網站/機構/出版物上的設計:

Image for post
Image for post

還有一些研究機構喜歡用鮮豔活潑的深淺色對比,也能讓人印象深刻:

Image for post
Image for post

(3)做表時,可以進一些配色網站,吸取其提供的色板顏色。

Image for post
Image for post

不錯的配色網站有:

http://color.uisdc.com/pick.html

https://webgradients.com/

https://uigradients.com/#Predawn

http://tool.c7sky.com/webcolor/#character_2

(4)當然更方便的,還是套模板。

一些不錯的Excel模板網站,免費的有千圖網(限制次數)、Excel學習網等等,付費的就比較多且更正規,有:包圖網、我圖網、熊貓辦公等等。

2、表格的多樣性

圖形千千萬,為什麼總是柱狀圖?

不同型別的圖表有不同的呈現方式,表達的重點內容也不一樣。

一般來說,資料通常包含五種相關關係:構成、比較、趨勢、分佈及聯絡。

Image for post
Image for post

構成 — — 主要關注每個部分所佔整體的百分比,如果你想表達的資訊包括:“份額”、“百分比”以及“預計將達到百分之多少”,這時候可以用到【餅圖】

比較 — — 可以展示事物的排列順序是差不多,還是一個比另一個更多或更少呢?“大於”、“小於”或者“大致相當”都是比較相對關係中的關鍵詞,這時候會首選【條圖】

趨勢 — — 關心資料如何隨著時間變化而變化,每週、每月、每年的變化趨勢是增長、減少、上下波動或基本不變,這時候使用【線圖】更好地表現指標隨時間呈現的趨勢

分佈 — — 是關心各數值範圍內各包含了多少專案,典型的資訊會包含:“集中”、“頻率”與“分佈”等,這時候使用【柱形圖】;同時,還可以根據地理位置資料,通過【地圖】展示不同分佈特徵

聯絡 — — 主要檢視兩個變數之間是否表達出我們預期所要證明的模式關係,比如預期銷售額可能隨著折扣幅度的增長而增長,這時候可以用【氣泡圖】來展示,用於表達“與……有關”、“隨……而增長”、“隨……而不同”變數間的關係。

還有一些圖表中的小巧思,也值得一試:

1、使用資料條、色階和圖示集來突出顯示資料

(1)資料橫條 — — 有助於使用者找到較大或較小的數字。

如在假日銷售報表中找到銷量最好和最差的玩具。資料條越長,表示值越大;資料條越短,則值越小。

(2)色階 — — 可幫助使用者瞭解資料分佈及變化情況,如投資回報隨時間的變化。

單元格具有兩種或三種顏色漸變的陰影,這些顏色與最小值、中間值和最大值的閾值相對應。

(3)在由閾值區分的三到五個類別中,使用圖示集呈現資料。

每個圖示代表一定範圍的值,可用代表該範圍的圖示對每個單元格進行批註。例如,在擁有三個圖示的圖示集中,用一個圖示突出顯示大於或等於 67% 的所有值,用另一個圖示突出顯示大於或等於 33% 且小於 67% 的所有值,用第三個圖示突出顯示小於 33% 的所有值。

步驟:開始-條件格式-資料橫條/色階/圖示集

2、迷你圖:可以讓Excel中有數有圖,一目瞭然,瞬間提升專業度

Image for post
Image for post

如果你需要直接傳送Excel,在傳送前,檢查妥當之後再點擊發送,比如:

如果表格過長,那麼儘量凍結首部。
沒必要呈現的內容,建議做隱藏處理,而不是刪除,這樣方便下次修改。

以上是分享我的一些經驗,由於寫得比較趕,很多細節都沒有展開,其實對於報表製作,還有很多Excel擴充套件外掛、Excel同性質的軟體工具,不少我用下來覺得都很不錯,後面抽時間再更新。

致所有的同學:行百里者半九十,要做就把事情做到最好。

關注數據君的臉書:

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。按贊我的臉書並私訊我「10」,會有豐富資料包贈送唷!


最近群裡有個小夥伴成功拿到了某大公司數據分析師崗的offer,一拿到offer就與我分享了他的喜悅,不得不說大公司在薪水方面真是慷慨,資料分析崗起步月薪就在10萬左右,對剛畢業的同學來說收入可以說是很可觀!

Image for post
Image for post

要拿到一份不錯的offer,學歷、能力固然重要,一份好的簡歷更加重要,它是決定你是否能拿到面試機會的關鍵因素,如果連簡歷這一關都沒過,縱使你有再多的才華也無處施展。

之前也接觸過很多求職數據分析崗位的朋友,也看到不少求職者發給我的簡歷,有很大一部分的人的簡歷和自身實力不匹配,要麼是過分誇大其詞,面試兩句話一問就露出馬腳,要麼就是能力和背景都還不錯,但是簡歷寫的太不出彩,讓人感覺判若兩人。今天這篇就給大家來說說,數據分析師的求職簡歷應該如何寫,給大家提供一些建議。

資料分析師簡歷結構

一般來說一份完整的簡歷應該至少包括這幾個方面:個人基本資訊、教育背景、工作經歷、專案經驗、知識技能。至於興趣愛好之類的可以寫,如果沒有什麼特別的亮點也可以不寫。

數據分析崗位對專業技能的要求比較高,在知識技能的部分一定要體現自己的專業能力符合招聘要求,同時也應具備綜合技能。演算法方向的數據分析崗位和業務向的數據分析能力要求側重不同,演算法向更加註重程式語言、分析工具,以及數學能力的掌握,業務向更加註重業務分析知識、溝通能力、分析工具的掌握,這個大家可以對照崗位的招聘JD去寫。

Image for post
Image for post
能力雷達圖
Image for post
Image for post
偏向演算法的數據分析JD
Image for post
Image for post
偏向業務方向的數據分析JD

能力符合要求了,學歷背景也還可以的話,面試官下一個看的就是你的工作經歷和專案經歷,這兩個下面我們重點講。

專案經歷怎麼寫?

對於大部分人來說最頭疼的就是寫簡歷的專案經歷,有的小白沒有專案經歷,會從網上去抄別人的,有的人做過專案,但是不知道怎麼把專案介紹好。

其實簡歷寫專案經歷的目的,也是讓HR/面試官更好地瞭解你在資料分析方面的能力。清楚地描述出你在專案中做了哪些工作,使用了哪些技能,如果你專案經歷很豐富,儘量挑產出價值大的,和所應聘行業貼近的。

給大家看一個例子:

CD用戶消費行為分析專案描述:對CD用戶的相關數據進行分析,分析用戶消費頻率、購買金額、生命週期等行為。

這樣專案經歷描述就非常的空洞,沒有將經歷和數據分析要求的能力完全匹配,我們可以把它改成這樣,如果有完整的分析報告,可以附上鍊接:

CD網站數據用戶行為分析(2019.1–2019.2)專案介紹:為了平台創造出更多的利潤,並且能夠合理的投放廣告,使用網站歷史8個月的銷售數據進行分析,根據復購率、回購率、高額消費用戶等指標以及消費模型得到高價值的用戶進行有針對的客戶管理和維護。負責內容:1、使用python結合pandas分析庫,進行空值和異常值等處理,平均值、箱線圖等描述行分析。2、使用python可視化工具展示每月用戶回購率、復購率、留存率等指標觀察用戶行為3、使用RFM模型分析用戶價值度,並對高價值用戶進行管理4、專案詳情:附具體連結
工作經歷怎麼寫
這裡分兩個部分講,因為有一部人可能是從其他行業轉行資料分析,原先沒有資料分析相關的工作經歷。

工作經歷怎麼寫

這裡分兩個部分講,因為有一部人可能是從其他行業轉行數據分析,原先沒有數據分析相關的工作經歷。

先說有數據分析相關工作經歷的:

工作經歷主要包含兩點,一個是工作內容,另一個是工作成就。有的人在原來的公司做的可能是很小的事情,比如給老闆定期輸出經營分析報告

你只這麼寫肯定是不行的,太簡單,怎麼寫才能讓面試官看出來你能力強,做的事情非常大呢?教大家一個方法:工作經歷=工作內容/目的+重要實現過程+成績描述

給大家再舉個例子,比如給老闆定期輸出經營分析報告這個工作,我們把它加上重要實現過程就是:

負責整體公司分析框架,主要從流量、使用者、品類、物流等幾個方面為高層提供高價值分析報告

再加上成績描述就是:

負責整體公司分析框架,藉助分析方法,深度研究獲客、留存、復購率、客單價等方面資料,給業務部門提供決策依據。為市場部節約xxx萬,獲客成本較同行相比降低x%,獲客效率大大提升,成本方面得到有效的控制;接觸使用者畫像、個性化推薦觸點機制,對營銷方式進行精確優化,大大提高了復購率,較去年增加X%…

這樣一改,是不是立馬不一樣了,適當地包裝的自己經歷是可以的,但是也要注意在面試前做好充分的準備,不要過分誇大。

那要是沒有數據分析工作經歷怎麼辦?

儘量往數據分析相關的內容上靠,很多工作崗位在平常工作中都或多或少涉及一些簡單的數據分析,比如運營、銷售、人力資源等等,雖然你沒有專業的數據分析經歷,讓面試官知道你有數據分析的意識也是好的。

另外數據分析這個崗位除了專業能力之外,對業務的理解以及溝通能力的要求也是非常高的,在工作經歷的描述中可以凸顯出來

幾個注意點和技巧

1、重點突出,語言精練

作為一個數據分析師,應該具備邏輯思維能力,語言的描述要幹練,內容重點突出,層次分明,不相干的東西不要寫。

2、善用數據量化結果

數據分析師肯定要善於利用數據,多用數據來表達結果,少用形容詞。比如“促進公司銷售增長”、“提高效率”等等,換成“銷售額同比上漲30%”“節約1.5個人天,用數據量化結果,會更加令人信服。

3、藉助圖表豐富內容

常規的簡歷都是文字,大家都想盡辦法地在配色、標題、排版上下功夫,對於數據分析師來說,更加有創意的方法是,可以利用視覺化圖表來展示簡歷,既展現了專業能力,又能令人耳目一新,留下深刻印象。

比如通過雷達圖來展示自己各項技能的掌握狀況;用餅圖來表述工作內容模組等等

Image for post
Image for post

最後,希望大家都能成功拿到心儀的offer,加油唷!

關注數據君的臉書:

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。按贊我的臉書私訊「10」,會有豐富資料包贈送唷!


投稿:軟妹

大家有沒有覺得,做報表並不是一份價效比高的活?

做了3年報表的我,從只會vlookup開始學Excel,中間也穿插學習了一些VBA和Access。原以為精通Excel可以走天下,但是越到後面越發現遇到了瓶頸。領導希望報表出的越快越好,資料不能有差錯,圖表要精美視覺化要好看……但殊不知:

  • Excel資料處理容量和速度有限制,你給我一份100多萬條的資料Excel根本放不下,而且處理速度超級慢。
  • Excel的資料視覺化程度不高,都是以表格為主,資料堆砌,很難找到重點,雖然也能插入一些圖表,但是靈活度和美觀度不夠,設定起來也相當麻煩。
  • 資料獲取麻煩,每次都是從公司的系統導資料,相當費時間,而且還要經常做重複資料加工。

前幾天拿了一張駕駛艙報表問我這周能不能做出來個類似的….深深感受到了老闆日益增長的奇異想法和我的Excel技術的增長速度之間不匹配的矛盾。

Excel現在給我的最大痛苦就是佔資源特別嚴重,每次都卡得要死,這好像不是堆計算機資源就能解決的問題。其他的解決方法當然也有:比如是不是能改變一下我的使用習慣,減少公式的使用(自動計算很耗費資源啊),減少冗餘資料的出現。但是在Excel的使用背景下,這些似乎都很難避免。所以我就想,有沒有辦法找到一個軟體來替代Excel?

在網上遍歷了各種工具技術,也請教了公司管資料庫的技術同事,基本就是寫sql或python,或者直接用報表工具。前兩者屬於程式碼開發,但是我只懂sql,python起點太高,就主攻研究有沒有專業的報表工具。找到了企業資料報表領域的“替代品” — — FineReport,研究並學習了一陣。

一、操作類似Excel,但性質和原理不同,大大提升報表製作效率

Finereport類似Excel的報表設計器,選單欄、工具欄以及常用資料處理功能和函式都和Excel很像,對於有點基礎的同学上手還蠻快的。

Image for post
Image for post

但是體會下來,做報表的原理以及工具性質和Excel又完全不同:

從技術上講,Excel能直接儲存資料,直接在表裡對資料操作。FineReport是連結資料庫操作的,操作物件是資料庫中的表以及資料欄位,其操作過程是連結資料庫,然後拖拽欄位繫結單元格,做好報表模板釋出到伺服器,在網頁上展示。

用Excel效能上依靠你的電腦,所以資料量大容易崩潰;後者效能依靠伺服器、資料庫之類,電腦上純粹是一箇中間操作過程,所以效能不是一個量級的。

整個過程體驗下來有很多專業的功能,比傳統的Excel要省時省力得多,但是要學習和適應。比如連線資料來源,不需要像在SQL資料庫中那樣寫很多程式碼,直接拖欄位。比如環比、同期比等公式,都是內建好的,不需要像Excel中那樣手動輸入公式。

報表製作來看,分為三類專業的報表設計方式

一種是普通報表,和Excel操作差不多,報表展現的時候是依靠著單元格的擴充套件與父子格的關係來實現資料的擴充套件。用它可以做各種展現類的複雜報表、票據套打報表、各種查詢類報表、填報報表…

Image for post
Image for post

第二種是聚合報表,截了張官方圖,就是報表裡面有很多種報表塊,每一塊都類似一張單獨的報表或者一張圖表。通過不同的表格塊來拼接形成一個複雜的大報表,同時塊與塊之間的擴充套件、行高、列寬不互相影響,典型的就是財務裡或者貨單中常見的不規則報表。

Image for post
Image for post

還有一種決策報表,重點在於視覺化,可以拖拽圖表和表格來做視覺化呈現,專門做駕駛艙一類的報表,比如上述我老闆要的大屏估計就是用這種方式來製作的。

Image for post
Image for post

相比較Excel而言,只能說人家是真的專門做報表的,一個是專業工具,一個是日常辦公通用工具。

二、填報是亮點,解決資料互動的毛病

之前我做報表彙總的時候,總是等各方資料都傳到資料庫中,再讓IT部門的同事把資料匯出來,很多時間都費在溝通和等資料上。另外,每次開啟20多個Excel我的電腦基本風扇呼呼響,所以當時希望有什麼指令碼能替我把這事給自動幹了。

這個在FineReport的使用過程中也找到了替代,剛才有提到可以做填報報表。我讓技術人員幫我把FineReport和資料庫做了連線,然後我在設計器做好了日常彙總資料的模板發給各業務員,他們把Excel導進去,資料被校驗後就進入了資料庫。而我作為彙總端,只需要一張查詢報表,按照平常彙總的固定格式設計,直接查詢一下就得出了想要的資料。當然我也不是沒花功夫,前期做了兩張報表、繫結好資料欄位,編輯資料格式,不過後續只要做匯入Excel和查詢報表兩件事即可,一勞永逸。

Image for post
Image for post

三、視覺化表現超級驚艷

視覺化這塊我沒有做太多嘗試,技術還沒有學到位,只是試著拖了幾個圖表,操作還是很簡單的,拖拽圖示 — — 繫結資料欄位 — — 設定資料展現格式。

主要還是做的給老闆看的駕駛艙,就是各種dashboard啦。

Image for post
Image for post

還有動態報表,資料可做鑽取和聯動,比如點選地區鑽取到省市,同時其他元件聯動由全國資料變更成省市資料,功能還是很強大的。

Image for post
Image for post

相比於Excel,個人使用下來總結一些感受差異。

在企業報表領域是可以完全替代的,配合著資料庫,基本能開發公司大大小小的各種專業報表,這裡的報表不僅僅是Excel報表,包括一些資料錄入、出入庫憑證、財務套打類報表、管理駕駛艙等等,基本都是技術和IT的報表開發者使用,畢竟需要點技術的。

但兩者無法直接比較,畢竟性質不同,Excel能儲存資料、處理資料、展示資料,基本能解決各種問題,但是越刁鑽的需求要求的技能也越高,對效能要求越高就不是簡單一個本地Excel就能解決的,需要上到資料庫、伺服器。

具體這裡羅列的測評細節,和技術同事評估後,大家可以看下

1、報表資料的統一管理

用Excel整理資料其實有很多問題:資料散落在每個人的電腦裡,每次收集都是郵件或者手動統計,然後資料有問題又要退回重來,費時間費人力,資料可能還不統一。如果能上傳到資料庫和FineReport這樣的報表工具,能做到統一線上部署,資料統一儲存在資料庫中,資料及時匯入不會丟失,規定好了校驗格式也可以避免資料對不上的問題,可以實現資料的實時展現。

2、線上填報

使用Excel進行資料的彙總,需要通過郵件或者其他形式將Excel表格發給統一收取資料的人員,流程複雜,工作量大,而使用FineReport的填報功能,只需要在web端進行填報即可講資料彙總到資料庫,避免了用Excel傳來傳去。

3、大資料量的支援

一般而言,如果你的Excel工作表在一個月之內就可能突破10000條記錄的話,這個時候建議用資料庫產品,儘管在Excel和資料庫之間可以進行資料轉換,但是當Excel的資料量過大的時候,它的查詢和計算的速度會明顯下降。比如:一個小小的超市,10名收款櫃檯員每天接待200人每人10件商品,Excel立馬倒下,根本不能施展手腳。FineReport支援大資料量,單次取幾十萬的資料量是絕對沒什麼問題的。

4、避免重複勞動

我所在的部門只是公司的一小支,基本每個部門都有一兩個專職做報表的,基本都採用Excel各自統計和彙總資料,如果使用了報表工具,相同報表可以簡單複用,一張報表做好後,其他部門直接用就可以了,維護起來也非常方便,只需要改這張報表就好可以實現所有報表的統一維護了。

關注數據君的臉書:

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。按贊我的臉書私訊「10」,會有豐富資料包贈送唷!


文源:量子位 @QbitAI

GitHub忽然“開源”了自己程式碼的一部分,還將它放在了GitHub上。

事件起因是這樣的

TypeScript的開發者Resynth忽然Po了篇文章,表示程式碼託管服務GitHub的全部原始碼被洩露。

Image for post
Image for post

他表示,在向官方GitHub DMCA提交的可疑檔案中,一個身份不明的人利用GitHub應用程式中的一個漏洞,冒充GitHub的CEO納特·弗裡德曼(Nat Friedman)上傳了機密原始碼。

事情一出,在HN上激起了網友的熱烈討論,也再次引發了關於GitHub安全問題的思考。

網友lrvick表示,包括他在內的許多安全人員,早就對GitHub上很多相關漏洞進行了公開演示。但除非“搞出個病毒”,微軟根本就不承認這些漏洞的存在。

而且,他早就說過,GitHub提交簽名的部分存在嚴重的設計缺陷,然而如今這件事發生,他們才引起重視。

Image for post
Image for post

所以,這位陌生使用者是怎麼做到的?

如何偽造成CEO本人洩露程式碼?

GitHub的原始碼管理器Git,並不能有效地防止使用者假冒。

Git的提交方式更接近於電子郵件,這也就意味著,使用者可以隨意起使用者名稱和填寫郵箱,所以做點小手腳也沒關係。

— — 除非提交的資訊上有GitHub CEO弗裡德曼的GPG簽名,否則Git在提交資訊時,根本不會確認這是不是CEO本人的提交。(這次有問題的程式碼提交,就沒有CEO本人的簽名信息)

GPG(GNU Privacy Guard)是一個金鑰軟體,用於加密、簽名通訊的內容,也可作為管理非對稱密碼學的金鑰。

除非GPG簽名與郵箱地址相關聯,它並不會對提交物件的真偽進行確認。

也就是說,當你提出一個提交請求到Git本地倉庫時,你就會得到一個代表提交請求的雜湊值,可以通過它直接跳轉到你的分支。

Image for post
Image for post

GitHub類似於一個Web應用程式,負責提供瀏覽器到Git底層架構的請求互動,它會將所有的分支儲存到一個底層倉庫裡,哪怕它不以通常的形式出現在在URL架構中。

於是,一位陌生的使用者提交的檔案“光明正大地”進入了GitHub的DMCA儲存庫,還偽造成了CEO弗裡德曼的樣子。

Image for post
Image for post

為了做到這一點,這位陌生使用者先是複製了一份DMCA儲存庫、搞個分支出來,便於提交要洩露的GitHub原始碼

然後,陌生使用者偽造了弗裡德曼的使用者名稱和郵箱,將它提交了。於是,在DMCA儲存庫裡,名為弗裡德曼的使用者,自己提交了一份GitHub原始碼。

Image for post
Image for post

CEO迴應後,網友卻炸了

對此,GitHub CEO弗裡德曼做出了迴應,表示GitHub前段時間不小心混淆了一部分原始碼給客戶,但這不會影響GitHub的安全。

他甚至還吟了首勃朗寧的詩:一切都很好,情況也很正常,雲雀展翅飛翔,蝸牛在荊棘上爬動,世上一切順當!

Image for post
Image for post

但顯然,網友們並不在意這段原始碼是不是CEO本人洩露的,相反,這件事情再一次激起了他們針對“GitHub開源”這件事本身的怒火。

網友exabrial:您(指CEO)認為這是正常情況?你們是不是想通過偽造/無效的DMCA,刪掉其他的什麼專案?CEO弗裡德曼:這邊建議您閱讀DMCA工作原理呢。網友dannyw:如果GitHub真的提倡開源,它就不會是現在這樣。據我所知,微軟是RIAA的成員哦。

網友dannyw之所以提到RIAA(美國唱片業協會),是因為GitHub前段時間應RIAA的要求,直接刪除了GitHub上開源的油管影片下載器Youtube-dl。

Image for post
Image for post

一石激起千層浪,原本GitHub最初刪掉的相關專案就18個,現在一搜,竟然冒出了4000多個。

Image for post
Image for post

有開發者稱,這次的“偽造事件”估計與Youtube-dl專案被刪有關,也可能是偽造者對微軟並不開放GitHub原始碼的控訴。

關於GitHub開源,還得從微軟收購GitHub後的一系列舉動說起。

微軟和它的“開源”

自2018年微軟收購GitHub後,一直聲稱自己“致力於開源”。

Resynth表示:“我們已經從大量商業廣告裡看到了(微軟對開源的熱愛),微軟打的這些廣告,的確讓它處在開源開發的最前沿。”

但與微軟提倡的“開源”理念相對,它直接封禁了好幾次社群開源的程式碼。

鬧到最近,就是這次偽造事件導火索的“Youtube-dl被封禁事件”。

Image for post
Image for post

有開發者表示,想要讓GitHub開放自己的原始碼,如今在微軟這看來,是絕對不可能的。

Resynth也表示,由於有閉源軟體的存在、以及Git的擴張,讓GitHub看起來更像是一個試圖“包含開源專案”的平臺,而非開源本身

例如,今年6月,GitHub曾經出現過宕機兩小時的情況,這期間,成千上萬個開源專案無法被訪問和使用。

Image for post
Image for post

對於這次GitHub洩露原始碼的事件,你怎麼看?

已經走丟的GitHub原始碼網址:
https://web.archive.org/web/2/https://github.com/github/dmca/tree/565ece486c7c1652754d7b6d2b5ed9cb4097f9d5

參考連結:
https://arstechnica.com/information-technology/2020/11/githubs-source-code-was-leaked-on-github-last-night-sort-of/
https://www.zdnet.com/article/github-denies-getting-hacked/
https://resynth1943.net/articles/github-source-code-leak/
https://news.ycombinator.com/item?id=24994746
https://www.theverge.com/2020/6/29/21306674/github-down-errors-outage-june-2020

關注數據君的臉書:

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。按贊我的臉書私訊「10」,會有豐富資料包贈送唷!


之前寫了兩篇駕駛艙製作教程,發現大家對視覺化駕駛艙很感興趣,不過構建給老闆看的駕駛艙,除了技術方面的實現,更重要的部分是要能科學的梳理出有用的指標體系!教程之前講過了,本文就指標體系來分享我的經驗!

指標體系設計

在建設領導駕駛艙之前,首要是調研、規劃、提煉指標,一般是建立在對全公司指標體系的基礎上,圍繞駕駛艙的主題,羅列出核心指標展示。

但是如何建設指標體系也是一門學問,足夠花一萬字來敘述。指標體系建設的常用方法是通過場景化進行指標體系的搭建,自上而下業務驅動指標體系建設,所以要在特定場景下做好指標體系建設,需要先選好指標,然後用科學的方法搭建指標體系。選指標常用方法是指標分級方法。

指標分級主要是根據企業戰略目標、組織及業務過程進行自上而下的指標分級,對指標進行層層剖析,主要分為一類、二類、三類。

一類指標:公司戰略層面指標

用於衡量公司整體目標達成情況的指標,主要是決策類指標,這類指標使用通常服務於公司戰略決策層。

二類指標:業務策略層面指標

為達成戰略指標的目標,公司會對目標拆解到業務線或事業群,並有針對性做出一系列運營策略,業務策略指標通常反映的是策略結果屬於支援性指標同時也是業務線或事業群的核心指標。

三類指標:業務執行層面指標

業務執行指標通常是對業務策略指標的拆解,用於定位業務策略指標的問題。業務執行指標通常也是業務過程中最多的指標。根據各職能部門目標的不同,其關注的指標也各有差異。業務執行指標的使用通常可以指導一線運營或分析人員開展工作,內容偏過程性指標,可以快速引導一線人員做出相應的動作。

按照這個邏輯,給老闆看的駕駛艙也通常會劃分為戰略型駕駛艙、業務分析型駕駛艙、業務操作型駕駛艙。

在規劃駕駛艙的指標時,需要遵從以下幾個原則:

1、與戰略目標一致

提升業績管理的策略重要性,強化業績管理與策略規劃的關係,同時整合業績管理的重要流程與機制,使業績目標能上下協調一致,擁有足夠的資源實現業績目標。

2、結果性指標與過程性指標兼備

除去結果性指標,如銷售額類、財務類指標外,在業務過程中的“過程性”指標也要關注監控。比如圍繞業績的客戶分析性指標、產品分析性指標、供應商渠道上分析型指標等,也需考慮在內。這樣才能保證分析的閉環,一眼看出問題,做出科學決策。

3、明確關鍵指標的因果關係

一個駕駛艙一個主題,指標之間必然有關係,最常見的是因果關係,比如為了掌握達到策略目標的各關鍵績效指標,老闆需要了解各關鍵指標與策略目標間的因果關係。

按照以上方法的梳理,基本能規劃出一個有經營閉環的駕駛艙是需要哪些指標的。但具體放什麼指標什麼資料,按照我的經驗,各行業不同,同行業每家公司不同,需要看調研出來的管理者訴求,比較吃業務經驗。

接下來就來分享各行業關於領導駕駛艙的常用指標,總結行業通用場景,可能會有一些參考建議!

銀行行業

在銀行一般較多的是行長駕駛艙唷!

針對整個銀行,主要關注:盈利能力及股東回報、業務規模及結構指標、主要產品定價、成本費用情況、資產質量情況

針對公司整體,以及一些零售、金融市場板塊,一般關注損益類指標和規模指標。

  • 損益類指標:淨收入、淨非利息收入、責任利潤、責任成本、資產減值損失
  • 規模指標:資產餘額、負債餘額、存款日均、貸款餘額
  • 針對對公、小微、零售、信用卡業務,要關注資產質量指標。
  • 資產質量指標:不良資產餘額、不良貸款率、撥備餘額、撥備覆蓋率

其他具體要看銀行的業務,公司銀行、交易銀行、零售銀行、金融市場、資產託管、資產管理…根據具體業務構建有主題的駕駛艙,圍繞其做盈利分析、規模分析、風險分析、同業分析。

Image for post
Image for post

零售行業

零售行業的高層管理訴求一般圍繞總部運營以及市場銷售部門監控整體業務的進展情況,以及各區域、門店或者商品的針對監控管理。

  • 模組分類:整體、營運、區域、門店、品類
  • 指標通常:銷售額、銷售量、毛利額、毛利率、客戶數、客單價、店數、店均銷售

圍繞經營情況,領導駕駛艙可以作為企業經營狀況的定期體檢報告。指標上主要展示影響企業發展的重點指標,為管理層瞭解企業經營現狀提供資料支撐。

圍繞業績,是高層和部門領導最關注的,領導駕駛艙可以展示當前時間點、時間維度、區域/門店維度等對業績進行立體展示,同時展示業績相關指標。

門店管理方面,門店作戰大屏用得居多,用於一線業績作戰,放置在各區域或者門店會議室,上至管理者下至普通員工都可以在大屏看到實時的戰績戰況,可實時展門店的當天累積營收額,或者深度實時分析,縱向深入挖掘業務細節點展示訂單數、會員訂單數、毛利率、業績達成率、區域銷售等,另外橫向多維度對比展示門店排行、品類排行、會員增長趨勢等。

Image for post
Image for post

保險行業

保險公司是一個銷售驅動型的企業,各業務線各部門各級領導都會比較關注保費的銷售情況,他們的KPI考核通常圍繞保費、人力兩方面。

經營分析(KPI)管理類

圍繞業績的銷售大屏對每個保險公司來說都是需要的,通過銷售大屏瞭解每日簽單情況,資訊公告等,幫助管理層監控KPI執行情況,提高資料信度、效度,並激勵業務部門完成KPI。

  • 通常展示的指標有:業務達成情況、同期同比、保費完成率,險種排名分析,客戶續保情況
Image for post
Image for post

風控管理類

數字化風險管理,償付能力風險、保險風險報告、市場風險報告、信用風險報告、聲譽風險報告、戰略風險報告、操作風險報告和流動性風險報告和資產負債管理看板 7大風險主題看板,清楚一目瞭然地從管理層的角度看到公司整體的風險情況。

  • 指標:總賬的資料和風險流程的資料包括但不限於償付能力比率、整體風險容忍度、整體風險限額、綜合成本率、賠付率、流動性覆蓋率、投資收益率。

財務分析類

財務總概況:整體展示包括利潤、收入、總費用、IE損失以及綜合成本在內的指標,並做到向下鑽取單個指標的功能。

財務單指標多維度分析:具體展示總表中五個指標之一,根據業務性質、渠道、分公司和險種等多個維度對單一指標進行分析,並實現多個維度間的聯動。

製造行業

整體經營、市場和銷售這都是會關注的,除此之外製造業還會關注生產效率、經銷存、供應鏈等業務。

營銷業績類

幫助公司掌握髮貨及銷售業務在關鍵環節的進度,實時掌握營銷現狀、快速發現公司發貨及純銷業務的問題、及時追蹤整改關鍵環節,以保證集團發貨及純銷年度目標達成。

指標有:

  • 銷售端:銷量、銷售額、銷售目標達成率、銷售同比增長;
  • 發貨端:發貨額、發貨量、發貨目標、發貨目標達成、發貨同比增長
  • 開發端:開發任務達成、上量協議達成、推廣任務達成、學術任務達成;
Image for post
Image for post

生產效率類

生產環節是製造行業的大頭,公司及生產基地的管理層,往往需要監管生產效率,包括裝置、產線的生產效率。

把握生產裝置綜合效率,從可用率、表現性、質量指數三個方面對裝置綜合效率OEE進行分解並與目標值對標,進行月、周、日的趨勢分析,定位影響裝置綜合效率的原因,找到問題並解決,提升裝置綜合效率。

  • 指標有:裝置綜合效率 OEE、產量、合格產量、產品合格率、工時、工時稼動率、定額生產速度、平均日生產速度、效能稼動率

總結

最後,在指標分解的過程中,規定是死的,業務是活的。需要因時因地制宜去做大屏的指標規劃,因此詳盡的科學調研少不了。畢竟給老闆看的駕駛艙,老闆看了、認同了、產生價值了;各部門能基於駕駛艙互相配合,通力合作,任務完成、決策及時,才算真的成功!

關注數據君的臉書:

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。按贊我的臉書私訊「10」,會有豐富資料包贈送唷!


日常工作中,分析師經常會接到一些專項分析的需求,首先會搜尋腦中的分析體系,根據業務需求構建相應的分析模型(不只是機器學習模型),根據模型填充相應維度表,這些維度特徵表能夠被使用的前提是假設已經清洗乾淨了。

但真正的原始表是混亂且包含了很多無用的冗餘特徵,所以能夠根據原始資料清洗出相對乾淨的特徵表就很重要。

前兩天在Towards Data Science上看到一篇文章,講的是用Pandas做資料清洗,作者將常用的清洗邏輯封裝成了一個個的清洗函式。

而公司的業務資料一般儲存在資料倉庫裡面,資料量很大,這時候用Pandas處理是不大方便的,更多時候用的是HiveSQL和MySql做處理。

基於此,我拓展了部分內容,寫了一個常用資料清洗的SQL對比版,指令碼很簡單,重點是這些清洗場景和邏輯,大綱如圖:

Image for post
Image for post

刪除指定行、重新命名行

場景

多數情況並不是底表的所有特徵都對分析有用,這個時候就只需要抽取部分行,對於不用的那些行,可以刪除。

重新命名很難過可以避免有些行的命名過於冗長(比如Case When 語句),且有時候會根據不同的業務指標需求來命名。

刪除行Python版df.drop(col_names, axis=1, inplace=True)刪除行SQL版1、select col_names from Table_Name2、alter table tableName drop column columnName重新命名行Python版df.rename(index={‘row1’:’A’},columns ={‘col1’:’B’})重新命名行SQL版select col_names as col_name_B from Table_Name

因為一般情況下是沒有刪除的許可權(可以構建臨時表),反向思考,刪除的另一個邏輯是選定指定列(Select)。

重複值、缺失值處理

場景

比如某網站今天來了1000個人訪問,但一個人一天中可以訪問多次,那資料庫中會記錄使用者訪問的多條記錄,而這時候如果想要找到今天訪問這個網站的1000個人的ID並根據此做使用者調研,需要去掉重複值給業務方去回訪。

缺失值:NULL做運算邏輯時,返回的結果還是NULL,這可能就會出現一些指令碼執行正確,但結果不對的BUG,此時需要將NULL值填充為指定值。

重複值處理Python版:
df.drop_duplicates() …


不知不覺四季度就過去三分之一了,馬上要年底了,一年一度的年終總結報告又要讓不少人頭疼了,辛苦一年的成績如何淋漓盡致地展現在老闆面前,讓領導多給點年終獎金呢?

今天我就給大家分享一些關於如何製作一份漂亮的年終總結報告的方法,相信一定對你有幫助!

一份好的年終總結報告的6個要素

從我入職以來,每年都要圍觀團隊成員的年終答辯,見過不下百份各式各樣的年終報告。很多新人第一次做年終報告,大多都是套用別人的模板,好處是框架基本沒啥大問題,能夠順利把報告說下來,但是難得出彩,千篇一律,很難在老闆腦海裡留下深刻印象。

當然,我也見過很多令我影響深刻的年終報告,從管理層的角度出發,一份好的年終報告對年底的績效評定是非常重要的,很多人沒有意識到,以為年終報告只是個形式。

怎麼製作一份精彩的年終總結報告呢?人民網之前有一篇文章總結了六個字:“精、準、核、重、復、思”

  • 精:年終總結一定要精煉。
  • 準:減少模糊表達,用數字說話
  • 核:突出核心價值
  • 重:突出重點,去掉冗餘資訊
  • 復:注重經驗總結,能夠分享給其他人學習
  • 思:有反思和改進

光看這6點還是覺得有點不好理解,不知道該從哪些方面具體入手?接下來我就圍繞這6點,給大家分享幾個實用的方法

方法一:先列大綱再填充,少說廢話

寫年終總結報告前一定要先列大綱,思考清楚的你報告要包含哪些模組的內容,這也是一份報告的靈魂所在,大綱千萬不要從網上抄!我見過很多套用網上模板的年終報告,報告的框架基本都是一模一樣的,大概是下面這樣:

Image for post
Image for post

說實話這樣的框架根本不能叫框架,按照這樣的框架寫下來,很容易變成流水賬,很難脫穎而出。年終答辯不是寫論文,沒有一個萬能的框架能夠套用,回顧總結、和未來規劃這些東西應該都是貫穿在你的報告裡的,開篇前言其實也沒人想看。

個人認為年終報告要給領導傳達的主要是這4點:

  • 今年工作成績怎麼樣,給公司帶來了什麼價值
  • 我是如何達成這個成績的,做了哪些努力
  • 這一年的工作我在該崗位的工作能力成長如何
  • 未來還有哪些值得反思和改進的點,讓老闆看到我的上進心

至於框架,要結合你所在崗位的工作內容和能力要求來列,我給不了萬能框架,只能寫個大概給大家參考,個人根據崗位不同,工作內容不同自行調整

Image for post
Image for post

方法二:充分利用資料或圖表展示成績

很多人在給自己的工作做總結的時候,喜歡用形容句,比如”取得了不錯的效果”,“帶來了很大增長”,這種模糊性的表達,讓人不能一下客觀的感知到你的工作成果,你說好是有多好呢?你說好就是真的好嗎?

所以,我建議大家在做總結的時候利用資料充分量化自己的工作,學會用資料彙報,從工作中梳理出重點指標、重點專案,以“資料展示 + 資料分析”的形式,結合圖表視覺化,讓領導直觀地看到成績。

像財務、銷售等部門的年終報告,涉及到大量的資料統計和分析工作,可以藉助資料視覺化圖表,讓資料展示更美觀,這裡也給大家提供幾個圖表使用技巧:

1、資料綜合統計類可以用儀表盤形式來展示目標完成度

Image for post
Image for post

2、發展趨勢可以用折線圖

Image for post
Image for post

3、資料對比分析

一般有這樣幾種,1、時間緯度和往年資料對比2、和同行資料對比3、在構成分析的基礎上比較兩個資料的構成,比如某些財務指標的變化等。

比較資料的大小,一般用柱狀圖、條形圖,比較資料結構一般用堆積柱形圖、堆積條形圖進行資料對比分析。除此之外,還可以根據分析的具體情況使用其他圖表。

Image for post
Image for post
Image for post
Image for post

方法三:只說重點,不要畫蛇添足

對重要的工作和亮點工作突出亮點彙報,小事情不要放上去。這一點是很多人都犯的毛病,年終覆盤的時候覺得自己的工作成就少,硬湊亮點,把做的一些小事情也寫上去湊數,反而起到畫蛇添足的作用。

舉個例子,如果一個人的工作亮點總結是這樣

  • 開闢了一條新的供應商鏈路,節約成本約50萬
  • 改變XX區銷售策略,擴大了銷售範圍,提升銷售額xxx萬
  • 建立了完整的銷售新人技能培訓體系
  • 優化了面對客戶的個人line形象

前三點都是成體系的亮點工作,最後一點就明顯用來湊數的,會給人留下你工作亮點不多的印象。如果你的全年的工作的確沒幾個,那就在描述重點工作上多花時間,梳理清晰的陳述邏輯,體現你的努力和價值,提高質量而不是要數量。

方法四:真誠至上,不自吹自擂

年終總結會非常容易開成「吹牛」大會,大家都是盡情宣揚自己的辛苦勞作、工作業績。適當的炫耀和誇讚是可以的,過多了會令人十分反感,讓人覺得你不真誠,工作業績是工作能力和努力最好的體現,其他的讚美的話都可以少說。

除了宣揚成績之外,還有有必要的反思,反思自己的不足,如何能夠做得更好,也可以對所在團隊提出一些可行的建議,領導更喜歡目光長遠的人。

除了不吹之外,也千萬不要自黑,有些人會在年終總結報告中分析問題原因的時候,將錯誤歸結到領導的工作安排不合理、同事不配合等等,有帶著情緒地發洩告狀之意, 這一點是非常不可取的,不管對別人有多不滿,不要才彙報成績的時候踩別人一腳,給別人的印象很不好

方法五:巧用工具

一份精美的年終總結報告,除了上述幾個要點,還可以加入很多圖表、創意圖表或者動態影片元素,讓報告更具美觀性,給人留下印象。下面給家分享幾個做彙報總結常用的工具

資料處理、圖表製作

1、Excel

Excel是大家都比較熟悉的圖表製作軟體了,功能就不介紹了,大家推薦兩個比較好用的外掛,對工作效率和效果幫助比較大:

Image for post
Image for post

(1)快速處理:方方格子

一款必備的基礎型外掛,有上百個實用功能:文字處理、批量錄入、刪除工具、合併轉換、重複值工具、資料對比、高階排序、顏色排序、合併單元格排序、 聚光燈、巨集收納箱等。

(2)圖表優化:Easycharts

主要圍繞圖表製作與優化的一個外掛,風格、顏色、以及圖表模板等,可以對你的視覺化帶來很大的幫助:

Image for post
Image for post

2、FineReport
一款BI數據分析軟體,資料處理、資料分析和視覺化功能很強大,而且操作步驟相當簡單,適合職場小白入手,拖拖拽拽就能生成視覺化圖表,用來製作資料視覺化報告非常方便,圖表之間能夠實現資料聯動,動態展示,圖表型別走商務風,很適合資料類彙報。

Image for post
Image for post

報告製作

1、PowerPoint

大部分的報告都是ppt形式的,功能大家也很熟悉了,我也不多說了,推薦一個提高ppt製作效率的神器 — — islide,是一款基於PowerPoint的外掛,可以實現統一字型,一鍵刪減文字、圖文一鍵對齊、圖表自動配色、PPT長圖等功能,這些都是PowerPoint自身沒有的。

Image for post
Image for post

2、口袋動畫

有時候我們會在別人的ppt開頭看到一段快閃動畫,給人的感覺很驚豔!用口袋動畫外掛做快閃動畫非常方便,只需輸入內容和文字就可一鍵生成快閃動畫,這樣的話我們就不需要花時間去到處尋找快閃模板。

心智圖製作

1、Xmind

心智圖製作工具,能夠清晰梳理工作邏輯,它專有的心智圖引擎,展示效果更好,豐富的繪圖元素,也提供了很多主題模板供使用者套用

Image for post
Image for post

2、幕布

字不多的話推薦用Xmind ,字多的話可以用幕布,它是一款結構化的大綱筆記,用來寫筆記比較多,它可以將大綱意見轉化為心智圖

Image for post
Image for post

關注數據君的臉書:

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。按贊我的臉書私訊10,會有豐富資料包贈送唷!


前幾天在論壇上看到這樣一個帖子:《資料分析是不是各類行業中最內卷的職位?》

帖子中的主人公是一位留學歸來的統計學專業碩士,學習和實習履歷非常光鮮亮麗,然而招聘開始後,陸陸續續面試了20多場資料分析崗位,卻無一成功!

Image for post
Image for post

這讓我想起了最近一個非常火的名詞:

「內卷」!

Image for post
Image for post

什麼叫做內卷?

比如,從前一畝普通的土地裡,播種半斤的種子就可以收穫800斤的糧食
而一個農名卻發現,如果播種1斤的種子,就只能收穫900斤的糧食;如果播種2斤的種子,就只能收穫1000斤糧食了;如果播種4斤種子,仍然只能收穫1000斤糧食;

Image for post
Image for post

為什麼會出現投入與產出不成比例的現象呢?

後來這位農名終於發現了問題的關鍵所在 — — 一畝農田裡的水分與營養成分是固定的,種子變多之後,會造成種子之間的惡性競爭。

這種現象就叫做內卷,即因為生產者內部競爭導致平均生產力的下降。

為什麼生產者的內部競爭會導致產出下降呢?我們不妨看一個生活裡的例子:

當年程式設計師還屬於稀缺崗位的時候,並沒有太多的加班現象;

當程式設計師數量爆炸時,崗位並沒有相應的提高,這時候程式設計師就會通過降低自身“賣價”,換取更大的價值機會:
A能加班1個小時,B就能加班2個小時,C就加班5個小時,D甚至能住在公司……

A只要5000塊錢,B就能只要4000,C就能只要3000,D甚至只需要一口飯就行……

這就造成了惡性競爭,也就是個人的最優選擇會導致整體效率的降低。

Image for post
Image for post

這時候你也許就會發現,自從生下來我們就經歷著各種“內卷”現象:考試、房價、畢業找工作……

內卷是一個社會的常態,你以為古代不會內卷嗎?其實古代也一樣。

小時候上歷史課我們都聽說過一個詞“豪強兼併”,人人都知道土地的重要性,所以地主豪強不斷兼併土地,大量農民喪失了土地變成了流民,一旦遇到災年就會大量餓死人,到時候必定是農民起義,推翻王朝,全國人口減半。

這就相當於伺服器資料重置,所有人都回到新手村從頭開始玩。等到這個遊戲再玩300年,玩不下去了又重置一次,如此週而復始。

Image for post
Image for post

那麼西方人是如何破解內卷的呢?很簡單,就是對外擴張,這就是建立殖民地的意義。

既然分蛋糕的人多了,要麼餓死一批人,要麼就把這個蛋糕做大,這就是內卷的核心。

資料分析也存在內卷嗎?

先丟擲個結論:目前資料分析行業內卷化只是初見端倪,未來只會更加嚴重!

十年前,只要是從事資料分析行業的人,現在估計都已經成為了專家或者專業分析師,這也吸引了非常多的人不斷湧入到這個行業中。

Image for post
Image for post

直到現在,圍繞資料分析的炒作更是甚囂塵上,然而資料分析崗位的增長近年來卻顯得異常緩慢,很多行業的崗位都已經接近飽和。

至於原因,其實我也說過很多次了,主要就是這幾個原因:

1、企業對於資料分析的需求動力仍然不足

資料分析與其他崗位不同,除了必備的技能之外,它對於求職者的經驗要求非常高,而企業並不希望將資源長期投入到你的經驗培養上。

公司不準備將時間與精力投入到新人上,雖然幾乎所有的網際網路公司都有自己的資料部門,但其他沒有的部門卻需要在該領域具有豐富經驗的人員來開始。

而且更重要的是,即使是經驗豐富的資料分析師,也未定可以為企業主帶來顯著的價值,企業自然不肯為你而背風險。

2、資料分析崗位的定位比較尷尬

資料分析的角色定位在公司裡還是比較尷尬的。

因為你說資料分析很重要吧,往往單純的資料分析沒有那麼多價值性。

而且運營、產品這些業務崗位自己做資料分析行不行呢?

當然也是可以的,資料分析本身就是賦能與業務的,所以很多企業就不重視資料分析。

3、資料分析並不像表面上那麼簡單

資料分析有太多東西要學,很多人只在意資料分析師的高薪,卻很少有人知道資料分析的學習之路有多麼辛苦。

很多人以為資料分析就是學習一門程式語言,不過這也就是為什麼很多面試資料分析師的人失敗的原因吧。從基礎的統計學知識,到業務思維的鍛鍊,再到資料分析工具的使用,這個領域的範圍很廣,真的沒有那麼簡單。

內卷怎麼解決?

其實想要避免內卷化,就要從內卷的核心出發:

  • 那麼拼了老命去參加內卷,讓自己能夠分到更大的蛋糕;
  • 或者找到這個行業的,把蛋糕最大,自己就能夠吃到更多;
  • 再不然,乾脆直接找個新蛋糕,不要在內卷化嚴重的行業裡拼命;
Image for post
Image for post

這麼說可能還是有些空,縮小到資料分析的工作上,就是要滿足業務的需求,產生更大的價值讓我們能夠證明自己,至於怎麼做,我有三個建議:

1、你要跟業務部門搞好關係

主動去向他們求教業務知識,因為你的很大一部分工作都需要業務來支撐和配合(資料分析和業務本來就是相互支撐的工作)。

有的業務部門對資料分析部門是很仇視的,所以要先搞好關係,平時多去溝通和交流。

然後主動求教,或者直接在業務部門待一段時間,瞭解公司的業務流程,有利於你之後資料分析思路的拓展,以後你跟業務部門配合的時候也更順暢。

2、對於資料部門要維繫好感情

畢竟以後你們是要一起幹活的,一般公司的資料部門包含資料平臺運帷、資料倉庫、資料分析等人員。

這些人的工作聯絡是強相關,入職不久的話最好要一一瞭解他們的工作內容和職責,起碼要知道如果自己以後需要什麼資料,要找誰。

不過資料部門一般都是程式設計師,不擅於人際交流,所以在工作配合上要注意溝通方式唷。

3、面對老闆要注意時時反饋,學會向上管理

不定時地向老闆彙報進展。這裡的老闆一般就是直接管理你的leader。

資料分析本來價值產出就不明顯,如果一直悶聲不吭,leader怎麼知道你做了哪些事呢?嚴重點的,還以為你根本沒什麼用。

所以最好是的辦法就是梳理自己的工作流程,搞清楚leader對於資料工作哪些地方不滿意,然後進行日常彙報。不要指望leader會天天主動找你要工作進展,學會向上管理可以解決很多因溝通不暢而產生的問題。

關注數據君的臉書:

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。按贊我的臉書私訊「10」,會有豐富資料包贈送唷!


TIOBE 2020年10月份的程式語言排行榜已經公佈,官方的標題是:Python排名逼近第二

TIOBE程式語言排行榜中C和Java一直佔據著前兩位,但隨著Python近年來越來越強勢,市場佔有率一直在提升,去年已升至排行榜第三。

而Java相對來說有些下滑,此消彼長,Python 有望在未來幾個月超越Java,排名攀升到第二。

Image for post
Image for post
(本圖僅供娛樂XD)

本月Python的佔比已經達到了11.28%,而 Java下滑至12.56%,差距小於1.3%,越來越接近。

Image for post
Image for post

(本圖僅供娛樂)

來看下國內的情況,以下是百度指數的資料統計,從2017年開始Python(藍色線)的搜尋指數,已經逐步甩開Java(綠色線)的搜尋指數,說明Python的關注度越來越高。

Image for post
Image for post

Python目前的版本分為2.x和3.x,3.x是不相容 2.x版本的。

Python2.0於2000年10月16日釋出。

官方宣佈,2020年1月1日,停止Python2的更新。Python2.7被確定為最後一個Python2.x版本。

Python3.0於2008年12月3日釋出,它對語言做了較大修訂而不能完全後向相容。

最新穩定版本3.9.0(2020年10月5日)

預覽版本3.10.0a1(2020年10月5日

如果你對Python感興趣可以訪問:

Python2.x教程

https://www.runoob.com/python/python-tutorial.html

Python3.x教程

https://www.runoob.com/python3/python3-tutorial.html

Python2.x線上編譯工具

https://c.runoob.com/compile/6

Python3.x線上編譯工具

https://c.runoob.com/compile/9

本月,在前10的排名中與9月份相比沒有變化。

9月份程式語言排名前十的分別是:C,Java,Python,C++,C#,Visual Basic, JavaScript,PHP,R,SQL。

10月份程式語言排名前十的分別是:C,Java,Python,C++,C#,Visual Basic, JavaScript,PHP,R,SQL。

排名1–20的程式語言:

Image for post
Image for post

各大程式語言的歷史排名(1988–2020):

Image for post
Image for post

程式語言“名人榜”(2003–2019):

Image for post
Image for post

TIOBE每個月都會公佈一次程式語言的排行榜,這份排行榜排名基於全球技術工程師、課程和第三方供應商的數量,其中包括了流行的搜尋引擎以及技術社群,如 Google、百度、維基百科等等。

資料反應目前主流程式語言的變化趨勢,對我們學習和工作可作為一個參考,但各個語言都有它們各自適合的應用場景,不必過於在意,畢竟程式語言的好壞在於如何去使用它。

關注數據君的臉書:

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。按贊我的臉書並私訊「10」,送你十週入門數據分析電子書唷!


在說今天的話題之前,我想先丟一個結論:

“做資料分析,不要建立一種以使用的軟體來給自己分級的心態,但是一定要用工具避免誤入職業發展歧途!”

為什麼今天要談關於資料分析工具分級的問題呢?

其實這涉及到職場中一個非常常見的現象 — — 工具鄙視鏈:

  • 會python程式語言的,瞧不起用BI工具做資料分析的;
  • 會用Tableau、FineReport這種分析工具的,瞧不起會用SPSS、SQL這種資料工具的;
  • 會用SPSS、SQL的,瞧不起用PPT做資料彙報的;
  • 會用PPT做資料彙報的,瞧不起只會用Excel做資料統計與整理的;
Image for post
Image for post

逃不開的鄙視鏈

不光是資料分析行業,在程式設計師、產品經理等行業中都存在這樣的鄙視鏈。

也有不少人和公司,遵從著這樣的鄙視鏈現象,通過這樣的鄙視鏈進行崗位的分級,或者作為選人招聘的門檻標準。

而這個鄙視鏈似乎是與這個崗位生死同戚、難以分離的:

比如我,在前幾年我還剛接觸資料分析的時候,只學會用Excel做資料處理,所有的資料清洗、資料加工和圖表視覺化工作都是用Excel完成的。

但是看著網上很多人都在學Python程式設計,當時還有一種“python才是資料分析標配”的言論,我也成為了跟風的一份子。

當時帶我的老大就告訴我:

“網上說學python才能做資料分析的,純粹就是瞎說,python做資料分析確實比Excel要專業一些,但是真正的核心,是要是什麼資料場景和什麼人在用。

我用Excel做的資料清洗絕對夠用,但是如果我想做一些高階視覺化,也會用python去做,誰規定資料分析師只能用一個軟體了?

說到底還是出於對資料分析崗位的自卑,資料分析才出現幾年啊,誰都覺得用Excel做資料分析太低級了,一點都體現不出我們的專業性,不學一門程式語言,其他部門的人誰瞧得起我們?”

Image for post
Image for post

對於我老大的話,我覺得講的就很靠譜!正是出於對於資料分析作崗位的錯誤認知,才會造成那麼多人對於資料分析工具的誤解。

其實這麼多年,Excel、Tableau、FineReport、PowerBI、SPSS、Python……我幾乎每種工具和軟體都用過,並沒有覺得哪一種是最萬能的

工具從來只是工具,是用來輔助我們進行資料分析的,最核心的關鍵還是在於人,也就是你是否真的具有資料分析思維和能力

像我之前老大的能力,用Excel照樣超給力;要是沒有能力,學一萬種語言都沒用!

所以很多剛入門資料分析的朋友,一上來就買很多Python,R語言,VBA的書籍和資料,安裝了各個語言的環境。

但其實資料分析師的日常工作,最多就是用到SQL取數以及Excel資料透檢視、BI分析工具中拖拉拽圖表。(可參考下圖)

Image for post
Image for post

所以,會用工具不是能力,懂得資料思維,才是資料分析師存在的意義!

工具是輔助

那麼回到我們今天的話題,資料分析當中有著不同的資料場景,會用到非常多的工具,那麼應該如何選擇,下面簡單舉幾個例子。

1、Excel

別以為Excel只會處理表格,你可以把它當成資料庫,也可以把它當成IDE,甚至可以把它當成資料視覺化工具來使用。

它可以建立專業的資料透視表和基本的統計圖表,但由於預設設定了顏色、線條和風格,使其難以建立用於看上去“高大上”視覺效果。

儘管如此,我仍然推薦你使用Excel,因為它其實能夠處理大部分的資料分析問題了!

2、BI工具

近幾年冒出來的BI之秀,如Tableau、PowerBI都強調視覺化,一改傳統BI工具SAP BO、IBM家的cognos(不過近幾年貌似都在研發雲BI)

這裡不談開源,還沒見到能成熟應用的BI,成熟的BI工具如FineReport(國內)和 Tableau(國外),都很推薦。

Image for post
Image for post
FineReport製作的數據匯報大屏

免費試用可戳這裡。

3、Python

學過Python資料分析的朋友都知道,在視覺化的工具中,有很多優秀的三方庫,比如matplotlib,seaborn,plotly,Boken,pyecharts等等,這些視覺化庫都有自己的特點,在實際應用中也廣為大家使用。

4、SPSS

SPSS是統計分析入門軟體,如果你想快速入門而又不想學習程式設計,我推薦使用SPSS。

學習SPSS的重點並不在於軟體本身,而是相關的統計學知識,這也是在前面建議大家鋪墊的,也就是你要學會怎樣去分析“輸入資料後,軟體給你呈現的結果”。

推薦大家一本書:《如虎添翼 資料處理的SPSS/SAS EG實現》,徐筱剛老師寫的,十分適合SPSS新手入門。

最後說點啥

其實今天談的這個話題,也是其他行業裡常見的現象之一,既然產生了這種亂象,說明一定有其產生的原因與邏輯,我們不必太過敏感。

但是,對於我們資料分析師自身而言,真正做分析時候,你會發現市面上有太多的分析工具,需要掌握的實在是太多了。

其實不必糾結於此,依據個人能力,配合當前的資料分析環境,適用的工具自然會被選出,最後記住一句話:工具是人用的,重點在於人,而不在於工具!

關注數據君的臉書:

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。按贊我的臉書私訊10,會有豐富資料包贈送唷!

About

數據分析那些事

這是一個專注於數據分析職場的內容部落格,聚焦一批數據分析愛好者,在這裡,我會分享數據分析相關知識點推送、(工具/書籍)等推薦、職場心得、熱點資訊剖析以及資源大盤點,希望同樣熱愛數據的我們一同進步! 臉書會有更多互動喔:https://www.facebook.com/shujvfenxi/

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store