從月薪8K的分析師到月薪2W,只因我有了這份工具清單!

數據分析那些事
10 min readOct 29, 2018

--

投行人必須會用的資料處理工具,你知道幾個?

當實習中的你,被老闆安排找到騰訊某股東占公司註冊資金的百分比資料。你卻一臉蒙圈不知道從何搜集資料,硬著頭皮通宵整理完的資料又不知道如何快速整合,懷著忐忑的心情把Excel發出去,結果卻因資料不美觀被老闆怒罵退回。

因為對資料一無所知的你

被老闆翻過幾個白眼?

今天, 數據君就來教你KO資料的三大妙招,重新整理老闆對你的認知

第一招:如何在3s內獲取資料?

一、搜集資料渠道

1.券商研究報告渠道

哪裡才能獲得第一手投資研究報告?知名金融資料平台像投行人必備的Bloomberg(彭博)和Factset是最常見的獲取資料的渠道。

Bloomberg

Bloomberg (彭博)是為大多數大型金融機構提供服務,使用者通過「彭博專業服務」可以查閱和分析實時的金融市場資料以及進行金融交易。

彭博終端是一套讓專業人士訪問「彭博專業服務」(Bloomberg Professional Service)的計算機系統。

彭博終端基於客戶 — 伺服器架構建立,伺服器是一個多處理器的Unix平台,終端使用者使用的客戶端是一個Windows程序。

FactSet

FactSet研究系統是一家金融資料和軟體公司,為全球主要金融機構的分析員、證券管理員和投資銀行家提供金融信息和分析軟體。

FactSet核心的優勢主要集中在公司的財務資料,這也是為什麼它成為投行Anaylst必備技能之一的原因。

FactSet在投行中的使用頻率是Daily basis,而且FactSet個性化的介面,強大的功能,Excel plugin 也不差。

2.各大上市公司報告渠道

一些頂級諮詢公司如德勤、IBM、貝恩等都會發布annual report以及公司近況通常具有時效性,能系統地反映公司現狀,從而輔助投資的策略判斷。

3.上市公司公告渠道

主要包括美國SEC、香港披露易、中國巨潮諮詢查詢上市公司,對於高凈值個體或大型投資有輔助分析作用。

4.投行網站渠道

主要包括IPO、junling(巨靈)等渠道,多為華爾街諮詢、香港股票行情、金融建模及演示,可獲取各大投行現下投資組合分析及行情。

5.銀行業網站渠道

主要包括World Bank(世界銀行)、Forst(福斯特) 等各大知名銀行平台渠道,可獲得實時銀行諮詢以及公告、資料的查找。

6.資料庫渠道

主要包括IEEE Xplore、EBSCO等,包含宏觀資料、金融、教育、行業資料等,並擁有完備的年度資料。

7.國外國家or經濟體資料渠道

其中包括美國(提供了有關美國當前經濟形勢的描述和主要宏觀經濟變數資料)和經濟合作與發展組織資料(提供了成員國的金融資料,但也包括一些總體資料,比如GDP、失業和通貨膨脹等)。如Heston-Summers資料庫、《當代商業縱覽》等。

8.綜合性資料渠道

各類財經、股票、經濟類資料庫,如產品價格指數(PPI)詳細報告,國際股票市場資料庫,聯合國統計年鑒等等,提供宏觀經濟信息、行業(產業)發展報告、企業(公司)信息、產品市場分析,大量表格和統計資料,以及很多相關站點的鏈接,內容從收入、財富到貧困問題都有。

9.策略常用網站渠道

國內常用財政部、發改委等官方網站來了解政府政策及實時諮詢,分析當前社會及資本浮動情況;國外常用BEA、CBO等了解股票、財政等等詳細資料和實時分析。

10.搜尋引擎渠道

主要包括谷歌、BASE、sciseek等搜尋引擎,多用於查找、搜尋資源,能準確定位你想要的資料。

二、使用程序語言自動抓取網路資料

在資料獲取領域中,最為被廣泛使用的就是python語言,俗稱爬蟲。

通過爬蟲加正則這種自動化的工具,能夠耗很少的人工就可以將資料和信息採集並結構化,後續通過更多的分析工具完成許多有商業價值的分析並獲取所謂的insight(將信息轉化為知識和洞察)。

推薦使用網站:regex101.com

示例:爬取社交網路資料:Facebook

Facebook提供了API,可以提交關鍵字等信息爬取搜尋結果中的每一條內容。

第二招:如何清理資料?

1.萬能的Excel

Excel是迄今為止最簡單最便捷的處理資料方式。下至四則運算,上至各類統計分析、矩陣運算及線性規劃都可以搞定。但是想在投行借excel玩出花樣,千萬不要以為會了VLookup及一些快捷鍵就可以耀武揚威了,至少需要把矩陣乘法、向量乘法、Offset/ Cells/ Row/ Range等函數用到極致,這樣大多數Financial Model會做得非常靈活,而且各種資料查詢及匹配工作會達到部分SQL的處理水平。

2.進階版Excel:VBA

VBA會讓Office的能力提升一個檔次,除了完成函數不能完成的一些任務,最有價值的是能夠在Office的各套軟體之間實現信息同步。

學習Excel VBA較為正規的圖書是 John Green的 Excel 2007 VBA Programmer’s Reference,中文版由Excel Home翻譯為《Excel 2007 VBA參考大全》。這本書應至少閱讀完前7章。閱讀完前4章即可以嘗試解決工作中遇到的問題了。

第三招:如何完美地呈現資料

當資料清理完畢後,如果你直接呈現給Boss,那就糟了!你知道美化前後的資料的差別有多大?

前者是一個落魄的流浪漢,後者成了一個精英,雖然還是同一個人,但明顯視覺感受迥然不同。而且最重要的是美化後的表格能帶來80%的溝通效力。

如何美化資料?資料視覺化,了解一下,它主要是藉助於圖形化手段,清晰有效地傳達與溝通信息。

資料視覺化技術包含以下幾個基本概念:

①資料空間:是由n維屬性和m個元素組成的資料集所構成的多維信息空間;

②資料開發:是指利用一定的演算法和工具對資料進行定量的推演和計算;

③資料分析:指對多維資料進行切片、塊、旋轉等動作剖析資料,從而能多角度多側面觀察資料;

④資料視覺化:是指將大型資料集中的資料以圖形圖像形式表示,並利用資料分析和開發工具發現其中未知信息的處理過程。

資料視覺化主要用於以下兩方面:

①報表類,如JReport,Excel,FineReport,ActiveReports報表等。

FineReport10.0免費試用版

②BI分析工具,如Style Intelligence、BO,BIEE,帆軟FineBI等。

1.Excel

Excel的圖形功能並不強大,但Excel是分析資料的理想工具。

作為入門級工具,Excel是快速分析資料的理想工具,也能創建供內部使用的資料圖,但是Excel在顏色、線條和樣式上可選擇的範圍有限,這也意味著用Excel很難製作出能符合專業出版物和網站需要的資料圖。

但是作為一個高效的內部溝通工具,Excel應當是你百寶箱中必備的工具之一。

2.Chart.js

JsChart元件功能強大,能適應各種複雜的需求和業務,而且操作起來相對簡單。

3.Google Chart API

Google Chart API工具中取消了靜態圖片功能,目前只提供動態圖表工具。但Google Chart的一個大問題是:圖表在客戶端生成,這意味著那些不支持JavaScript的設備將無法使用,此外也無法離線使用。

當然,Google chart API還是很強大的,線上自動幫你將所需要的資料匯總成,各式各樣的圖示,折線 餅狀 柱狀 氣泡等等。

4.Echarts

Echarts是一款開源、功能強大的資料視覺化產品。可以流暢的運行在 PC 和行動設備上,相容當前絕大部分瀏覽器(IE8/9/10/11,Chrome,Firefox,Safari等),底層依賴輕量級的矢量圖形庫 ZRender,提供直觀,交互豐富,可高度個性化定製的資料視覺化圖表。

5.D3

D3(Data Driven Documents)是支持SVG渲染的另一種JavaScript庫。但是D3能夠提供大量線形圖和條形圖之外的複雜圖表樣式,例如Voronoi圖、樹形圖、圓形集群和單詞雲等。D3想要入門不是太簡單,至少都要有HTML和JavaScript基礎才行,對JavaScript的DOM要求也有點高。

6.Crossfilter

Crossfilter 是一個 JavaScript 類庫,能夠在瀏覽器端對大量資料進行多維分析。Crossfilter既是圖表,又是互動圖形使用者介面的小程序,當你調整一個圖表中的輸入範圍時,其他關聯圖表的資料也會隨之改變。它可以在不同的 Group By 查詢之間實現「交叉過濾」,自動連接和更新查詢結果。

7.R語言

R語言是主要用於統計分析、繪圖的語言和操作環境。R是屬於GNU系統的一個自由、免費、源程式碼開放的軟體,它是一個用於統計計算和統計製圖的優秀工具。它可以運行於UNIX,Windows和Macintosh的操作系統上,而且嵌入了一個非常方便實用的幫助系統。

8.jsDraw2DX

用於創建任何類型的互動式圖形 SVG (舊 IE 瀏覽器是 VML ) 的一個獨立 JavaScript 庫。除了生成所有基本形狀像線、 矩形、 多邊形、 圓、 橢圓、 圓弧等,庫包可以繪製曲線、 貝塞爾曲線 (任何 degree )、 函數圖形、 圖像和文本的裝飾。

9.Visual.ly

如果你需要製作一個快速的視覺圖像,你沒有必要再詢問專業的設計團隊,你可以自己完成這些工作。Visual.ly就是最流行的一個選擇。其中提供了大量信息圖範本。

查找資料、處理資料、美化資料的工具都在這了

你平時用過哪幾種呢?

學會其中一兩種

分分鐘KO各種資料

還怕不能升值加薪?

--

--

數據分析那些事

這是一個專注於數據分析職場的內容部落格,聚焦一批數據分析愛好者,在這裡,我會分享數據分析相關知識點推送、(工具/書籍)等推薦、職場心得、熱點資訊剖析以及資源大盤點,希望同樣熱愛數據的我們一同進步! 臉書會有更多互動喔:https://www.facebook.com/shujvfenxi/