最近又有很多人問我為什麼老闆總是嫌棄自己的視覺化報告難看,要麼是嫌棄圖表太老土,要麼是嫌棄資料不明顯,交到老闆手裡,老闆來了一句還不如直接跟他口頭彙報……

尤其是產品崗和資料崗的同學,平時需要接觸海量的資料,但是卻永遠只會用Excel自帶的模板做視覺化報表,就像下面這樣的:

比如這樣的:


典型的大資料分析包含以下幾個步驟:

一、明確分析目的和思路

明確資料分析目的以及確定分析思路,是確保資料分析過程有效進行的先決條件,它可以為資料的收集、處理及分析提供清晰的指引方向。

目的是整個分析流程的起點。目的不明確則會導致方向性的錯誤。即思考:為什麼要開展資料分析,透過這次資料分析要解決什麼問題?

當明確目的後,就要校理分析思路,並搭建分析框架,把分析目的分解成若干個不同的分析要點,即如何具體開展資料分析,需要從哪幾個角度進行分析,採用哪些分析指標。

只有明確了分析目的,分析框架才能跟著確定下來,最後還要確保分析框架的體系化,使分析更具有說服力。

體系化也就是邏輯化,簡單來說就是先分析什麼,後分析什麼,使得各個分析點之間具有邏輯聯絡。避免不知從哪方面入手以及分析的內容和指標被質疑是否合理、完整。

所以體系化就是為了讓你的分析框架具有說服力。

要想使分析框架體系化,就需要一些營銷、管理等理論為指導,結合著實際的業務情況進行構建,這樣才能保證分析維度的完整性,分析結果的有效性以及正確性。

比如以使用者行為理論為指導,搭建的網際網路網站分析指標框架如下:


原文:小蚊子數據分析

在一個資訊大爆炸的時代,每天都有很多的新訊息、新發現、新趨勢向我們狂轟亂炸而來。在這個過程中,我們既是資料的生產者,也是資料的使用者,然而初次獲取和儲存的原始資料總是雜亂無章的。

要想資料達到生動有趣、讓人一目瞭然的效果,就需要藉助資料視覺化。資料圖表天才們可以用簡潔、直觀又有趣的圖表幫我們把大量的資訊匯聚在小小的一張圖表中,不僅讓枯燥的資料和資訊變了模樣,還讓洞察見解躍然紙上,輕鬆傳達複雜觀點。

今天就特意為大家收羅了一些優秀的資料視覺化作品,讓我們一起來感受資料之美。

1. 學校槍擊案

華盛頓郵報統計了從2000年開始,校園槍擊案的數量,每一個點代表10名遭受槍擊案威脅的孩子。

參考連結:Analysis|More than 210,000 students have experienced g …


一月一更的 TIOBE 榜單新鮮出爐,快來看看開發者最常用的程式設計工具都有哪些變化吧!

時隔 7 年,Objective-C 首次跌出 TOP20

隨著跨平臺工具的崛起,以及全球數字化程序的加快,還有多少做著單一移動開發的程式設計師?

一直以來,很多開發者不停地發問,但這個問題迄今為止沒有明確的答案。不過,從幾年前起業界傳出的“移動網際網路已飽和”、“移動開發沒人要了”等唱衰的聲音中,相信很多開發者已有一絲瞭然,如今據 TIOBE 最新的 4 月榜單顯示,我們也發現那些曾頂起移動開發半邊天的工具正在逐漸隱退。

在上個月榜單中,我們曾報道過,作為 iOS 開發者最常用的程式語言,Swift 自去年 10 月起就熱度一直呈下降趨勢,這個月 Swift 排在了第 15 位,在去年的同期,Swift 還能排名第 11 位。

與此同時,在 Swift 語言出現 …


時間進入到了3月,雖然受疫情影響,很多公司還是選擇遠端辦公,你是不是依然在家宅著呢?對於已經復工的人來說,上班路上人員眾多,一定要做好自我保護,沒有什麼比健康更重要的!

進入三月,新的程式語言排行榜新鮮出爐,TIOBE 最新發布了 3 月程式語言排行榜。

程式語言排名前20

Java佔據榜首,Go 語言擠進前十

從榜單中我們可以看到,前三名分別為Java、C、Python。相較於上個月,Java從 1.48% 上升至 2.9%,以 17.78% 的份額穩居第一。

按照 Oracle 對 Java 的釋出週期來算,在本月中 Java 14 將會有最新的訊息給到開發者,譬如記錄 (records)、switch 表示式、模式匹配等。但據《2020 Java 生態系統》報告顯示,最受開發者喜愛的依然是 Java 8 及 Java 11。

C語言不愧是年度程式語言,以3.03%的年增長率繼續大幅領先。整體上來看,排名前10的語言基本都穩定如常。本月衝出了Go 語言這匹黑馬,一路擠進前十。去年同期,Go排在第18位,前兩個月的榜單中,Go上升到第14位,然後持續爬升,終於在3月進入前十。

另外,繼上個月 Objective-C 排名下降之後,蘋果主推的另一大程式語言 Swift 在本月也跌出了 Top 10,位於第 13 名,佔比 1.24%。與此同時,VB 倒是出乎意料地進入了 Top 20。

Delphi即將跌出TIOBE指數前20名

Delphi作為 Windows 平臺下著名的快速應用程式開發工具以及一款 IDE,很多開發者都深知他的強大,因此評價道“真正的程式設計師用 C++,聰明的程式設計師用 Delphi”。

這大概是 Delphi最終沒落的跡象。自2001年6月TIOBE指數存在以來,Delphi一直位居前20名,在2000年代初,它是最流行的語言和IDE之一。2002年發行的 Delphi 7大概是它的巔峰,此後 Delphi開始陷入麻煩,包括Linux移植失敗,版本出現錯誤等等。與此同時,一些具有類似功能的 IDE席捲市場,Delphi開始衰退。

TIOBE認為,導致 Delphi沒落的另一個主要原因是它的發行頻率太低。原先每年都有一個主要版本,而2018年之後,Delphi卻沒有了什麼新的動靜。

對此,也有不少網友評價道,Borland 這樣的第三方 IDE 提供商,本身沒有掌握語言,只是給語言提供 IDE 工具,雖然做的非常不錯,但是最後只是給人做嫁衣裳。

TOP 10程式語言TIOBE指數走勢(2002–2020)


来源:CSDN

本篇是機器學習面試200題第八篇,由於篇幅太長,本篇介紹141–160題~

以前寫過的面試題集錦,指路這邊

系列篇1指路

系列篇2指路

系列篇3指路

系列篇4指路

系列篇5指路

系列篇6指路

系列篇7指路

141.在下面哪種情況下,一階梯度下降不一定正確工作(可能會卡住)?(B)

答案:(B)

這是鞍點(Saddle Point)的梯度下降的經典例子。另,本題來源於:題目來源
https://www.analyticsvidhya.com/blog/2017/01/must-know-questions-deep-learning/

142.下圖顯示了訓練過的3層卷積神經網路準確度,與引數數量(特徵核的數量)的關係。


什麼樣的軟體才算良心軟體?深耕資料分析數年得出的經驗總結 — — 省(zǎo)時(xià)間(bān)的軟體才是真正的良心軟體!

畢竟對一個程式設計師來說,時間就是頭髮!

1、Total Commander -檔案管理器

批次管理檔案,批次重新命名/刪除/複製/移動/修改時間屬性等等,還可以一鍵修改,一鍵撤銷,整理分類資料夾的時候不要太方便啊!

並排雙視窗檢視,一目十行,瞬間感覺自己像爭鋒奪秒的金融新貴哈哈哈


大多數公司是否都有這樣的財務困境?

無論什麼樣的公司,財務員工一直都是螺絲釘的角色,分工非常細,很有可能出現一種情況:做內賬的不認識做外賬的,做成本分析的不認識做合併報表的。

造成這種情況的原因就是因為財務報表工作的冗雜、繁複,很難實現一人負責全部財務報表的工作

就好比我之前入職的公司有一個財務主管,每天晚上基本上都要在公司加班到半夜,Excel越做越多,但是隨著公司業務的增多,Excel難以支撐公司業務分析需求,加上工資又不高,總監勸了半天也就願意加幾百塊的工資,最後財務主管實在受不了就辭職了。

在網上隨便找了個辭職報告><

總監以為再招一個財務很簡單,結果因為工資低、工作量太大,遲遲招不到人,最後從招一個變成了招兩個、從招兩個變成了招五個。

最後財務部門的報表工作越來越臃腫,後來還專門招了一個人做報表稽核,但是因為Excel沒法實現平臺管理經常出錯,我們這些部分感覺跟財務溝通要累10倍,財務人力成本增加了4倍多,最後造成公司賬目混亂,現在估計也已經倒閉了。


来源:CSDN

本篇是機器學習面試200題第七篇,由於篇幅太長,本篇介紹121–140題~

神經網路相關唷~內容感興趣的話請持續關注唷XD

系列篇1指路

系列篇2指路

系列篇3指路

系列篇4指路

系列篇5指路

系列篇6指路

121.如何解決梯度消失和梯度膨脹?

(1)梯度消失:

根據鏈式法則,如果每一層神經元對上一層的輸出的偏導乘上權重結果都小於1的話,那麼即使這個結果是0.99,在經過足夠多層傳播之後,誤差對輸入層的偏導會趨於0,可以採用ReLU啟用函式有效的解決梯度消失的情況。
(2)梯度膨脹

根據鏈式法則,如果每一層神經元對上一層的輸出的偏導乘上權重結果都大於1的話,在經過足夠多層傳播之後,誤差對輸入層的偏導會趨於無窮大,可以透過啟用函式來解決。

122.推導下反向傳播Backpropagati …


為什麼我們仍在使用 SQL?

SQL 和關係資料庫管理系統(RDBMS)都是在 上世紀70 年代早期開發的。Edgar F. Codd 開發了 RDBMS,而 Donald D. Chamberling 和 Raymond F. Boyce 開發了 SQL。

二者都誕生在計算機技術的早期,而且在 90% 的時間裡都非常有效,使得資料庫成為了一項 “已經被解決的問題”。就像 MailChimp 已經成為了傳送新聞簡訊的同義詞。如果你想使用資料庫,你就得使用 RDBMS 和 SQL。

不過,仍然還是有人使用其他 Email 軟體,正如還是用人使用非 SQL 的資料庫。但即使是存在著其他可供使用的資料庫技術,SQL 依舊佔據霸主地位。

以下 8 條,就是我們在 SQL 誕生 48 年後依舊使用它的原因。

1. 資料處理能力

SQL 最初基於關係代數和元組關係演算 — — 由 Codd 特別為關係資料庫開發的兩種數學模式 …

數據分析那些事

這是一個專注於數據分析職場的內容部落格,聚焦一批數據分析愛好者,在這裡,我會分享數據分析相關知識點推送、(工具/書籍)等推薦、職場心得、熱點資訊剖析以及資源大盤點,希望同樣熱愛數據的我們一同進步! 臉書會有更多互動喔:https://www.facebook.com/shujvfenxi/

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store