原文 量子位(@QbitAI)

自然語言理解(NLU)迎來新的里程碑。

在最新的NLU測試基準SuperGLUE中,人類首次被AI超越了。

SuperGLUE相比“前輩”GLUE大大提升了問題的難度,提出一年多以來,人類一直處於第一位。

現如今,人類一下子被兩家AI超越。

一個是來自微軟的DeBERTa,一個是來自谷歌的T5+Meena

Image for post
Image for post

超越人類的兩大NLU模型


剛和2020年說拜拜,年底打工人的拷問就又來了:“你的年終報告寫完了嗎?”

不少進入職場的新人,經常遇到這種現象:明明自己加班多、做事多,年終彙報完了,自己漲的工資卻沒有同事高。心裡覺得委屈,卻只能嘆氣,抱怨“會做事的不如會寫報告的”。

的確,很多職場人吃虧就吃在不會寫報告上,我管理團隊已經有6年多,每年年底都會看到團隊成員遞交上來的各種各樣的年終總結報告,好的報告資訊表達準確、清晰,令人賞心悅目,差的報告千篇一律,看完很讓人留下印象,從而影響年底的績效評價。

年終報告年年都要寫,怎麼才能寫出亮點呢?

最簡單的方式就是資料視覺化,不論是哪種崗位的年終總結,基本都會涉及到資料的展現,巧妙的利用視覺化圖表展現資料,能夠令人耳目一新,立馬從一堆傳統的文字報告中脫穎而出。

Image for post
Image for post

今天這篇就來教大家如何利用視覺化圖表來提升報告顏值。

視覺化圖表的選用

1、數值展示

報告中展示單個或者獨立的數值指標,比如總銷售額,回款額,總利潤,毛利率等核心資料時,可以直接採用數值文字展現的形式


恭喜 Python 榮獲 2020 年度程式語言稱號,這也是自 TIOBE 榜單發佈以來,首款編程語言四次獲得該獎項。

編程語言社區 TIOBE 最新發布了 1 月程式語言排行榜。這次揭曉了 2020 年度最受歡迎的程式語言,其中,Python 以 2.01% 的正增長榮獲 2020 年度 TIOBE 程式語言獎!C++ 以微弱差距無緣冠軍,憑藉 1.99% 的增長率獲得了亞軍。其他編程語言中,C(+1.66%)、Groovy (+1.23%)、R (+1.10%)分別位居其後。

Python 過去這一年

Image for post
Image for post

對於 Python 再次獲獎,似乎也在情理之中, …


某天傍晚,我看著時鐘上的5:28,還有2分鐘就下班了,收拾東西準備回家XDD!

Image for post
Image for post

突然就收到了出差的老闆的一條訊息:“小A,把上個月的財務報表匯出一份Excel。”

我立刻緊張了起來,開啟電腦,我平時都在辛辛苦苦維護報表,今天,向老闆展現自己的機會來了。

怎麼回事,加班竟然還有一點興奮?

我顫抖的手,打開了《11月財務分析》的範本,點選“匯出Excel”,真不是我吹,我這個財務報表做的是相當不錯,彙總表和明細表用多sheet展示,跳轉地so絲滑,哪裡不會點哪裡。


2021即將來臨,我們在研讀了10+份報告後釋出這份《2021年台灣企業數位轉型趨勢預測白皮書》,系統解答了2021年數位轉型的發展趨勢,數位轉型過程當中可能會遇到的問題和如何賦能企業經營管理。

希望能給各位的21年數位轉型計畫答疑解惑,指明方向!

限時一週時間領取,感興趣的直接劃到文末瞭解資料獲取方式吧~

Image for post
Image for post

2020年可謂是動蕩的一年,我們從來沒有想過會突然發生COVID-19這樣的黑天鵝事件。有的企業措手不及,甚至因此蒙受巨大的損失,但也有企業借著這個勢頭實現經營大逆轉!

如果說COVID-19對於企業來說最大的影響是什麼,帆軟認為它讓企業數位轉型不再是一個可有可無的選項。IDC預測:到2022年,全球65%的GDP將由數位化驅動,經濟發展對數位(Digital)的依存度將大幅提升;從2020年到2023年,數位轉型的直接投資將超過6.8兆美元。後疫情時代,只有擁抱數位轉型的企業才能領先他人,搶佔致勝先機

數位轉型該不該做?

我們透過數據瞭解到大部分企業對於數位轉型一直保持觀望的態度,其中到底是因為謹慎還是認為數位轉型並不迫切,我們不得而知。但是COVID-19的來襲,相信會加速這個選擇。

如果你還在猶豫是否在2021年開啟數位轉型計畫,或者不知從何做起,也許這份白皮書可以給你一個答案。

數位轉型的關鍵和困惑?

數位轉型的兩大關鍵因素在於

  • 老闆有明確的數位轉型意識和相對清晰的想法
  • 企業員工認同數位轉型的價值

為什麼這麼說呢?因為數位轉型並不是一蹴而就的事情,短時間內我們無法很好的衡量這項工作的投入產出比。此時你又會聽到同事說:“我們搞了那麼久的IT信息化,為什麼還要花那麼多時間金錢搞數位轉型?

你是否也會有這個疑問?其實只是你沒有搞懂一個基礎概念。

你需要要搞清楚「數位轉型」和「企業信息化」的區別。

首先明確數位轉型並不是對企業以往的信息化推倒重來,而是需要整合優化以往的企業信息化系統,在整合優化的基礎上,提升管理和運營水平,用新的技術手段提升企業新的技術能力,以支撐企業適應數位轉型變化帶來的新要求。

其二我們需要弄清楚數字化和信息化到底有什麼區別:

從應用的範圍看, 信息化主要是單個部門的應用,很少有跨部門的整合,其價值主要體現在效率提升方面,而數位轉型則是在你的企業整個業務流程進行數字化的打通,破除部門牆、數據牆,實現跨部門的系統互通、數據互聯,全線打通數據融合,為業務賦能,為決策提供精準洞察。

數位轉型如何賦能企業經營管理?

簡單來說「型」是對未來業務執行目標的一種圖景想象和設定。此處所說的「型」其實就是企業希望數位轉型之後的一種目標願景或者期望。這裡的「型」可概括為“對內強己、賦能員工、對外共贏”:

1、對內強已,聚焦在優化完善公司治理結構,實現流程貫通與提效,數據可視全過程透明管理,風險可控。這個維度的內容是要關注並且補齊自己的短板,打造強大的自身。

2、賦能員工,通過先進技術和工具、增值培訓、平臺支援,幫助員工實現能力的提升和拓展,同時也能延伸員工本身對企業、對產品、對客戶的感知和反應,更好的支援前線作戰和為業務凝心聚力。

3、對外共贏,新興技術使企業能夠通過與客戶圍繞互利機會合作,通過與生態圈合作伙伴的聯合或整合,進入全新的市場或產生新的價值場景,共同開拓市場拓展空間,實現互利共贏。

限時領取《2021年台灣企業數位轉型趨勢解讀白皮書》!

我們從如下四個角度

  • 數位轉型發展趨勢
  • 數位轉型兩大關鍵因素
  • 數位轉型的困境
  • 數位轉型如何賦能企業經營管理

進行了2020年的數據解讀並預測2021年的發展趨勢。

如果你正猶豫是否要在21年啟動數位轉型或是正處於對於明年的數位轉型計畫的規劃階段,那麼你一定不能錯過這份幾乎是行業首發的21年數位轉型發展趨勢白皮書!

活動參與方式

關注數據君的臉書:


作者 | 不剪髮的Tony老師
來源 | CSDN
https://blog.csdn.net/horses/article/details/104553075

本文介紹關係資料庫的設計思想:在 SQL 中,一切皆關係。

在計算機齡域有許多偉大的設計理念和思想,例如:

  • 在 Unix 中,一切皆檔案
  • 在面向物件的程式語言中,一切皆物件

關係資料庫同樣也有自己的設計思想:在 SQL 中,一切皆關係

01 關係模型

Image for post
Image for post

關係模型由資料結構、關係操作、完整性約束三部分組成。

關係模型中的資料結構就是關係表,包括基礎表、派生表(查詢結果)和虛擬表(檢視) …


南丁格爾玫瑰,光聽名字就很好看吧~

Image for post
Image for post

看這個圖你猜到資料視覺化的鼻祖是誰了嗎?謎底就在謎面上,對沒錯,她就是那位著名的護士“南丁格爾”。據說是當年克里米亞戰爭時正是南丁格爾使用了類似玫瑰的極座標圖報告野戰醫院的死亡情況,才使那些看不懂統計報告的國會議員們明白形勢的嚴峻。所以南丁格爾也被尊稱為資料視覺化的鼻祖。

很多人知道南丁格爾是因為她是一位著名的護士,她是護士這個行業的先驅,也可以說她開創了護理行業。所以我們一般在課本上和南丁格爾傳記上都可以讀到她作為護士的榮光一生。
但是你可能沒想到南丁格爾其實還是一位著名的統計學家。事實上她是英國皇家統計學會的第一個女成員,也是當時美國統計協會的名譽會員。厲害了吧?

不過這種玫瑰圖略顯花哨,做報告展示糊弄糊弄外行還好,用來日常資料分析意義不大。比較酷炫但不實用,因為解讀起來比較麻煩,不夠直觀。就像有些女孩子走到你面前首先被她的美貌打動,但是內在的氣質和才華需要仔細瞭解才能有結論。南丁格爾玫瑰圖也是一樣,當這張圖拿到你的面前,大部分人聚焦在它的酷炫形式而不是內容。

不過這張圖有另一個作用:判斷你是否是資料分析的門外漢?回答我,你看到這張圖的第一印象是什麼?

第一層次:好漂亮的圖哦!

如果你的第一印象是這樣,抱歉,你還是資料分析的門外漢,還處在外行看熱鬧的階段。

第二層次:這個圖怎麼做的?

說明你開始思考了,你看重工具的使用,不過你可能還處在資料分析的模仿階段。

第三層次:這個圖說明了什麼?

再美的圖形也是為論點、結論服務的,你有正常的資料分析的思維,繼續加油。

第四層次:這個圖的邏輯有點亂,展示方式也不是最佳方式

恭喜你,你是一個全面思維的資料分析的人才!
資料視覺化逐漸從好看過度實用階段了,我們作圖首要任務不是為了漂亮,而是實用,是方便受眾快速簡單的get到你要表達的觀點,否則純炫技就沒有什麼意思了!

最後按照慣例給大家推薦幾個資料視覺化製作工具吧,其實大部分之前已經介紹過了,想看具體介紹請戳

FineReport:https://www.finereport.com/tw/
BirdEye:https://birdeye.com/
JSCharts:http://www.jscharts.com/
Google Chart API:https://developers.google.com/chart/interactive/docs
D3.js:https://d3js.org/
Highcharts:https://www.highcharts.com/
RGraph:http://www.rgraph.net/
Echarts:http://echarts.baidu.com/
DataV:https://data.aliyun.com/visual/datav

關注數據君的臉書:


說起數據分析面試,恐怕對於求職者來說,最難的就是考察業務知識的部分,其他知識都容易惡補,業務知識從哪學呢?業務經驗真是一個世紀難題啊!

別急,今天這篇文章就幫大家科普一下業務分析的一些知識;

這些知識是我在面試新人時最常問的概念性問題,它能最快速度幫我判斷對方的業務經驗基礎,大家對這部分有疑問的可以直接留言在評論區,我會一一解答!

Image for post
Image for post

業務分析與數據分析的區別

我之前在講《十週入門數據分析》的時候,介紹過數據分析的流程,可以用五個關鍵詞來表示,分別是“目的” — “採集” — “清洗加工” — “視覺化” — “業務價值”;

每個關鍵詞都一一對應著數據分析流程當中的具體工作,分別是:“需求層” — “數據採集層” — “數據層” — “數據處理層” — “輸出層”。


文源:阿倫的資料分析之路 作者:艾倫nmk

A/B Test系列文章將會圍繞以下六個問題進行展開,比較系統的梳理數據分析師應掌握的A/B Test技巧,本章為A/B Test系列文章第一章,“什麼是A/B test和A/B Test的統計學原理”

1.什麼是A/B Test?

2.A/B Test的統計學原理?

3.統計功效是什麼?

4.靈魂拷問!A/B Test要開多久,樣本量要多少?

5.如何優雅的分析A/B Test的結果?

6.A/B Test常見注意要點

A/B Test 經典案例

Image for post
Image for post

在真正的歷史上,競選團隊做了這麼一個方案,他們將6個頁面在小範圍內同時推出並隨機的讓每個頁面獲得相同的使用者數量,記錄下每個頁面的註冊率。結果發現最優頁面的註冊率為11.6%,比最初版本頁面的註冊率8.26%提升了40.6%。增加了2,880,000個電子郵件地址,並轉化為額外的約近6,000萬美元捐款。從定性的角度我們很難去選出哪個頁面是最好的,但通過A/B Test定量的去判斷可以幫助我們更好的決策。

最佳頁面如下:

什麼是A/B Test?

這段話可能比較拗口,下面我們用更通俗的語言再來理解一遍,A/B Test就是我們在線上可以切出一部分使用者(降低風險),完全隨機的分成兩組或多組(確保人群一致),一組保持現有的方案叫對照組,另外一組使用改進的方案叫實驗組,使用統計的方法對兩組之間指標差異進行分析,評估是否符合預期的一種方法。

為什麼要做A/B Test?

場景A

小A作為一款日活300萬產品的產品經理在新版本自信滿滿的新上線了一個feature(改動),結果版本釋出後線上留存大跌,給產品帶來了重大損失

場景B

小A和小B在新版本同時上線了一個feature,釋出後線上留存大漲,小A和小B都認為是自己的feature提高了留存,兩個人爭執不休

如果沒有A/B Test,以上兩個場景可能就會在網路公司工作中頻繁出現。快速迭代是網際網路產品的一大特點,如何在迭代中降低錯誤嘗試帶來的損失以及準確評估每一個feature對產品的影響是快速迭代的關鍵所在。A/B Test為這兩個問題提供了解決方案,能夠切出小部分使用者去做實驗的特性可以降低風險,而變數的唯一性又讓我們可以準確的評估feature帶來的影響

A/B Test的統計學原理

假設檢驗是用來判斷樣本與樣本,樣本與總體之間的差異是由抽樣誤差引起還是本質差別造成的統計推斷方法,其基本原理是先對總體特徵做出某種假設,然後通過抽樣研究的統計推理,對此假設應該被拒絕還是接受做出判斷,假設檢驗使用了一種類似反證法的推理,通過A/B Test,我們要驗證的其實是一對假設,原假設和備擇假設。

舉個例子,我認為把按鈕從圓形改成正方形可以提高使用者的人均點選數,那麼我的原假設就是“把按鈕從圓形改成正方形可以提高使用者的人均點選數”,備擇假設是“把按鈕從圓形改成正方形不能提高使用者的人均點選數” ,這是一對互斥的假設,如果我們能證明原假設不成立,那麼備擇假設在某種程度上就可以被推斷為成立。

假設檢驗的基本思路是“小概率事件在少量實驗中是幾乎不可能出現的”,如果在實驗中出現了小概率事件,那麼我們就可以推斷原假設是錯誤的,從而推斷備擇假設可能是正確的。

兩類錯誤

比如我們認為瑞士的平均收入要高於我國,隨機抽5個瑞士人和5箇中國人做比較,如果抽到的中國人是馬雲、馬化騰、王健林、李嘉誠和我的話,那這個結論肯定就不成立了,這就是抽樣誤差可能會帶來的錯誤。在假設檢驗過程中,我們可能會犯兩種錯誤,第一類錯誤(棄真)和第二類錯誤(納偽)。

為了更形象的說明兩類錯誤,我們看下面這張圖片,在這裡我們的原假設是 “沒有懷孕”,備擇假設是“懷孕了”,對圖1來歲,沒有懷孕我們認為其懷孕了,我們錯誤的拒絕了原假設,這就是棄真,對圖2,懷孕了我們認為其沒有懷孕,這就是納偽。


投稿 朱衛軍

對從事資料工作的小夥伴來說,SQL幾乎是必備技能,寫得一手好SQL才能說明你是一個合格的「取數民工」。

SQL如何從小白到高手?

  1. 熟悉基本的增刪改查語句及函式,包括select、where、group by、having、order by、delete、insert、join、update等,可以做日常的取數或簡單的分析(該水平已經超過90%非IT同事);
  2. 掌握並熟練使用高階語法,比如集合、分組聚合、子查詢、條件邏輯、字串函式、算術函式、日期時間函式,並且知道MySQL、Oracle、SQL Server等資料庫的語法差異;
  3. 熟悉如何優化SQL語句,以期達到最高查詢效率,瞭解事務、鎖、索引、約束、檢視、元資料等概念,並且學會使用hive sql、spark sql、pymysql等工具;

數據分析人員最好是能達到第三個層次,這樣基本可以算一個90分的sqler。

如果把Excel類比sql,你得玩轉透視表、各種函式公式,甚至VBA,才能最大效率地賦能工作。

學習SQL是有法可循的

1. 瞭解什麼是SQL?

關係資料庫有很多,比如MySQl、Oracle等,每個資料庫都使用自己的SQL方言,但是它們都共享相同的基本語法。

SQL的職責是管理二維表,通過語句來替代Excel中那些圖形化的命令。

比如同樣是篩選資料,在Excel中需要新增篩選,然後選擇想要的欄位,這是圖形化的命令;SQL則是通過語句來實現篩選;

select * from table where …

SQL語法可以分為三類:

  • 用於定義資料結構的語句稱為「SQL方案語句」,比如 CREATE TABLE student…
  • 用於建立、操作、檢索資料庫中資料的語句稱為「SQL資料語句」,比如 INSERTE INTO student…
  • 用於開始、結束、或回滾事務的語句稱為「SQL事務語句」

簡單理解,方案語句是建造資料的殼,例子中建立了表student;資料語句是處理資料,例子中向表student插入了資料,事務語句就是解決多個SQL執行時的糾紛問題。

如果你是資料庫管理員,那麼你需要同時掌握模式語句、資料語句和事務語句,但如果你只是使用資料的分析師、程式設計師,則只需要掌握資料語句就行了。

SQL不能像程式語言一樣,使用變數、條件邏輯、迴圈結構等對過程進行定義,以獲得想要的結果。SQL直來直去,只要定義必要的輸入輸出,沒有對過程的控制。

2. 怎麼學習SQL?

Image for post
Image for post

初學者對抽象概念不太懂,可以對比Excel學習SQL基本語法。

核心:select * from tableName

這句話是從某表中選擇全部欄位,相當於Excel中的選擇sheet

where相當於Excel的篩選,group by相當於Excel的透視表,order相當於Excel的升序降序。

接著你得學習一些常用的函式:

About

數據分析那些事

這是一個專注於數據分析職場的內容部落格,聚焦一批數據分析愛好者,在這裡,我會分享數據分析相關知識點推送、(工具/書籍)等推薦、職場心得、熱點資訊剖析以及資源大盤點,希望同樣熱愛數據的我們一同進步! 臉書會有更多互動喔:https://www.facebook.com/shujvfenxi/

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store