文章來源:Python大數據分析

有個熱門提問,日常工作中Python+Pandas是否能代替Excel+VBA?

我的建議是,兩者是互補關係,不存在誰替代誰。

複雜資料分析挖掘用Python+Pandas,日常簡單資料處理用Excel+VBA。

從資料處理分析能力來看,Python+Pandas肯定是能取代Excel+VBA的,而且要遠遠比後者強大。

但從便利性、傳播性、市場認可度來看,Excel+VBA在職場工作上還是無法取代的。

因為Excel符合絕大多數人的使用習慣,使用成本更低。

就像Photoshop能修出更專業的照片,為什麼大部分人在用美圖秀秀?道理是一樣的。

從市場接受度來看,Python對比Excel有三個差異點。

注意我這裡說的是差異點,不是劣勢,因為不同品種的東西,沒辦法進行優劣比較。

1、Python學習門檻相對較高

雖然Python在程式語言裡算最容易入門的,但是它仍然是一門程式語言,需要你理解變數、函式、邏輯語句、類、執行緒程序等程式設計知識,對於大部分非IT專業的人來說,學習門檻是相當高的。

而且學習Python資料分析不光是學習Python語法本身,你還要學習Pandas、Numpy、Matplotlib、SKlearn等各種資料科學庫,因為大部分資料處理函式都包裝在這些庫裡。

--

--

轉自:浪尖聊大數據 大家在工作中是不是經常要做各種分析,但又常常遇到無從下手,抓不住重點,搞不清關鍵資料的情況。俗話說“工欲善其事,必先利其器。”一個好用的資料分析模型,能給我們提供一種視角和思維框架,從而幫我們理清分析邏輯,提高分析準確性。 今天特意為大家整理出了8大常用資料分析模型,幫助大家快速提高資料分析能力。 1、AARRR模型 AARRR模型又叫海盜模型,這個模型把實現使用者增長拆分成了 5 個指標:獲客、啟用、留存、收益、傳播。分別對應“使用者如何找到我們?”、“使用者的首次體驗如何?”、“使用者會回來嗎?”、“如何賺到更多的錢?”、“使用者會轉介紹,告訴其他人嗎?”這五個問題。大家在做使用者增長的時候可以透過指標資料問自己對應的問題,找到轉化低的環節進行最佳化。只有找到合適的渠道,在合適的時間,把合適的產品,推給合適的使用者,才能實現精準的使用者增長。 2、轉化漏斗模型 轉化漏斗模型,主要是透過轉化率分析整個業務流程中的轉化和流失情況。透過轉化資料,對每個環節的流失使用者再進行精準營銷。舉個例子:一個手機公司同時在抖音和小紅書投放了廣告,透過轉化漏斗發現小紅書帶來的最終購買比較低,那麼此時就找到了解決問題的抓手,可以就提高小紅書渠道的轉化去做最佳化。

8個數據分析模型簡介
8個數據分析模型簡介

轉自:浪尖聊大數據

大家在工作中是不是經常要做各種分析,但又常常遇到無從下手,抓不住重點,搞不清關鍵資料的情況。俗話說“工欲善其事,必先利其器。”一個好用的資料分析模型,能給我們提供一種視角和思維框架,從而幫我們理清分析邏輯,提高分析準確性。

今天特意為大家整理出了8大常用資料分析模型,幫助大家快速提高資料分析能力。

1、AARRR模型

AARRR模型又叫海盜模型,這個模型把實現使用者增長拆分成了 5 個指標:獲客、啟用、留存、收益、傳播分別對應“使用者如何找到我們?”、“使用者的首次體驗如何?”、“使用者會回來嗎?”、“如何賺到更多的錢?”、“使用者會轉介紹,告訴其他人嗎?”這五個問題。大家在做使用者增長的時候可以透過指標資料問自己對應的問題,找到轉化低的環節進行最佳化。只有找到合適的渠道,在合適的時間,把合適的產品,推給合適的使用者,才能實現精準的使用者增長。

2、轉化漏斗模型

轉化漏斗模型,主要是透過轉化率分析整個業務流程中的轉化和流失情況。透過轉化資料,對每個環節的流失使用者再進行精準營銷。舉個例子:一個手機公司同時在抖音和小紅書投放了廣告,透過轉化漏斗發現小紅書帶來的最終購買比較低,那麼此時就找到了解決問題的抓手,可以就提高小紅書渠道的轉化去做最佳化。

--

--

對於資料分析師來說,我們是必須學習統計學知識的,畢竟天天跟資料打交道,總不能連最基礎的統計學知識都不會吧?

舉個例子,資料分析,你如果連最起碼的置信區間都不懂,你還怎麼處理資料?如果統計學中最基本、核心的思想:用樣本估計總體,你都沒概念,就別說自己會資料分析了。

但多數人在學習統計學知識時會無比頭疼,因為統計學的書籍裡幾乎都是複雜的推理公式,讓人難以理解。其實,對於大部分資料分析師來說,我們並不需要掌握的那麼細。

因此,我整理了一些你需要掌握的統計學知識,把統計學知識展開了說,讓大家大致瞭解有哪幾個模組知識,然後跟著這些模組知識去學習。

一、機率與機率分佈

先要明確,統計學不研究統計,它研究的是不確定性!而不確定性事件唯一的量化標準就是機率,獨立隨機事件沒法透過機率來預判何時發生,但卻可以用機率來描述事件發生的可能性。

這一模組主要掌握:

隨機事件的機率

離散隨機變數

連續隨機變數的機率分佈

二、資料的概括性度量

在資料人的實際工作中,你會經常遇到這種情況:業務人員/老闆拿到一坨資料,丟在你面前,讓你分析。這時,大多數人會不知所措,不知道從哪一步開始整理這些資料。這個時候,就需要透過概括性的度量指標,來幫我們從宏觀上把握資料中的初步資訊。

這一模組主要掌握

集中趨勢的度量

離散程度的度量

分佈形態的度量

--

--

文章來自於:傑哥的IT之旅

Python憑藉其簡潔的程式碼,贏得了許多開發者的喜愛。因此也就促使了更多開發者用Python開發新的模組,從而形成良性迴圈,Python可以憑藉更加簡短的程式碼實現許多有趣的操作。下面我們來看看,我們用不超過10行程式碼能實現些什麼有趣的功能。

一、生成二維碼

二維碼又稱二維條碼,常見的二維碼為QR Code,QR全稱Quick Response,是一個近幾年來移動裝置上超流行的一種編碼方式,而生成一個二維碼也非常簡單,在Python中我們可以透過MyQR模組了生成二維碼,而生成一個二維碼我們只需要2行程式碼,我們先安裝MyQR模組,這裡選用國內的源下載:

安裝完成後我們就可以開始寫程式碼了:

--

--

文章來源於DataCharm ,作者寧俊騏

有很多讀者私信小編“有啥系統介紹視覺化類型的學習和參考資料?”。小編平時在繪製視覺化作品時,也會對種類繁多的視覺化圖表選擇和系統繪製無從下手。今天,小編就推薦平時自己參考的視覺化表種類網站,幫你熟悉和完善圖表類型。內容如下:

Chart Guide

Datavizproject

Chart Guide

要想對所有視覺化圖表有個清楚的認識和分類,Chart Guide這個優秀的視覺化網址就不得不說下了。其提供豐富的圖表類型和每一種圖表的設計參考,為視覺化愛好者提供詳細參考。接下里小編就詳細介紹這個網站。

1、「網址和主要內容」

Chart Guide的網站為https://chart.guide/。內容包括Choose a ChartDesign a Chart兩個主要部分,前者包含多個視覺化圖表類型,後者則是對每一種圖表進行解釋和設計建議。

2、「圖表種類」

Chart Guide提供多達6大類圖表類型,分別為:

類別比較型(Comparing Categories)

時間序列型(Change over time)

區域性整體型(Part to whole)

關係或等級型(Relationship or hierarchy)

地理空間型(Geospatial)

資料分佈型(Distribution)

3、「圖表類比展示」

這一部分小編分別列出每一個圖形類別及其多個圖表小類,便於小夥伴們閱讀,如下:

類別比較型(Comparing Categories):顯示不同類別之間的比較,包含的多個子類如下:

時間序列型(Change over time):顯示隨著時間的推移或趨勢的發展,包含的多個子類如下:

--

--

文章來源於:可樂的數據分析之路

應用程式慢如牛,原因多多,可能是網路的原因、可能是系統架構的原因,還有可能是資料庫的原因。

那麼如何提高資料庫SQL語句執行速度呢?有人會說效能調優是資料庫管理員(DBA)的事,然而效能調優跟程式設計師們也有莫大的關係。

程式中嵌入的一行行的SQL語句,如果使用了一些最佳化小技巧,定能達到事半功倍的效果。

技巧1 比較運算子能用 “=”就不用“<>”

“=”增加了索引的使用機率。

技巧2 明知只有一條查詢結果,那請使用 “LIMIT 1”

“LIMIT 1”可以避免全表掃描,找到對應結果就不會再繼續掃描了。

技巧3 為列選擇合適的資料型別

能用TINYINT就不用SMALLINT,能用SMALLINT就不用INT,道理你懂的,磁碟和記憶體消耗越小越好嘛。

技巧4 將大的DELETE,UPDATE or INSERT 查詢變成多個小查詢

能寫一個幾十行、幾百行的SQL語句是不是顯得逼格很高?然而,為了達到更好的效能以及更好的資料控制,你可以將他們變成多個小查詢。

--

--

數據分析那些事

數據分析那些事

這是一個專注於數據分析職場的內容部落格,聚焦一批數據分析愛好者,在這裡,我會分享數據分析相關知識點推送、(工具/書籍)等推薦、職場心得、熱點資訊剖析以及資源大盤點,希望同樣熱愛數據的我們一同進步! 臉書會有更多互動喔:https://www.facebook.com/shujvfenxi/