用好FineBI的這個功能,數據處理真的很簡單!

--

最近很多剛開始學FineBI的同學過來問數據君,數據編輯該怎麼做,畢竟這是數據分析的第一步,這步搞不清楚,後面的數據分析就不好進行下去了。

因此,今天數據君就和剛接觸FineBI的新朋友,好好嘮一嘮數據編輯這件事。

本篇將會透過四步,帶大家瞭解一下Finebi的數據編輯功能。

第一步:學會如何調整並簡化數據結構

1、調整數據結構
在進行數據分析前,我們的數據結構往往不能直接開始分析,通常需要一些行列轉換,將數據處理成自己需要的欄位。

FineBI中,我們透過數據編輯內封裝的功能“拆分行列”“行列轉換”就可以快速實現想要的效果。

原數據結構:

原始數據欄位內容混雜,不利於開展分析

處理后數據結構:

拆分行列並轉換後,欄位結構簡單清晰

2、處理重複行數據

實際的業務分析中,數據質量問題永遠是業務順利開展分析最大的攔路虎。

最常遇到的就是重複行問題。在刪除這些重複行的時候,又會遇到兩種情況。

第一種是保留任意一行都不影響分析,例如“A、A、A”保留一個A即可。針對這種情況,FineBI內封裝了“刪除重複行”可以快速實現。

第二種情況是需要保留特定的一行。比如同一個客戶在系統中有兩行數據,我在分析時,需要有選擇的去保留最新錄入的一條。

遇到這種“A、B、C”只要取A的場景時,我們可以利用“刪除重複行”保留最上方一行的邏輯,先對數據表進行排序,再進行刪除重複行的操作。

功能封裝,選擇去重欄位快速去重

而表頭的快捷操作,也讓檢查重複行變得更加簡單

表頭下拉選單對欄位內容進行統計,重複行快速發現

3、對null值的處理

null值作為一個必定會遇到的問題,在不同的業務場景下會有截然不同的處理方式。

在數據量巨大的時候,如果null值很少,不會對我們計算總和或平均值造成很大的波動,那我們可以直接忽略。

若有些null值在處理時希望直接作為髒數據整行剔除時,則可以使用表頭的快捷過濾迅速的將空值進行排除。

透過表頭過濾快速找出空值,並進一步選擇是否要過濾掉

以上都是簡單的場景處理,而在實際業務中,可能會遇到null值存在業務含義的情況。

例如示例中的數據,這位同學英語成績為空的原因可能是他本身就因病沒參加考試,此時既不能放著不管,也不能直接刪去他的這一行數據。

對於這種情況,我們要做的是針對某一類特殊情況打上對應的標籤,以便在後續的分析中,有選擇地過濾。在FineBI中,可以用“新增公式列”或者更方便的“條件標籤列”來實現。

對存在空值成績的同學打上缺考標籤

第二步:學會如何對多張表進行合併分析

注:合併分析可指從其他表新增列,左右合併,上下合併。

實際業務中,我們所需要的數據往往來自於多張表。在分析前,另外一個大難題就是,如何合併這些表。我們為剛上手BI的業務,歸納了以下兩種合併的場景。

我們首先想象合併後表的狀態,一種是表格上下擴充套件,分析的欄位並沒有增加,但是行數變多了。此時可以使用“上下合併”快速完成表的拼接。

表格上下擴充套件,分析的欄位並沒有增加

另一種複雜的情況是合併後的表格是橫向擴充套件的,即分析的欄位變多了。

在討論左右合併前,我們不妨先看看“其他表新增列”

也許你對這個名字摸不著頭腦,但是肯定不會對Excel的Vlookup、Sumif感到陌生

沒錯,這個功能可以將其他表的指標欄位進行聚合後合併(Sumif)或是查詢對應的維度匹配到這張表中(Vlookup)。

成績根據要求求和後作為一個新的欄位,依據“姓名”合併到本表中

而對SQL老練的玩家來說,left join、right join…..可能更加親切,此時可以選擇BI數據編輯中的“左右合併”功能,與SQL的邏輯是一致的,有基礎的朋友可以很快上手。

第三步:學會新增計算及分析指標

在處理好了數據結構、並將多表進行合併處理後,我們需要停下來,審視一下自己所分析的問題,以及對應這個問題所需要的指標是否已經在表中了。

一般來說,事情可能沒有這麼順利,當然這也在常理之中,比如在零售行業的分析中,往往需要我們自己計算毛利率、增長率等指標。

在開始分析前,我們可以將這些計算指標增添到數據表中。怎麼做呢?

首先是最令人熟悉的“新增公式列”,這個功能和Excel中寫公式一樣,只需要輸入對應的公式就能產生對應的欄位。接著是一些常用計算的封裝功能,“新增彙總列”可以幫助我們進行簡單的聚合計算。

選擇對應的分組以及計算方式,對指標進行計算

“條件標籤列”這個功能則解決了眾多分析師日常最頭疼的IF巢狀問題,不需要寫嵌套了七八層的IF公式,只需透過滑鼠配置不同的條件,就可以對數據賦予不同的標籤(值)。

透過新增特定條件篩選數據並賦予對應的標籤

第四步:學會對數據進行校驗

剛接觸BI的朋友遇到最大的問題不僅在於不理解BI許多功能的計算邏輯,更在於由此產生的對數據處理結果的不信任。

“我這麼做,出來的結果是對的嗎”是新手朋友最常問自己的一個問題。

為了方便使用者進行校驗,數據編輯介面也內建了很多便利的功能。

1、表頭數據校驗

選中欄位後,可以在左下角快速獲得平均值、總和、記錄數等數據,我們可以透過對熟悉的數據進行校驗,結合經驗來判斷是否正確。

數學成績欄位校驗得出平均分85.92,符合班級歷史平均水平

2、步驟區關鍵步驟取消應用

BI可以在處理步驟間插入新的步驟,同時也可以設定某些步驟暫時取消生效。

利用這一點,我們可以透過過濾出部分關鍵數據,並取消應用一些疑惑的關鍵步驟來進行試錯。就如同剛學數學時習慣性的多次驗算一樣,雖然對老玩家略顯繁瑣,但的確是最令新手放心的定心丸。

透過表頭快速過濾出少部分数据進行“抽樣檢測”

以上就是本期的內容分享~~,碼字不易,如果覺得對你有一點點幫助,歡迎「追蹤」,「按贊」,「分享」喔,我會持續為大家創作優質的內容~~

※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。各位也可以關注我的Facebook,按讚我的臉書並私訊「10」,送你十週入門數據分析電子書唷!期待你與我互動起來~

☞☞☞點選下方圖片免費體驗FineBI工具demo

文章推薦:

數據分析之落地 sop 流程

那些年,背過的SQL題

MySQL常用指令碼

商業分析應該怎麼做?一篇文章把思維和工具說清楚了!

乾貨 | 如何搭建用戶分析體系

回顧十週入門數據分析系列文:

關注數據君的臉書,ins(全網同名)

我是「數據分析那些事」。常年在臉書ins分享數據分析乾貨,不定期分享好用的職場技能工具。按贊我的臉書,並在臉書置頂帖子下回復SQL50,會有MySQL經典50題及答案贈送唷!

--

--

數據分析那些事

這是一個專注於數據分析職場的內容部落格,聚焦一批數據分析愛好者,在這裡,我會分享數據分析相關知識點推送、(工具/書籍)等推薦、職場心得、熱點資訊剖析以及資源大盤點,希望同樣熱愛數據的我們一同進步! 臉書會有更多互動喔:https://www.facebook.com/shujvfenxi/