用好FineBI的這個功能,數據處理真的很簡單!

--

​目錄

第一步:學會如何調整並簡化數據結構
1、調整數據結構
2、處理重複行數據
3、對null值的處理
第二步:學會如何對多張表進行合併分析
第三步:學會新增計算及分析指標
第四步:學會對數據進行校驗
1、表頭數據校驗
2、步驟區關鍵步驟取消應用

最近很多剛開始學FineBI的同學過來問我,咱們這個數據編輯該怎麼玩,畢竟這是咱數據分析的第一步,這步搞不清楚,後面的數據分析就不好玩下去了。

因此,今天咱就和剛接觸FineBI的新朋友,好好嘮一嘮數據編輯這件事。

本篇將會通過四步,帶大家瞭解一下Fine BI的數據編輯功能。

第一步:學會如何調整並簡化數據結構
第二步:學會如何對多張表進行合併分析
第三步:學會新增計算及分析指標
第四步:學會對處理後的數據進行校驗

第一步:學會如何調整並簡化數據結構

1、調整數據結構

在進行數據分析前,我們的數據結構往往不能直接開始分析,通常需要一些行列轉換,將數據處理成自己需要的字段。

在FineBI中,我們通過數據編輯內封裝的功能“拆分行列”“行列轉換”就可以快速實現想要的效果。

原數據結構:

原始數據字段內容混雜,不利於開展分析

處理後數據結構:

拆分行列並轉換後,字段結構簡單清晰

2、處理重複行數據

實際的業務分析中,數據質量問題永遠是業務順利開展分析最大的攔路虎。

最常遇到的就是重複行問題。在刪除這些重複行的時候,又會遇到兩種情況。

第一種是保留任意一行都不影響分析,例如“A、A、A”保留一個A即可。針對這種情況,FineBI內封裝了“刪除重複行”可以快速實現。

第二種情況是需要保留特定的一行。比如同一個客戶在系統中有兩行數據,我在分析時,需要有選擇的去保留最新錄入的一條。

遇到這種“A、B、C”只要取A的場景時,我們可以利用“刪除重複行”保留最上方一行的邏輯,先對數據表進行排序,再進行刪除重複行的操作。

功能封裝,選擇去重字段快速去重

而表頭的快捷操作,也讓檢查重複行變得更加簡單。

表頭下拉菜單對字段內容進行統計,重複行快速發現

3、對null值的處理

null值作爲一個必定會遇到的問題,在不同的業務場景下會有截然不同的處理方式。

在數據量巨大的時候,如果null值很少,不會對我們計算總和或平均值造成很大的波動,那我們可以直接忽略。

若有些null值在處理時希望直接作爲髒數據整行剔除時,則可以使用表頭的快捷過濾迅速的將空值進行排除。

通過表頭過濾快速找出空值,並進一步選擇是否要過濾掉

以上都是簡單的場景處理,而在實際業務中,可能會遇到null值存在業務含義的情況。

例如示例中的數據,這位同學英語成績爲空的原因可能是他本身就因病沒參加考試,此時既不能放着不管,也不能直接刪去他的這一行數據。

對於這種情況,我們要做的是針對某一類特殊情況打上對應的標籤,以便在後續的分析中,有選擇地過濾。在FineBI中,可以用“新增公式列”或者更方便的“條件標籤列”來實現。

對存在空值成績的同學打上缺考標籤

第二步:學會如何對多張表進行合併分析

注:合併分析可指從其他表添加列,左右合併,上下合併。

實際業務中,我們所需要的數據往往來自於多張表。在分析前,另外一個大難題就是,如何合併這些表。我們爲剛上手BI的業務,歸納了以下兩種合併的場景。

我們首先想象合併後表的狀態,一種是表格上下擴展,分析的字段並沒有增加,但是行數變多了。此時可以使用“上下合併”快速完成表的拼接。

表格上下擴展,分析的字段並沒有增加

另一種複雜的情況是合併後的表格是橫向擴展的,即分析的字段變多了。

在討論左右合併前,我們不妨先看看“其他表添加列”

也許你對這個名字摸不着頭腦,但是肯定不會對Excel的Vlookup、Sumif感到陌生。

沒錯,這個功能可以將其他表的指標字段進行聚合後合併(Sumif)或是查詢對應的維度匹配到這張表中(Vlookup)。

成績根據要求求和後作爲一個新的字段,依據“姓名”合併到本表中
而對SQL老練的玩家來說,left join、right join…..可能更加親切,此時可以選擇BI數據編輯中的“左右合併”功能,與SQL的邏輯是一致的,有基礎的朋友可以很快上手。

第三步:學會新增計算及分析指標

在處理好了數據結構、並將多表進行合併處理後,我們需要停下來,審視一下自己所分析的問題,以及對應這個問題所需要的指標是否已經在表中了。

一般來說,事情可能沒有這麼順利,當然這也在常理之中,比如在零售行業的分析中,往往需要我們自己計算毛利率、增長率等指標。

在開始分析前,我們可以將這些計算指標增添到數據表中。怎麼做呢?

首先是最令人熟悉的“新增公式列”,這個功能和Excel中寫公式一樣,只需要輸入對應的公式就能產生對應的字段。接着是一些常用計算的封裝功能,“新增彙總列”可以幫助我們進行簡單的聚合計算。

選擇對應的分組以及計算方式,對指標進行計算

“條件標籤列”這個功能則解決了衆多分析師日常最頭疼的IF嵌套問題,不需要寫嵌套了七八層的IF公式,只需通過鼠標配置不同的條件,就可以對數據賦予不同的標籤(值)。

通過添加特定條件篩選數據並賦予對應的標籤

第四步:學會對數據進行校驗

剛接觸BI的朋友遇到最大的問題不僅在於不理解BI許多功能的計算邏輯,更在於由此產生的對數據處理結果的不信任。

“我這麼做,出來的結果是對的嗎”是新手朋友最常問自己的一個問題。

爲了方便用戶進行校驗,數據編輯界面也內置了很多便利的功能。

1、表頭數據校驗

選中字段後,可以在左下角快速獲得平均值、總和、記錄數等數據,我們可以通過對熟悉的數據進行校驗,結合經驗來判斷是否正確。

數學成績字段校驗得出平均分85.92,符合班級歷史平均水平

2、步驟區關鍵步驟取消應用

BI可以在處理步驟間插入新的步驟,同時也可以設置某些步驟暫時取消生效。

利用這一點,我們可以通過過濾出部分關鍵數據,並取消應用一些疑惑的關鍵步驟來進行試錯。就如同剛學數學時習慣性的多次驗算一樣,雖然對老玩家略顯繁瑣,但的確是最令新手放心的定心丸。

--

--

數據分析那些事
數據分析那些事

Written by 數據分析那些事

這是一個專注於數據分析職場的內容部落格,聚焦一批數據分析愛好者,在這裡,我會分享數據分析相關知識點推送、(工具/書籍)等推薦、職場心得、熱點資訊剖析以及資源大盤點,希望同樣熱愛數據的我們一同進步! 臉書會有更多互動喔:https://www.facebook.com/shujvfenxi/

No responses yet