目錄
第一步:學會如何調整並簡化數據結構
1、調整數據結構
2、處理重複行數據
3、對null值的處理
第二步:學會如何對多張表進行合併分析
第三步:學會新增計算及分析指標
第四步:學會對數據進行校驗
1、表頭數據校驗
2、步驟區關鍵步驟取消應用
最近很多剛開始學FineBI的同學過來問我,咱們這個數據編輯該怎麼玩,畢竟這是咱數據分析的第一步,這步搞不清楚,後面的數據分析就不好玩下去了。
因此,今天咱就和剛接觸FineBI的新朋友,好好嘮一嘮數據編輯這件事。
本篇將會通過四步,帶大家瞭解一下Fine BI的數據編輯功能。
第一步:學會如何調整並簡化數據結構
第二步:學會如何對多張表進行合併分析
第三步:學會新增計算及分析指標
第四步:學會對處理後的數據進行校驗
第一步:學會如何調整並簡化數據結構
1、調整數據結構
在進行數據分析前,我們的數據結構往往不能直接開始分析,通常需要一些行列轉換,將數據處理成自己需要的字段。
在FineBI中,我們通過數據編輯內封裝的功能“拆分行列”“行列轉換”就可以快速實現想要的效果。
原數據結構:
處理後數據結構:
2、處理重複行數據
實際的業務分析中,數據質量問題永遠是業務順利開展分析最大的攔路虎。
最常遇到的就是重複行問題。在刪除這些重複行的時候,又會遇到兩種情況。
第一種是保留任意一行都不影響分析,例如“A、A、A”保留一個A即可。針對這種情況,FineBI內封裝了“刪除重複行”可以快速實現。
第二種情況是需要保留特定的一行。比如同一個客戶在系統中有兩行數據,我在分析時,需要有選擇的去保留最新錄入的一條。
遇到這種“A、B、C”只要取A的場景時,我們可以利用“刪除重複行”保留最上方一行的邏輯,先對數據表進行排序,再進行刪除重複行的操作。
而表頭的快捷操作,也讓檢查重複行變得更加簡單。
3、對null值的處理
null值作爲一個必定會遇到的問題,在不同的業務場景下會有截然不同的處理方式。
在數據量巨大的時候,如果null值很少,不會對我們計算總和或平均值造成很大的波動,那我們可以直接忽略。
若有些null值在處理時希望直接作爲髒數據整行剔除時,則可以使用表頭的快捷過濾迅速的將空值進行排除。
以上都是簡單的場景處理,而在實際業務中,可能會遇到null值存在業務含義的情況。
例如示例中的數據,這位同學英語成績爲空的原因可能是他本身就因病沒參加考試,此時既不能放着不管,也不能直接刪去他的這一行數據。
對於這種情況,我們要做的是針對某一類特殊情況打上對應的標籤,以便在後續的分析中,有選擇地過濾。在FineBI中,可以用“新增公式列”或者更方便的“條件標籤列”來實現。
第二步:學會如何對多張表進行合併分析
注:合併分析可指從其他表添加列,左右合併,上下合併。
實際業務中,我們所需要的數據往往來自於多張表。在分析前,另外一個大難題就是,如何合併這些表。我們爲剛上手BI的業務,歸納了以下兩種合併的場景。
我們首先想象合併後表的狀態,一種是表格上下擴展,分析的字段並沒有增加,但是行數變多了。此時可以使用“上下合併”快速完成表的拼接。
另一種複雜的情況是合併後的表格是橫向擴展的,即分析的字段變多了。
在討論左右合併前,我們不妨先看看“其他表添加列”。
也許你對這個名字摸不着頭腦,但是肯定不會對Excel的Vlookup、Sumif感到陌生。
沒錯,這個功能可以將其他表的指標字段進行聚合後合併(Sumif)或是查詢對應的維度匹配到這張表中(Vlookup)。
成績根據要求求和後作爲一個新的字段,依據“姓名”合併到本表中
而對SQL老練的玩家來說,left join、right join…..可能更加親切,此時可以選擇BI數據編輯中的“左右合併”功能,與SQL的邏輯是一致的,有基礎的朋友可以很快上手。
第三步:學會新增計算及分析指標
在處理好了數據結構、並將多表進行合併處理後,我們需要停下來,審視一下自己所分析的問題,以及對應這個問題所需要的指標是否已經在表中了。
一般來說,事情可能沒有這麼順利,當然這也在常理之中,比如在零售行業的分析中,往往需要我們自己計算毛利率、增長率等指標。
在開始分析前,我們可以將這些計算指標增添到數據表中。怎麼做呢?
首先是最令人熟悉的“新增公式列”,這個功能和Excel中寫公式一樣,只需要輸入對應的公式就能產生對應的字段。接着是一些常用計算的封裝功能,“新增彙總列”可以幫助我們進行簡單的聚合計算。
而“條件標籤列”這個功能則解決了衆多分析師日常最頭疼的IF嵌套問題,不需要寫嵌套了七八層的IF公式,只需通過鼠標配置不同的條件,就可以對數據賦予不同的標籤(值)。
通過添加特定條件篩選數據並賦予對應的標籤
第四步:學會對數據進行校驗
剛接觸BI的朋友遇到最大的問題不僅在於不理解BI許多功能的計算邏輯,更在於由此產生的對數據處理結果的不信任。
“我這麼做,出來的結果是對的嗎”是新手朋友最常問自己的一個問題。
爲了方便用戶進行校驗,數據編輯界面也內置了很多便利的功能。
1、表頭數據校驗
選中字段後,可以在左下角快速獲得平均值、總和、記錄數等數據,我們可以通過對熟悉的數據進行校驗,結合經驗來判斷是否正確。
2、步驟區關鍵步驟取消應用
BI可以在處理步驟間插入新的步驟,同時也可以設置某些步驟暫時取消生效。
利用這一點,我們可以通過過濾出部分關鍵數據,並取消應用一些疑惑的關鍵步驟來進行試錯。就如同剛學數學時習慣性的多次驗算一樣,雖然對老玩家略顯繁瑣,但的確是最令新手放心的定心丸。
※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※
文章推薦
◆跟資料打交道的人都得會的這8種資料模型,滿足工作中95%的需求
關注數據君的臉書:
我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。按贊我的臉書,會有豐富資料包贈送唷!