為什麼近幾年許多企業開始培養大數據人才,因為,只要懂得善用手邊的數據,精確找到“對”的客戶、把預算放在“對”的產品,用最少資源產出最大價值,進而提高公司營運績效,這絕對是現今企業最想做的事!
個人投入大數據培育工作已有幾年時間
處理過許多企業遇到的大數據問題,有趣的是,許多企業遇到不是如何分析與解讀資料,而是手邊的數據資料根本無法分析,因為資料是“髒”的!或者我們稱之為“Dirty Data”,維基百科翻譯為“髒數據”。
當數據資料還處於髒的狀況下,如果沒有事先將數據梳理好將無法進行下一步的分析工作。下圖列出從資料轉為資訊,再將分析化為決策的流程,其中第一個步驟便是要將原始資料進行結構梳理,才能進行數據分析。
我們用個例子來說明:我們想要喝西瓜汁,但對方卻是給我們一顆還沒去皮的西瓜,此時,我們得先去皮,再將果肉放入果汁機,最後,還得除去雜質,才能喝到西瓜汁。其中的去皮、切塊、除去雜質相當於進行資料梳理的工作!
接下來,我們再進一步談談為什麼會有“Dirty Data”
下一篇將分享為什麼會變成髒數據!可以怎麼解決!
相關課程
作者:游振昌
●專案管理顧問有限公司 執行長
●中華國際專案經理人協會 理事長
●Project Club 發起人暨資深顧問