Excel 如何數(shù)據(jù)清洗

[日期:2025-02-24] 作者:衛(wèi)星醬 次瀏覽 [字體: ]

Excel 如何數(shù)據(jù)清洗

秋葉Excel 2025/2/8 13:09:13 責(zé)編:夢(mèng)澤評(píng)論:0

原文標(biāo)題:《Excel 里把人“逼瘋”的雜亂數(shù)據(jù),原來(lái) 1 分鐘就能整理好!》


鏘鏘!大家好哇~ 我是最近在研究數(shù)據(jù)分析的衛(wèi)星醬~


數(shù)據(jù)分析中有個(gè)很重要的預(yù)處理步驟,叫做「數(shù)據(jù)清洗」。


簡(jiǎn)單來(lái)說(shuō)就是把數(shù)據(jù)中「臟臟的 」部分 —— 缺失的、重復(fù)的、錯(cuò)誤的等等,給它清除掉,剩下「干凈的」數(shù)據(jù)。


光講概念也太難理解了,衛(wèi)某今天就直接用實(shí)例,給大家看看數(shù)據(jù)清洗,到底是怎么個(gè)事兒~


1、缺失數(shù)據(jù)

如果某處缺了一兩個(gè)數(shù)據(jù),最簡(jiǎn)單的方法就是 —— 扔了它。


別笑!


這的確是正規(guī)的數(shù)據(jù)清洗手段,在表格不大、不完整數(shù)據(jù)較少的情況下,完全可以這樣做。


「比如 2002 年「產(chǎn)品 C」的產(chǎn)量缺失了,那就偷偷把 2002 年從統(tǒng)計(jì)表里刪掉,只分析后面的~」


Excel 如何數(shù)據(jù)清洗


但這樣可能將潛在信息刪除,也可能導(dǎo)致數(shù)據(jù)分析出現(xiàn)較大偏差。


所以,如果數(shù)據(jù)很多、空缺也多,刪除過(guò)多條目會(huì)使得結(jié)果產(chǎn)生較大偏差時(shí),我們還是得把空缺補(bǔ)上。


? 空值變 0 值


【Ctrl+G】定位,【定位條件】,選擇【空值】,【確定】,最后輸入 0。


Excel 如何數(shù)據(jù)清洗


? 統(tǒng)計(jì)學(xué)方法


但很多時(shí)候不能這樣粗暴地填充。


實(shí)際應(yīng)用常選擇統(tǒng)計(jì)學(xué)方法,比如平均值,來(lái)填充缺失的數(shù)據(jù)。


Excel 如何數(shù)據(jù)清洗


當(dāng)然,根據(jù)數(shù)據(jù)實(shí)際類型,也可能使用中間值、最大值、最小值或者其他更復(fù)雜的函數(shù)值。


像這個(gè)預(yù)測(cè)函數(shù),就怪好用的。


Excel 如何數(shù)據(jù)清洗


2、重復(fù)數(shù)據(jù)

至于重復(fù)數(shù)據(jù),在之前的「數(shù)據(jù)核對(duì)」篇中已經(jīng)講過(guò)了,這里就不再贅述。


點(diǎn)此回顧「數(shù)據(jù)核對(duì)」


很多時(shí)候,我們?cè)诨A(chǔ)的 Excel 應(yīng)用中就完成了「數(shù)據(jù)清洗」的步驟。


數(shù)據(jù)分析的門檻,真的沒(méi)我們想象的那么高~


3、錯(cuò)誤數(shù)據(jù)

函數(shù)錯(cuò)誤值,比如#DIV / 0!、#N / A! 之類,只要在公式外套上 IFERROR 就行:


Excel 如何數(shù)據(jù)清洗


另一種錯(cuò)誤數(shù)據(jù),就沒(méi)那么好對(duì)付了……


「比如等級(jí)只有「A / B / C」三種,有個(gè)單元格卻出現(xiàn)了「D」的;或者要求填寫(xiě)「√」,偏偏有人寫(xiě)「?」的……」


這種除了在一開(kāi)始設(shè)置數(shù)據(jù)驗(yàn)證,就只有用查找、計(jì)數(shù)、條件格式等偏門方法了


這種錯(cuò)誤數(shù)據(jù)「D」,可以用【查找】或【篩選】直接定位它。


Excel 如何數(shù)據(jù)清洗


而「感覺(jué)上不對(duì)」的數(shù)據(jù),就比較難找到了:


Excel 如何數(shù)據(jù)清洗


▲ 誤差過(guò)大,不是測(cè)量誤差可以解釋的


這時(shí)我們就只能因地制宜,想辦法定位它,例如用 IF 函數(shù)篩選大于 36.13 的數(shù)據(jù)。


找到之后按照「缺失數(shù)據(jù)」的辦法處理它就是了。


4、寫(xiě)在最后

好啦,今天從數(shù)據(jù)類型的角度給大家簡(jiǎn)單講了下數(shù)據(jù)清洗的做法~


小伙伴們還知道哪些屬于數(shù)據(jù)清洗的 Excel 操作呢?


本文來(lái)自微信公眾號(hào):秋葉 Excel(ID:excel100),作者:衛(wèi)星醬