網站首頁百科全書 >正文
導讀1、數據預處理技術有哪些2、有四種數據預處理技術:3、1.數據清理??杖敝堤幚怼⒏袷綐藴驶?、異常數據消除、錯誤校正和重復數據消除。4、2....
1、數據預處理技術有哪些
2、有四種數據預處理技術:
3、1.數據清理??杖敝堤幚?、格式標準化、異常數據消除、錯誤校正和重復數據消除。
4、2.數據整合。將來自多個數據源的數據組合起來,以統(tǒng)一的方式存儲,構建數據倉庫的過程實際上就是數據集成。
5、3.數據轉換。平滑、聚合、歸一化、最小-最大歸一化等。
6、4.數據簡化。降維(刪除無關屬性(維度))、數據壓縮(PCA、LDA、SVD、小波變換)、數值降維(回歸和對數線性模型、線性回歸、對數線性模型、直方圖)。
7、現實中,世界上的數據一般都是不完整、不一致的臟數據,無法直接挖掘,或者挖掘結果不盡如人意。為了提高數據挖掘的質量,數據預處理技術得到了發(fā)展。數據預處理的方法有很多:數據清洗、數據集成、數據轉換、數據歸約等。這些數據處理技術是在數據挖掘之前使用的,大大提高了數據挖掘模式的質量,減少了實際挖掘所需的時間。數據清理例程通過填充缺失值、平滑噪聲數據、識別或刪除異常值以及解決不一致來“清理”數據。主要實現了以下目標:格式標準化、異常數據剔除、糾錯和重復數據剔除。在挖掘數據的時候,數據量非常大,少量的數據挖掘和分析需要很長的時間。利用數據約簡技術可以得到數據集的約簡表示,約簡表示要小得多,但仍接近保持原始數據的完整性,結果與約簡前相同或幾乎相同。
本文到此結束,希望對大家有所幫助。
版權說明:本文由用戶上傳,如有侵權請聯(lián)系刪除!
- 上一篇:家用打印機型號推薦(如何查找打印機型號)
- 下一篇:最后一頁
猜你喜歡:
- 2022-07-04家用打印機型號推薦(如何查找打印機型號)
- 2022-07-04華為智慧識屏游戲怎么用(華為智慧識屏如何使用)
- 2022-07-04蘋果藍牙怎么打開不了(蘋果藍牙怎么打開)
- 2022-07-04群主怎么查看退群名單(微信退群群主有通知嗎)
- 2022-07-04小米8se有雙路wifi嗎(小米8se是雙路wifi嗎)
- 2022-07-04如何查找打印機ip地址和端口名稱(如何查找打印機ip地址)
- 2022-07-04如何開啟微信提示音(微信提示音怎么開啟)
最新文章:
- 2022-07-04家用打印機型號推薦(如何查找打印機型號)
- 2022-07-04華為智慧識屏游戲怎么用(華為智慧識屏如何使用)
- 2022-07-04廣東都有哪些美食簡單好吃的呢(廣東都有什么好吃的廣東美食)
- 2022-07-04蘋果藍牙怎么打開不了(蘋果藍牙怎么打開)
- 2022-07-04群主怎么查看退群名單(微信退群群主有通知嗎)
- 2022-07-04小米8se有雙路wifi嗎(小米8se是雙路wifi嗎)
- 2022-07-04如何查找打印機ip地址和端口名稱(如何查找打印機ip地址)
- 2022-07-04如何開啟微信提示音(微信提示音怎么開啟)
- 2022-07-04vivox9互傳在哪里打開視頻(vivox9互傳在哪里打開)
- 2022-07-04小米9se帶紅外線功能嗎(小米8se有紅外線功能嗎)
- 2022-07-04美版蘋果11有nfc功能嗎(蘋果11有nfc功能嗎)
- 2022-07-04微信聊天記錄到底能不能被調取(微信聊天記錄別人可以調取嗎)
- 2022-07-04蘋果11只有一個卡槽嗎(蘋果11有幾個卡槽)
- 2022-07-04微信草稿能保存多長時間(微信草稿能保存多久)
- 2022-07-04蘋果11單卡是哪一款(蘋果11有單卡的嗎)
- 熱點推薦
- 熱評文章