大香蕉综合在线观看视频-日本在线观看免费福利-欧美激情一级欧美精品性-综合激情丁香久久狠狠

好房網(wǎng)

網(wǎng)站首頁(yè)百科全書 >正文

數(shù)據(jù)預(yù)處理的內(nèi)容包括哪些(數(shù)據(jù)預(yù)處理包括哪些內(nèi)容)

2022-07-17 00:22:59 百科全書來(lái)源:
導(dǎo)讀1、數(shù)據(jù)預(yù)處理包括哪些內(nèi)容2、數(shù)據(jù)后處理是指在主處理之前的一些數(shù)據(jù)處理,包括:3、1.數(shù)據(jù)清理。數(shù)據(jù)清理例程通過(guò)填充缺失值、平滑噪聲數(shù)...

1、數(shù)據(jù)預(yù)處理包括哪些內(nèi)容

2、數(shù)據(jù)后處理是指在主處理之前的一些數(shù)據(jù)處理,包括:

3、1.數(shù)據(jù)清理。數(shù)據(jù)清理例程通過(guò)填充缺失值、平滑噪聲數(shù)據(jù)、識(shí)別或刪除異常值以及解決不一致問(wèn)題來(lái)“清理”數(shù)據(jù)。主要實(shí)現(xiàn)了以下目標(biāo):格式標(biāo)準(zhǔn)化、異常數(shù)據(jù)剔除、糾錯(cuò)和重復(fù)數(shù)據(jù)剔除。

4、2.數(shù)據(jù)整合。數(shù)據(jù)集成例程組合來(lái)自多個(gè)數(shù)據(jù)源的數(shù)據(jù),并以統(tǒng)一的方式存儲(chǔ)它們。構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)的過(guò)程實(shí)際上就是數(shù)據(jù)集成。

5、3.數(shù)據(jù)轉(zhuǎn)換。通過(guò)平滑聚合、數(shù)據(jù)泛化和標(biāo)準(zhǔn)化,將數(shù)據(jù)轉(zhuǎn)換成適合數(shù)據(jù)挖掘的形式。

6、4.數(shù)據(jù)簡(jiǎn)化。在挖掘數(shù)據(jù)的時(shí)候,數(shù)據(jù)量非常大,少量的數(shù)據(jù)挖掘和分析需要很長(zhǎng)的時(shí)間。利用數(shù)據(jù)約簡(jiǎn)技術(shù)可以得到數(shù)據(jù)集的約簡(jiǎn)表示,約簡(jiǎn)表示要小得多,但仍接近保持原始數(shù)據(jù)的完整性,結(jié)果與約簡(jiǎn)前相同或幾乎相同。

7、數(shù)據(jù)預(yù)處理是指在主處理之前對(duì)數(shù)據(jù)的一些處理。主要任務(wù)是清理異常值,糾正錯(cuò)誤數(shù)據(jù)?,F(xiàn)實(shí)世界中的數(shù)據(jù)一般都是不完整、不一致的臟數(shù)據(jù),無(wú)法直接挖掘,或者挖掘結(jié)果不盡如人意。為了提高數(shù)據(jù)挖掘的質(zhì)量,數(shù)據(jù)預(yù)處理技術(shù)得到了發(fā)展。數(shù)據(jù)預(yù)處理的方法有很多:數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)歸約等。這些數(shù)據(jù)處理技術(shù)是在數(shù)據(jù)挖掘之前使用的,大大提高了數(shù)據(jù)挖掘模式的質(zhì)量,減少了實(shí)際挖掘所需的時(shí)間。

本文到此結(jié)束,希望對(duì)大家有所幫助。


版權(quán)說(shuō)明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!


標(biāo)簽:

最新文章:

熱點(diǎn)推薦
熱評(píng)文章
隨機(jī)文章