曹先明,王 承,姜明鑫
1.中國(guó)聯(lián)合網(wǎng)絡(luò)通信有限公司濟(jì)寧市分公司校園服務(wù)中心,山東濟(jì)寧 272100
2.濟(jì)寧市高級(jí)職業(yè)學(xué)校,山東濟(jì)寧 272000
3.中國(guó)聯(lián)合網(wǎng)絡(luò)通信有限公司濟(jì)寧市分公司,山東濟(jì)寧 272000
數(shù)據(jù)挖掘的要領(lǐng)是從大量的、不完全的、有噪聲的、不清晰的、隨機(jī)化的現(xiàn)實(shí)使用數(shù)據(jù)中,提取隱藏在其中的、人們事前不能預(yù)知的、但已經(jīng)潛在的和可以使用的模式過(guò)程?;ヂ?lián)網(wǎng)技術(shù)在現(xiàn)代信息社會(huì)的大環(huán)境下,得到了長(zhǎng)足的應(yīng)用和發(fā)展。利用互聯(lián)網(wǎng)技術(shù)使得現(xiàn)代網(wǎng)絡(luò)教育可以充分利用長(zhǎng)期以來(lái)傳統(tǒng)面授教育積累下來(lái)的大量?jī)?yōu)秀教育資源。網(wǎng)絡(luò)中包含了豐富的動(dòng)態(tài)超鏈接信息,以及頁(yè)面的訪問(wèn)和使用信息。隨著WWW的發(fā)展,Web數(shù)據(jù)挖掘在數(shù)據(jù)挖掘領(lǐng)域中的作用越來(lái)越重要。通過(guò)挖掘Web使用記錄發(fā)現(xiàn)潛在的、有價(jià)值的信息,如用戶訪問(wèn)了哪些頁(yè)面,點(diǎn)擊了哪些鏈接、哪些頁(yè)面的點(diǎn)擊頻率最高等等,通過(guò)對(duì)Web日志進(jìn)行挖掘,可以跟蹤發(fā)現(xiàn)用戶的訪問(wèn)習(xí)慣,以此來(lái)改進(jìn)網(wǎng)頁(yè)的設(shè)計(jì)結(jié)構(gòu),以實(shí)現(xiàn)智能化、個(gè)性化的用戶界面。目前,數(shù)據(jù)挖掘的研究重點(diǎn)逐漸從發(fā)現(xiàn)方法的研究轉(zhuǎn)向?qū)嶋H的系統(tǒng)應(yīng)用,國(guó)際上有影響的典型數(shù)據(jù)挖掘系統(tǒng)有SAS公司的Enterprise Miner,IBM公司的Intelligent Miner,SGI公司的Set Miner等。
數(shù)據(jù)挖掘利用了如下一些領(lǐng)域的思想內(nèi)容:1)建模識(shí)別、機(jī)器語(yǔ)言學(xué)習(xí)、人工智能的探索算法、理論學(xué)習(xí)和建模技術(shù);2)利用統(tǒng)計(jì)學(xué)中的估算、假設(shè)檢查和抽樣。數(shù)據(jù)挖掘容納了一些思想信息在其他領(lǐng)域中,這類(lèi)領(lǐng)域中包含最先進(jìn)的可視化信息檢索、進(jìn)化計(jì)算論、電子信號(hào)處理、信息技術(shù)理論。
隨著數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的迅速發(fā)展以及數(shù)據(jù)庫(kù)管理系統(tǒng)的廣泛應(yīng)用,人們?cè)诜e累了大量的數(shù)據(jù)信息后,急切地感覺(jué)到需要一種新的技術(shù)工具從大量數(shù)據(jù)信息中智能的、自動(dòng)的抽取出有價(jià)值的符合用戶需要的知識(shí)或信息,數(shù)據(jù)庫(kù)知識(shí)的發(fā)現(xiàn)應(yīng)運(yùn)而生。數(shù)據(jù)挖掘就是對(duì)于在一些實(shí)際或察看信息的集合中查找模式的政策支持過(guò)程,人工智能、機(jī)器語(yǔ)言的學(xué)習(xí)、數(shù)據(jù)庫(kù)理論、統(tǒng)計(jì)分析學(xué)神經(jīng)系統(tǒng)網(wǎng)絡(luò)、知識(shí)庫(kù)技術(shù)系統(tǒng)、高性能計(jì)算應(yīng)用、數(shù)據(jù)可視化教學(xué)信息查找、模式發(fā)現(xiàn)等學(xué)科的研究是數(shù)據(jù)挖掘涉及到的方面,數(shù)據(jù)挖掘是一個(gè)多學(xué)科多方面的交叉內(nèi)容。
我們把數(shù)據(jù)在網(wǎng)絡(luò)上的挖掘應(yīng)用叫做Web挖掘,在網(wǎng)絡(luò)數(shù)據(jù)使用過(guò)程中,利用數(shù)據(jù)挖掘技術(shù)以及與萬(wàn)維網(wǎng)有關(guān)的數(shù)據(jù)信息庫(kù)中的資源、網(wǎng)絡(luò)用戶的操作行為,在用戶操作過(guò)程中獲取有關(guān)部門(mén)感舉的信息,搜尋可利用的挖掘模式和潛在的數(shù)據(jù)信息,相關(guān)內(nèi)容涉及多個(gè)領(lǐng)域,例如:計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)、數(shù)據(jù)挖掘技術(shù)、計(jì)算機(jī)科學(xué)技術(shù)、機(jī)器語(yǔ)言學(xué)等,是一項(xiàng)現(xiàn)代信息科學(xué)的綜合產(chǎn)物。對(duì)網(wǎng)頁(yè)中的頁(yè)面信息,以及頁(yè)面后臺(tái)數(shù)據(jù)庫(kù)中的操作數(shù)據(jù)進(jìn)行統(tǒng)計(jì)收集,從網(wǎng)頁(yè)文件內(nèi)容里以及內(nèi)容中所描述的信息數(shù)據(jù)里抽取有價(jià)值的、潛在的、有用的信息的過(guò)程,叫做Web內(nèi)容挖掘。
電子商務(wù)是在全球各地廣泛的商業(yè)貿(mào)易交易中,在互聯(lián)網(wǎng)開(kāi)放的網(wǎng)絡(luò)環(huán)境里,基于服務(wù)器、瀏覽器使用方式,買(mǎi)賣(mài)雙方不見(jiàn)面地情況下進(jìn)行各種貿(mào)易活動(dòng),讓消費(fèi)者完成網(wǎng)上購(gòu)物、商鋪之間的網(wǎng)絡(luò)交易和在線支付以及各種商務(wù)貿(mào)易及相關(guān)的綜合性服務(wù)的一種商業(yè)運(yùn)營(yíng)模式,是當(dāng)代社會(huì)最新型的運(yùn)營(yíng)模式。
電子商務(wù)是使用計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)和遠(yuǎn)程通信技術(shù),實(shí)現(xiàn)整個(gè)貿(mào)易過(guò)程的電子信息化和數(shù)據(jù)化;是使用互聯(lián)網(wǎng)作為手段,使買(mǎi)賣(mài)雙方不見(jiàn)面地情況下可進(jìn)行各種商務(wù)貿(mào)易活動(dòng)。
隨著信息系統(tǒng)的廣泛使用,如何充分利用數(shù)據(jù),發(fā)掘有用的知識(shí),是廣大擁有大量數(shù)據(jù)的組織非常關(guān)心的問(wèn)題,在此前景下,需要從數(shù)據(jù)中找出有用的知識(shí)。介于以上情況,人們需要使用一個(gè)新的技術(shù)工具將數(shù)據(jù)轉(zhuǎn)換為自己所需要發(fā)知識(shí)內(nèi)容,這便產(chǎn)生了數(shù)據(jù)挖掘技術(shù)。
數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用前景廣闊,隨著數(shù)據(jù)挖掘技術(shù)與數(shù)據(jù)庫(kù)技術(shù)的不斷發(fā)展,對(duì)Web挖掘中存在的各種復(fù)雜的非結(jié)構(gòu)化數(shù)據(jù)會(huì)有更完善的解決方法。隨著社會(huì)的不斷發(fā)展,電子商務(wù)必將加快中國(guó)經(jīng)濟(jì)發(fā)展的步伐,電信行業(yè)的迅速發(fā)展,網(wǎng)絡(luò)迅猛普及更為中國(guó)的網(wǎng)絡(luò)電子商務(wù)打下了堅(jiān)實(shí)的基礎(chǔ)。數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用前景廣闊,隨著數(shù)據(jù)挖掘技術(shù)與數(shù)據(jù)庫(kù)技術(shù)的不斷發(fā)展,對(duì)Web挖掘中存在的各種復(fù)雜的非結(jié)構(gòu)化數(shù)據(jù)會(huì)有更完善的解決方法。
隨著社會(huì)的不斷發(fā)展,電子商務(wù)必將加快中國(guó)經(jīng)濟(jì)發(fā)展的步伐,電信行業(yè)的迅速發(fā)展,網(wǎng)絡(luò)迅猛普及更為中國(guó)的網(wǎng)絡(luò)電子商務(wù)打下了堅(jiān)實(shí)的基礎(chǔ)。很多城市都在興建自己的數(shù)碼港我國(guó)上網(wǎng)人數(shù)也在快速上升,許多小區(qū)都有了互聯(lián)網(wǎng),寬帶的進(jìn)入,相信會(huì)有更多的人采取這種方式來(lái)發(fā)展自己的營(yíng)銷(xiāo)計(jì)劃。因而可以說(shuō),電子商務(wù)網(wǎng)站在中國(guó)將會(huì)有巨大的發(fā)展前景。
[1]朱明.數(shù)據(jù)挖掘[M].中國(guó)科學(xué)技術(shù)大學(xué)出版社,2002:75.
[2]余強(qiáng),張海盛.個(gè)性化Web信息服務(wù)技術(shù)研究[J].四川:計(jì)算機(jī)應(yīng)用研究,2006,2:198-200.
[3]毛國(guó)君,段立娟.數(shù)據(jù)挖掘原理與算法[M].北京:清華大學(xué)出版社,2005:20-39.