趙翠榮
(安徽文達(dá)信息工程學(xué)院,安徽 合肥 231201)
前言:網(wǎng)絡(luò)型數(shù)據(jù)挖掘系統(tǒng),英文全稱E-Data Mining System,簡(jiǎn)稱E-DMS.在互聯(lián)網(wǎng)技術(shù)不斷發(fā)展的今天,網(wǎng)絡(luò)基礎(chǔ)設(shè)施平臺(tái)越來越趨于寬帶化,整體網(wǎng)絡(luò)的人性化與智能化水平也在日益提升,在應(yīng)用技術(shù)領(lǐng)域內(nèi)則更加偏向于多元與個(gè)性化發(fā)展,網(wǎng)絡(luò)型數(shù)據(jù)挖掘系統(tǒng)便是在這種條件下誕生的,為數(shù)據(jù)挖掘技術(shù)領(lǐng)域的進(jìn)一步發(fā)展開拓了新的空間.
E-DMS是以網(wǎng)絡(luò)技術(shù)動(dòng)態(tài)以及數(shù)據(jù)挖掘發(fā)展為依托的,其提出的主要目的是為了使數(shù)據(jù)挖掘能夠在互聯(lián)網(wǎng)的基礎(chǔ)上,為大眾所普遍應(yīng)用,為社會(huì)經(jīng)濟(jì)的進(jìn)一步發(fā)展提供條件.
現(xiàn)階段在網(wǎng)絡(luò)應(yīng)用領(lǐng)域中,比較主要的網(wǎng)絡(luò)架構(gòu)有以下幾種:C/S,B/S,B/C/S等[1].在對(duì)其進(jìn)行選擇的過程中,需要以網(wǎng)絡(luò)不同的應(yīng)用特點(diǎn)以及相應(yīng)的架構(gòu)優(yōu)勢(shì)來進(jìn)行合理選擇,針對(duì)相對(duì)復(fù)雜的網(wǎng)絡(luò)系統(tǒng),也可以采用多種網(wǎng)絡(luò)架構(gòu)相結(jié)合的模式.其中,C/S指的是客戶機(jī)/服務(wù)器,其主要優(yōu)勢(shì)是能夠?qū)C的處理能力充分發(fā)揮出來,使PC的反應(yīng)更加迅速,但這種模式只可以對(duì)局域網(wǎng)絡(luò)起作用,且PC需要安裝專用軟件才能夠完成作業(yè).B/S指的是瀏覽器/服務(wù)器,其優(yōu)勢(shì)在于不需要安裝專門軟件,在任何地點(diǎn)都可以進(jìn)行使用,但這種模式對(duì)服務(wù)器來講,其運(yùn)行的數(shù)據(jù)負(fù)荷相對(duì)較重.B/C/S指的是瀏覽器/客戶機(jī)/服務(wù)器,這種模式能夠有效彌補(bǔ)上兩種模式中的不足,同時(shí)兼顧兩種模式中的優(yōu)勢(shì),是當(dāng)前一種比較好的網(wǎng)絡(luò)架構(gòu)模式.
J2EE,英文全稱Java 2 Enterprise Edition,是現(xiàn)階段一種相對(duì)大型的網(wǎng)絡(luò)應(yīng)用軟件系統(tǒng)平臺(tái),在平臺(tái)內(nèi)部,是由多分層的布局結(jié)構(gòu)組成的,具有能夠跨平臺(tái)、跨語(yǔ)言、支持標(biāo)準(zhǔn)網(wǎng)際協(xié)議、兼容多種數(shù)據(jù)庫(kù)、J2EE API數(shù)量較多、應(yīng)用程序伸縮性較大等優(yōu)勢(shì)[2].具體來講,該系統(tǒng)平臺(tái)可以分為以下幾個(gè)層次:
1.客戶層
所謂的客戶層,主要指的是對(duì)網(wǎng)絡(luò)程序中客戶信息進(jìn)行處理和表示的界面,主要通過網(wǎng)絡(luò)設(shè)備、PC、無線移動(dòng)設(shè)備等與對(duì)應(yīng)的網(wǎng)絡(luò)應(yīng)用系統(tǒng)進(jìn)行交流,以客戶端實(shí)現(xiàn)的功能與技術(shù)為基礎(chǔ),可以將客戶分為胖瘦兩種類型.所謂的瘦客戶結(jié)構(gòu),主要是將內(nèi)部的一切功能都?xì)w于相應(yīng)的服務(wù)器一端,在客戶端方面,只用于顯示用戶界面,普遍情況下,這種結(jié)構(gòu)以瀏覽器為基礎(chǔ),與服務(wù)器進(jìn)行交互的過程中主要運(yùn)用的是HTTP/HTTPS[3].而胖客戶結(jié)構(gòu)主要指的是處于服務(wù)器一端負(fù)責(zé)存儲(chǔ)數(shù)據(jù)的裝置,而內(nèi)部的其他相關(guān)功能,則全部位于客戶端中.這種結(jié)構(gòu)普遍執(zhí)行于瀏覽器之外,具有相對(duì)獨(dú)立的GUI應(yīng)用程序,可以以通信協(xié)議為依托,與服務(wù)器進(jìn)行應(yīng)用層的交互.
2.表示層
表示層,也可以稱之為web層,主要的組成部分為web容器,用于對(duì)瘦客戶HTTP的信息進(jìn)行處理.在web容器中,包含的Java技術(shù)主要有Java Sever Page,以及Servlet兩種,能夠共同對(duì)客戶端所發(fā)出的的請(qǐng)求進(jìn)行處理,也能夠處理應(yīng)用層請(qǐng)求的相關(guān)表示邏輯,之后對(duì)能夠返回原本客戶端的相應(yīng)頁(yè)面內(nèi)容進(jìn)行有效創(chuàng)建.與傳統(tǒng)的CGI相比,Servlet的使用效率更高、可操作性強(qiáng)、功能更為強(qiáng)大、可移植性較強(qiáng),且能夠有效節(jié)省成本,是當(dāng)前一種性價(jià)比較高的技術(shù).
3.應(yīng)用層
應(yīng)用層,主要的組成部分為Enterprise Java Beans容器,簡(jiǎn)稱EJB,是一種封裝應(yīng)用邏輯,也是一種可以在服務(wù)器內(nèi)運(yùn)行的軟件組件[4].EJB主要負(fù)責(zé)對(duì)客戶端所發(fā)出的請(qǐng)求進(jìn)行處理,在處理的過程中,可能涉及到對(duì)數(shù)據(jù)層進(jìn)行訪問.EJB主要分為會(huì)話、實(shí)體以及消息驅(qū)動(dòng)三種類型,用于對(duì)不同的應(yīng)用系統(tǒng)角度進(jìn)行解決,與此同時(shí),還能夠使相對(duì)復(fù)雜的應(yīng)用系統(tǒng)更加的便捷化.使用EJB能夠使應(yīng)用軟件的實(shí)用性與可移植性大大增強(qiáng),簡(jiǎn)化開發(fā)的相應(yīng)步驟,進(jìn)而節(jié)約系統(tǒng)開發(fā)的時(shí)間與成本,提升系統(tǒng)開發(fā)的靈活性.
4.數(shù)據(jù)層
數(shù)據(jù)層主要包含ERP、數(shù)據(jù)庫(kù)、事物處理信息等.在J2EE中,規(guī)定了Java數(shù)據(jù)庫(kù)鏈接(JDBC)以及連接器等兩項(xiàng)相關(guān)技術(shù),用于對(duì)數(shù)據(jù)層標(biāo)準(zhǔn)的和可移植的提供相應(yīng)訪問[5].運(yùn)用CORBA以及Java連接器等形式,使運(yùn)行組件與其他資源實(shí)現(xiàn)通信,已達(dá)到分布式數(shù)據(jù)存取的目的.
數(shù)據(jù)庫(kù)技術(shù)隨著計(jì)算機(jī)應(yīng)用系統(tǒng)的快速發(fā)展得到進(jìn)一步開發(fā),而數(shù)據(jù)模型作為數(shù)據(jù)庫(kù)的主要組成部分也歷經(jīng)了網(wǎng)狀、層次、關(guān)系、關(guān)系-對(duì)象、對(duì)象等多個(gè)階段.從類型角度看,也從傳統(tǒng)的簡(jiǎn)單型發(fā)展到現(xiàn)在的多媒體、空間等數(shù)據(jù)庫(kù)類型.從能力角度看,也由起初的簡(jiǎn)單存儲(chǔ)發(fā)展到現(xiàn)在擁有強(qiáng)大功能的OLAP、OLTP、OLAM等數(shù)據(jù)庫(kù),為數(shù)據(jù)的挖掘提供了有效支持.從應(yīng)用領(lǐng)域角度看,也由起初的單機(jī)形式,發(fā)展到現(xiàn)在的web中來.運(yùn)用數(shù)據(jù)庫(kù)技術(shù)的相關(guān)產(chǎn)品也為多種網(wǎng)絡(luò)應(yīng)用系統(tǒng)的實(shí)施與開發(fā)提供了良好條件.
E-DMS是在web結(jié)構(gòu)、應(yīng)用平臺(tái)、數(shù)據(jù)庫(kù)技術(shù)等內(nèi)容的基礎(chǔ)上,以B/C/S為依托的新型數(shù)據(jù)挖掘系統(tǒng)[6].從客戶層的角度看,胖瘦兩種客戶的劃分標(biāo)準(zhǔn)主要取決于客戶對(duì)數(shù)據(jù)挖掘性能的不同要求,瘦客戶一般情況下只要求提供數(shù)據(jù)挖掘的結(jié)果,而胖客戶則要求在客戶端進(jìn)行相對(duì)頻繁的相關(guān)分析與計(jì)算,運(yùn)用E-DMS能夠有效提升客戶端的運(yùn)行效率,使網(wǎng)絡(luò)的負(fù)載大大降低.從表示層的角度看,主要用于完成客戶對(duì)數(shù)據(jù)挖掘的不同請(qǐng)求,還需要將結(jié)果反饋給客戶,運(yùn)用JSP與Servlet相結(jié)合的方式,能夠使網(wǎng)絡(luò)請(qǐng)求和動(dòng)態(tài)頁(yè)面的形成更加便捷與高效.從應(yīng)用層的角度看,這一部分是整個(gè)系統(tǒng)中最重要的部分,系統(tǒng)內(nèi)部絕大多數(shù)的重要信息與數(shù)據(jù)都集中在這一部分中,運(yùn)用EJB將系統(tǒng)內(nèi)部已有的有效數(shù)據(jù)挖掘算法集中起來,形成DMB,而不同的DMB中,蘊(yùn)藏著數(shù)據(jù)挖掘功能,這種方法更有利于調(diào)整與拓展系統(tǒng)功能.
E-DMS中,涉及到很多新型的網(wǎng)絡(luò)技術(shù),因此,想要設(shè)計(jì)好一個(gè)完善高效的E-DMS,需要注意以下幾方面問題:
1.網(wǎng)絡(luò)安全問題
在進(jìn)行網(wǎng)絡(luò)設(shè)計(jì)的過程中,網(wǎng)絡(luò)的結(jié)構(gòu)與性能只是其中需要考慮的一個(gè)方面,網(wǎng)絡(luò)的安全問題也是不容忽視的.隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,安全問題也日益突出,在對(duì)網(wǎng)絡(luò)進(jìn)行設(shè)計(jì)的過程中,需要設(shè)置防火墻、客戶認(rèn)證等相應(yīng)的網(wǎng)絡(luò)安全措施,以免網(wǎng)絡(luò)中重要的數(shù)據(jù)信息泄露.
2.模型建立與維護(hù)問題
在E-DMS中,拋開通用的數(shù)據(jù)挖掘算法不談,針對(duì)專用的數(shù)據(jù)挖掘系統(tǒng),需要構(gòu)建相應(yīng)的數(shù)據(jù)挖掘模型,以避免重復(fù)挖掘所產(chǎn)生的浪費(fèi)問題,以任務(wù)為基礎(chǔ)進(jìn)行構(gòu)建的數(shù)據(jù)庫(kù)挖掘模型能夠進(jìn)行永久性應(yīng)用,也能夠?qū)ν诰蚰J降南嚓P(guān)參數(shù)進(jìn)行相應(yīng)調(diào)整,完成重新應(yīng)用[7].這便需要對(duì)數(shù)據(jù)挖掘模型進(jìn)行快捷高效的構(gòu)建,并對(duì)數(shù)據(jù)挖掘模型進(jìn)行及時(shí)的維護(hù)與調(diào)整.
3.數(shù)據(jù)源兼容問題
在E-DMS的數(shù)據(jù)層中,會(huì)有很多不同類型、不同結(jié)構(gòu)的數(shù)據(jù)庫(kù)數(shù)據(jù),只有有效保證各種結(jié)構(gòu)類型的數(shù)據(jù)庫(kù)數(shù)據(jù)能夠良好的協(xié)同工作,才能有效保證數(shù)據(jù)庫(kù)系統(tǒng)的穩(wěn)定性與可靠性,確保其能夠安全順利運(yùn)行.然而由于這些數(shù)據(jù)庫(kù)的生產(chǎn)廠家與產(chǎn)品型號(hào)各不相同,在組成數(shù)據(jù)庫(kù)系統(tǒng)后,往往會(huì)由于各種型號(hào)數(shù)據(jù)的不兼容,導(dǎo)致各種問題的出現(xiàn).因此,在對(duì)E-DMS進(jìn)行設(shè)計(jì)的過程中,需要充分考慮到這一點(diǎn),注意數(shù)據(jù)源相互不兼容的客觀問題,從而有效確保數(shù)據(jù)庫(kù)系統(tǒng)運(yùn)行的安全與穩(wěn)定.
4.應(yīng)用集成問題
現(xiàn)階段,在數(shù)據(jù)挖掘應(yīng)用過程中所應(yīng)用到的相關(guān)方式主要有DM、OLAP、OLAM等,這些數(shù)據(jù)挖掘方式都有其各自的優(yōu)勢(shì)和缺陷,但以當(dāng)前的技術(shù)條件還無法真正將其有效結(jié)合起來,無法使各種數(shù)據(jù)挖掘方式能夠科學(xué)有效的協(xié)調(diào)工作、優(yōu)勢(shì)互補(bǔ).因此,對(duì)這些數(shù)據(jù)挖掘方式進(jìn)行有效合理的集成與應(yīng)用,是當(dāng)前對(duì)E-DMS進(jìn)行設(shè)計(jì)過程中需要解決的主要問題之一.
另外,除了以上所說的網(wǎng)絡(luò)安全、模型建立與維護(hù)、數(shù)據(jù)源兼容以及應(yīng)用集成等問題,在進(jìn)行E-DMS設(shè)計(jì)的過程中,還需要注意整個(gè)網(wǎng)絡(luò)系統(tǒng)的可維護(hù)性、網(wǎng)絡(luò)系統(tǒng)的穩(wěn)定性,以及網(wǎng)絡(luò)系統(tǒng)的可拓展性的問題,以有效避免各種網(wǎng)絡(luò)系統(tǒng)惡意軟件的攻擊,進(jìn)而推動(dòng)網(wǎng)絡(luò)數(shù)據(jù)系統(tǒng)的長(zhǎng)足發(fā)展.
網(wǎng)絡(luò)型數(shù)據(jù)挖掘系統(tǒng),即E-DMS,是網(wǎng)絡(luò)與數(shù)據(jù)挖掘技術(shù)進(jìn)步發(fā)展之下的產(chǎn)物,符合人們對(duì)數(shù)據(jù)挖掘技術(shù)的發(fā)展需求.E-DMS能夠?qū)崿F(xiàn)將傳統(tǒng)意義上的數(shù)據(jù)挖掘系統(tǒng)向網(wǎng)絡(luò)形態(tài)下的轉(zhuǎn)移,在很大程度上方便了終端客戶對(duì)數(shù)據(jù)挖掘方面的客觀需求,實(shí)現(xiàn)了在計(jì)算機(jī)網(wǎng)絡(luò)環(huán)境下的移動(dòng)辦公,隨時(shí)隨地都能夠?qū)ο到y(tǒng)進(jìn)行操作與管理.隨著科技的不斷進(jìn)步,相信解決了E-DMS當(dāng)前存在的相關(guān)問題,在未來,E-DMS能夠?yàn)槿藗兲峁└臃奖愀咝У臄?shù)據(jù)挖掘服務(wù).
〔1〕江文斌,張仁津,張方霞.基于W eb Services的電子商務(wù)系統(tǒng)的研究與架構(gòu) [J].電腦知識(shí)與技術(shù),2011,05(25):206-207.
〔2〕邵紅全,趙茜,歐陽(yáng)仙桃.用SQL Server2000實(shí)現(xiàn)數(shù)據(jù)挖掘的技術(shù)與策略 [J].電腦開發(fā)與應(yīng)用,2013,12(20):206-207.
〔3〕徐薇,黃厚寬,李昆侖.數(shù)據(jù)挖掘和數(shù)據(jù)倉(cāng)庫(kù)的關(guān)系研究[J].廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,02(15):129-130.
〔4〕于海防,解福.基于Agent的數(shù)據(jù)挖掘在CRM中的應(yīng)用[J].山東師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2013,04(19):105-106.
〔5〕陳志高,成奮華,許彪.Hadoop異構(gòu)網(wǎng)絡(luò)下基于自適應(yīng)螞蟻算法的策略路由研究[J].文山學(xué)院學(xué)報(bào),2013,08(15):218-219.