摘要 21世紀(jì)是一個(gè)信息時(shí)代,隨著大量信息涌入人們的生活,數(shù)據(jù)庫技術(shù)應(yīng)運(yùn)而生。但是如何在信息的浩瀚海洋中找到有效的信息呢?這就需要運(yùn)用到數(shù)據(jù)挖掘技術(shù)。數(shù)據(jù)挖掘技術(shù)涉及到了很多領(lǐng)域,毫無疑問,網(wǎng)絡(luò)的數(shù)據(jù)庫安全對于數(shù)據(jù)挖掘技術(shù)的重要性可見一斑。有了網(wǎng)絡(luò)數(shù)據(jù)庫的安全把關(guān),數(shù)據(jù)挖掘所需找出的數(shù)據(jù)才能保證其價(jià)值。
關(guān)鍵詞 數(shù)據(jù)庫 網(wǎng)絡(luò)數(shù)據(jù)庫 數(shù)據(jù)挖掘技術(shù) 知識發(fā)現(xiàn)
一、引言
信息時(shí)代的來臨給社會(huì)生活帶來了不少的新渠道去獲取信息,但在同時(shí)也給人們帶來了很多新奇與問題。當(dāng)儲存的信息量、信息渠道積累到一個(gè)臨界值的時(shí)候,我們就需要研發(fā)一個(gè)儲備它們的虛擬空間。那么,在這些虛擬空間中,當(dāng)我們需要尋找某些特定信息的時(shí)候,會(huì)不會(huì)如同大海撈針一般不知所措呢?在電子信息領(lǐng)域中的廣大技術(shù)研發(fā)人員,已經(jīng)為我們解決了這其中很大一部分問題,讓我們可以準(zhǔn)確地從信息的海洋中,通過一定的途徑,尋找出我們需要的信息,這就是數(shù)據(jù)挖掘技術(shù)。數(shù)據(jù)挖掘技術(shù)雖然可以將上述情況化解,但是也帶來了需要進(jìn)一步研究的問題。比如,各種數(shù)據(jù)信息有沒有受到切實(shí)的保護(hù)?我們又要怎么保證它們的安全性呢?并且,如果當(dāng)這些信息遭到破壞,會(huì)對現(xiàn)實(shí)生活中用到這些信息的領(lǐng)域帶來什么樣的破壞?我們又要如何避免呢?
二、WEB數(shù)據(jù)庫
(一)WEB數(shù)據(jù)庫的重要性
WEB數(shù)據(jù)庫存儲著大量各式各樣的信息,如果這些信息的安全受到危害,結(jié)果可想而知?,F(xiàn)代的很多企業(yè)、銀行、醫(yī)院等等地方所有的信息都依賴著數(shù)據(jù)庫的存儲,如果它的安全受到危害,幾乎社會(huì)上的每個(gè)人都會(huì)受到影響。也許是自己的就業(yè)年限不準(zhǔn)確,也許是自己曾經(jīng)的就醫(yī)經(jīng)歷找不到。WEB數(shù)據(jù)庫應(yīng)用到的領(lǐng)域范圍很廣,并且對這些領(lǐng)域而言有著至關(guān)重要的意義。因此,注重其安全性問題理所應(yīng)當(dāng)被人們重視起來。這對于我們來說都很重要,是無法置身事外的。
(二)常見的可能損害數(shù)據(jù)的現(xiàn)象及其弊端
1、常見問題
那么,對于WEB數(shù)據(jù)庫而言,有多少可能影響到它的安全的問題呢?常見的對于WEB數(shù)據(jù)庫造成安全威脅的因素大體可以分為兩種,一是自然因素造成的,二是人為造成的。自然因素引發(fā)安全問題的概率比較低一些,大體就是網(wǎng)絡(luò)故障與抗擊單站點(diǎn)故障等。還有一種問題是因?yàn)槿俗陨硪蛩匾鸬?,這些通過我們的努力就可以避免。第一,來自黑客的攻擊。這一項(xiàng)是具有計(jì)算機(jī)技術(shù)水平的人故意為之,防不勝防。黑客們?yōu)榱诉_(dá)到自己的利益,采取一些手段進(jìn)行盜取、修改、移動(dòng)數(shù)據(jù)庫中的信息。對于這一點(diǎn),我們所能做的只有加強(qiáng)安全系統(tǒng)體系,盡快研究出對付黑客找出的漏洞的方法,進(jìn)一步完善WEB數(shù)據(jù)庫體系,使之成長為瑕疵越來越少的系統(tǒng)。第二,是來自計(jì)算機(jī)病毒的侵襲。使用計(jì)算機(jī)的人一天天增多,所傳播的病毒也愈加復(fù)雜、多變。傳播的范圍也一直在擴(kuò)大。而且,計(jì)算機(jī)病毒也具有抗性,也會(huì)隨著計(jì)算機(jī)的“免疫系統(tǒng)”逐步發(fā)展,對我們的要求也逐漸苛刻。第三,來自網(wǎng)絡(luò)安全環(huán)境方面的危害。這主要就是網(wǎng)絡(luò)自身的原因,譬如操作系統(tǒng)或者數(shù)據(jù)庫管理系統(tǒng)安全上的不安全性,同時(shí)也包括有網(wǎng)絡(luò)協(xié)議帶來的問題。第四,來自數(shù)據(jù)庫應(yīng)用系統(tǒng)的問題。這是因?yàn)槟承┯脩魶]有被授權(quán)輸入或者查看一些數(shù)據(jù),但是通過某些途徑,這些客戶看到了數(shù)據(jù),或者是一些客戶看到了被授權(quán)范圍以外的數(shù)據(jù),并且很多都沒有瀏覽痕跡,這些不經(jīng)意的泄露都會(huì)給網(wǎng)絡(luò)數(shù)據(jù)庫安全帶來很大的隱患。我們需要完善的WEB數(shù)據(jù)庫系統(tǒng)各方面問題還有很多,以上只是主要的一些問題。我們所要做的就是不斷的完善數(shù)據(jù)庫系統(tǒng),每一種事物都要經(jīng)過反復(fù)的發(fā)展,遇到問題后解決問題,然后再發(fā)展來完善自己。
2、危害
我們經(jīng)常會(huì)在網(wǎng)絡(luò)上、報(bào)紙上看到一些人利用別人的身份證號或者手機(jī)號碼進(jìn)行一些交易,這就是信息被泄露的后果之一。WEB數(shù)據(jù)庫所包含的信息如此之多,如果它的安全遭到破壞,后果真的不堪想象。從小的方面來看,每一個(gè)隱私都可能透明化,大到國家的安全問題。因此,我們一定要注重WEB數(shù)據(jù)庫的安全問題,盡力避免其安全受到威脅后所造成的危害,這樣在這個(gè)到處都充滿信息的社會(huì)中才有個(gè)人的安全感可言。
三、數(shù)據(jù)挖掘系統(tǒng)
數(shù)據(jù)挖掘作為一門新興的學(xué)科,它的發(fā)展與完善需要較長的過程,但是它在其的形成與發(fā)展過程中卻表現(xiàn)出強(qiáng)大的生命力,廣大從事數(shù)據(jù)庫應(yīng)用與決策支持,以及模式識別、機(jī)器學(xué)習(xí)、專家系統(tǒng)、自動(dòng)化等學(xué)科的科研工作者和工程技術(shù)人員迫切需要了解掌握它。數(shù)據(jù)挖掘作為一個(gè)多個(gè)領(lǐng)域相互交融的探索與應(yīng)用技術(shù),所涉及的范圍目前有:數(shù)據(jù)庫技術(shù)、人工智能、機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、統(tǒng)計(jì)學(xué)、模式識別、知識系統(tǒng)、知識獲取、信息檢索、高性能計(jì)算以及可視化計(jì)算等領(lǐng)域。
(一)應(yīng)用范圍及意義
該技術(shù)自誕生以來,已經(jīng)取得了不小的成就,在很多領(lǐng)域中都可以運(yùn)用。在很多領(lǐng)域中,數(shù)據(jù)挖掘系統(tǒng)都發(fā)揮了很大的作用,特別是在金融、物流、保險(xiǎn)、通信、商業(yè)等等方面更是發(fā)揮了不可小覷的優(yōu)勢。更值得一提的是,數(shù)據(jù)挖掘技術(shù)可以針對很多商業(yè)的典型問題采取獨(dú)到的方法,比如數(shù)據(jù)庫營銷(Database Marketing)、客戶群體劃分(Customer Segmentation Classification)、背景分析(Profile Analysis)、交叉銷售(Cross--selling)等市場分析行為,以及客戶流失性分析(Churn Analysis)、客戶信用評分(Credit Scoring)、欺詐發(fā)現(xiàn)(Fraud Detection)等等。我們的信息會(huì)在不知不覺中大量的流失出去,比如你在商場買東西刷銀行卡時(shí),你的姓名,銀行卡號碼,消費(fèi)地點(diǎn)時(shí)間都會(huì)被計(jì)算機(jī)系統(tǒng)載入,商場會(huì)根據(jù)這些建立一個(gè)客戶詳細(xì)信息的數(shù)據(jù)庫,可以通過網(wǎng)絡(luò)或者通信手段將商場的一些活動(dòng)或者折扣信息傳輸?shù)矫總€(gè)客戶,那么,如果想要找特定的某一個(gè)客戶時(shí),就能夠利用這種和技術(shù)來實(shí)現(xiàn)。還有一種應(yīng)用,商場可以通過某位客戶購買物品時(shí)留下的信息來制定相應(yīng)的存儲信息,存儲他喜好的品味、擁有的特權(quán)等等,等他下次光臨的時(shí)候,只要刷卡就會(huì)出現(xiàn)這些特征,銷售人員可以以此為依據(jù)向他介紹其他的產(chǎn)品 。美國的讀者文摘雜志社就是制定了類似的方案,進(jìn)而成長為一家具有相當(dāng)規(guī)模的出版社。如此看來,如果網(wǎng)絡(luò)數(shù)據(jù)庫安全出了問題,一些客戶的信息被調(diào)換或者丟失,對于商場與出版社來說,是非常麻煩的一件事情。
(二)發(fā)展前景
曾經(jīng)有人對未來科技有十大預(yù)言,其中之一便是數(shù)據(jù)挖掘技術(shù)。在今后的社會(huì)中,信息只會(huì)比現(xiàn)在發(fā)達(dá),如果沒有強(qiáng)大的數(shù)據(jù)挖掘系統(tǒng),可以想象自己就如同掉在了廣闊的信息海洋中,完全摸不到頭腦。當(dāng)初研發(fā)人員就是因?yàn)榭吹綌?shù)據(jù)挖掘技術(shù)廣闊的前景才對其進(jìn)行開發(fā)研究。就目前來說,該技術(shù)依舊有著輝煌的前途。比如在網(wǎng)站上的應(yīng)用前景?,F(xiàn)在計(jì)算機(jī)在生活中的地位越發(fā)堅(jiān)實(shí),懂的計(jì)算機(jī)技術(shù)的人才也越來越多。因此,想要開發(fā)創(chuàng)建某一個(gè)網(wǎng)頁是很容易實(shí)現(xiàn)的。但是創(chuàng)建之后如何保持這個(gè)網(wǎng)站收益?如何保證網(wǎng)站的運(yùn)營呢?想必很多人會(huì)在這里摔跟頭。再具體一點(diǎn),譬如一個(gè)網(wǎng)上購物的網(wǎng)站,現(xiàn)在這樣的網(wǎng)站比天上的星星還要多,如果某一個(gè)網(wǎng)站不吸引客戶,那么也就是用鼠標(biāo)輕輕點(diǎn)幾下就可以去到另外一個(gè)網(wǎng)站。不像實(shí)體店中那樣,銷售人員與顧客可以有面對面的交流,可以用語言來說服顧客買自家商品。此時(shí),數(shù)據(jù)挖掘就可以幫上忙了。怎么樣準(zhǔn)確的提供除客戶的想要的信息,讓他一看就喜歡,這是很重要的一點(diǎn),譬如國內(nèi)某一個(gè)網(wǎng)站上,當(dāng)顧客點(diǎn)開某一個(gè)商品時(shí),網(wǎng)絡(luò)系統(tǒng)會(huì)自動(dòng)篩選出與該個(gè)商品特征類似的其他商品,因?yàn)槟骋粋€(gè)人的喜好是一定的,既然他先點(diǎn)擊了一個(gè)商品,就說明對這類商品感興趣,那么盡快的給他呈現(xiàn)出這一類商品,顧客就很有可能被其中一個(gè)甚至幾個(gè)所吸引,進(jìn)而完成交易,理所當(dāng)然的帶來收益。這只是眾多例子中的一個(gè)。數(shù)據(jù)挖掘系統(tǒng)還可以協(xié)助很多領(lǐng)域的數(shù)據(jù)尋找工作,這些都已經(jīng)得到了社會(huì)的認(rèn)同。那么,如果一個(gè)數(shù)據(jù)挖掘系統(tǒng)不夠安全完整,它造成的危害會(huì)有多大呢?假如某個(gè)數(shù)據(jù)挖掘系統(tǒng)受到損壞,可能是客戶需要某一方面的數(shù)據(jù),但是通過數(shù)據(jù)挖掘系統(tǒng)處理后,呈現(xiàn)出來的卻是另一些數(shù)據(jù),也可能就是數(shù)據(jù)庫本身出現(xiàn)了問題,正確的數(shù)據(jù)因?yàn)楸桓`取、替換或者移動(dòng)后,沒有辦法呈現(xiàn)出來,這樣對客戶還有網(wǎng)站本身都會(huì)造成危害,長此以往,出現(xiàn)問題的網(wǎng)站肯定會(huì)沒有人再來訪問瀏覽。
四、為什么說WEB數(shù)據(jù)庫安全對數(shù)據(jù)挖掘技術(shù)的影響深遠(yuǎn)?
之所以說WEB數(shù)據(jù)庫安全對數(shù)據(jù)挖掘技術(shù)影響深遠(yuǎn),是因?yàn)榍罢邔τ诤笳邅碚f意義重大。簡而言之,數(shù)據(jù)挖掘要有資料、有數(shù)據(jù)才能進(jìn)行,那么這個(gè)網(wǎng)絡(luò)數(shù)據(jù)庫就是該項(xiàng)技術(shù)能夠進(jìn)行的地點(diǎn)之一。只不過這個(gè)地點(diǎn)是虛擬的。就好像一輛運(yùn)糧食的馬車,得有糧食才能運(yùn)吧?那么,這兩者的關(guān)系就如同是堆滿糧食的倉庫與運(yùn)送糧食的馬車之間的關(guān)系。此時(shí),對于兩者之間的利害關(guān)系就可以一目了然了。如同上面的例子,如果這個(gè)倉庫中的糧食質(zhì)量不好,種類不對,數(shù)量不對甚至就根本不是糧食,那么這匹馬也就沒有了用武之地吧。有人曾經(jīng)說過,數(shù)據(jù)挖掘技術(shù)成功需要有兩個(gè)要素,其一,是一個(gè)夠大、夠完整的數(shù)據(jù)庫系統(tǒng),其二,是擁有一個(gè)可挖掘的,定義與理解都很明確的流程。雖然說兩者并不是唇亡齒寒的利害關(guān)系,但是還是很密切的。
五、結(jié)論
WEB數(shù)據(jù)庫是數(shù)據(jù)庫的一種,作為時(shí)代的產(chǎn)物,它恪守職責(zé),提供了大量方便人們的信息。也許有一天數(shù)據(jù)庫系統(tǒng)也會(huì)退出歷史舞臺(比如說現(xiàn)在已經(jīng)有了數(shù)據(jù)倉庫,它相對于數(shù)據(jù)庫而言就有了一些進(jìn)步的地方,對于管理里這一部分有了更為完善的設(shè)定),但是新一代的儲存信息的技術(shù)可以說是以數(shù)據(jù)庫系統(tǒng)為母體的,不管這些技術(shù)是什么,他依舊會(huì)作為數(shù)據(jù)挖掘的儲存存在,而就像上文所說,數(shù)據(jù)挖掘技術(shù)被看做是未來十大技術(shù)之一,它的重要程度就不言而喻了。我們只有保證了數(shù)據(jù)庫的安全,才能為數(shù)據(jù)挖掘技術(shù)提供強(qiáng)有力的發(fā)展保障,才能研發(fā)出更好的、更完善的系統(tǒng),為人類服務(wù),加快信息的傳遞,使世界在某個(gè)角度來說越來越小。
(作者單位:貴州師范大學(xué)職業(yè)技術(shù)學(xué)院)
參考文獻(xiàn):
[1]高晗. Web數(shù)據(jù)庫技術(shù)[M]. 水利水電出版社,2007.
[2]朱明. 數(shù)據(jù)挖掘[M]. 合肥:中國科學(xué)技術(shù)大學(xué)出版社, 2002.
[3]陳文偉.黃金才.趙新昱 數(shù)據(jù)挖掘技術(shù)[M].北京工業(yè)大學(xué)出版社, 2002.
[4]陳越.數(shù)據(jù)庫安全[M].國防工業(yè)出版社, 2011.