薛美芳
[摘 要]隨著網(wǎng)絡(luò)技術(shù)與應(yīng)用的不斷發(fā)展,計算機網(wǎng)絡(luò)在圖書館建設(shè)中已經(jīng)變得越來越普遍。網(wǎng)絡(luò)圖書館建設(shè)嚴(yán)重依賴于計算機網(wǎng)絡(luò),因此網(wǎng)絡(luò)運行的穩(wěn)定性、可靠性就顯得至關(guān)重要,于是網(wǎng)絡(luò)管理就應(yīng)運而生。本文是通過數(shù)據(jù)挖掘網(wǎng)絡(luò)診斷法應(yīng)用在高校網(wǎng)絡(luò)圖書館建設(shè)中。它對大規(guī)模網(wǎng)絡(luò)圖書館的故障診斷具有理論指導(dǎo)意義和實際應(yīng)用價值。
[關(guān)鍵詞]網(wǎng)絡(luò)圖書館;數(shù)據(jù)挖掘;故障診斷
一、引言
在信息社會里,網(wǎng)絡(luò)圖書館具有巨大的發(fā)展?jié)摿蛢?yōu)勢。但在我國高校目前的客觀條件中,建設(shè)網(wǎng)絡(luò)圖書館還存在諸多問題,網(wǎng)絡(luò)的可靠性是推行網(wǎng)絡(luò)圖書館的發(fā)展與建設(shè)過程中的一個難點。圖書館網(wǎng)絡(luò)的通訊線路和站點都會由于某種原因出現(xiàn)故障,甚至有可能造成整個圖書館網(wǎng)絡(luò)不能正常工作。因此對網(wǎng)絡(luò)圖書館的可靠性研究已成為當(dāng)今急需解決的課題之一。近幾年來,網(wǎng)絡(luò)的可靠性研究已經(jīng)有很多成果。本文是通過數(shù)據(jù)挖掘網(wǎng)絡(luò)診斷法應(yīng)用在高校網(wǎng)絡(luò)圖書館建設(shè)中。它對大規(guī)模網(wǎng)絡(luò)圖書館的故障診斷具有理論指導(dǎo)意義和實際應(yīng)用價值。
二、數(shù)據(jù)挖掘網(wǎng)絡(luò)診斷法
應(yīng)用數(shù)據(jù)挖掘方法,網(wǎng)絡(luò)故障診斷系統(tǒng)可以通過分析已有的異常信息的正確處理方法以及各種異常之間的前后關(guān)系的記錄,得到其間的關(guān)聯(lián)規(guī)則,這些有價值的信息可用于網(wǎng)絡(luò)故障的定位檢測和嚴(yán)重故障的預(yù)測等任務(wù)。并能根據(jù)當(dāng)前的診斷信息,就可以得到其后續(xù)發(fā)生各種情況的可能性,對危險事件可以起到預(yù)防的作用,從而使通信網(wǎng)絡(luò)得以安全運轉(zhuǎn)。
數(shù)據(jù)挖掘的任務(wù)是從大量的數(shù)據(jù)中的找到模式或知識。根據(jù)它們的作用方式可分為兩類:一類稱為描述性模式,它是使存在于數(shù)據(jù)描述的規(guī)律。如泛化模式,聚類分析模型,及時問的關(guān)聯(lián)模式序列模式。另一種是預(yù)測模型,它是基于知識從現(xiàn)有的數(shù)據(jù)挖掘某些數(shù)據(jù)得到預(yù)測未知的性質(zhì)。包括分類模型和回歸模型。其中,分類模型是一個重要的預(yù)測模型。
抽象分析,挖掘分類模型步驟如下:首先,我們必須把挖掘數(shù)據(jù)庫進(jìn)行預(yù)處理:把數(shù)據(jù)庫中的記錄進(jìn)行排序,包括取消一些不完整的記錄和獨立的性質(zhì),主要是為了確定一個類別的屬性,并確保每一個記錄類別屬性已經(jīng)給出。然后,從待挖數(shù)據(jù)中提取形成訓(xùn)練樣本集。把訓(xùn)練樣本集運用一種或多種分類挖掘方式進(jìn)行挖掘,最后輸出某種方式的分類模式。分類模式的方式有決策樹,數(shù)學(xué)公式,分類規(guī)則等。
所謂數(shù)據(jù)挖掘是從大量的不完整的,嘈雜的,模糊的和隨機提取隱含在其中的實際應(yīng)用數(shù)據(jù),人們先前不知道,但又是潛在的有用的信息和知識。這個定義包括幾層意思:數(shù)據(jù)源必須是真實的,有很多嘈雜的,發(fā)現(xiàn)是用戶感興趣的知識,知識發(fā)現(xiàn)是可以接受的,可以理解,可以應(yīng)用,不要求發(fā)現(xiàn)放之四海皆準(zhǔn)的知識,僅支持特定的發(fā)現(xiàn)問題。數(shù)據(jù)挖掘可以看作是KDD的一個小步驟,如圖所示。
三、數(shù)據(jù)挖掘網(wǎng)絡(luò)診斷法在高校網(wǎng)絡(luò)圖書館智能服務(wù)中的應(yīng)用
目前,在網(wǎng)絡(luò)中的高校圖書館智能服務(wù)網(wǎng)絡(luò)診斷數(shù)據(jù)挖掘應(yīng)用還比較少,和智能網(wǎng)絡(luò)服務(wù)的許多方面,該庫已經(jīng)應(yīng)用:如分類,編目,索引,流通管理,信息檢索等。在建設(shè)一個圖書館以及圖書館和信息管理過程的可靠性分析,智能書籍改進(jìn)信息技術(shù),從而完成傳統(tǒng)圖書館向數(shù)字圖書館發(fā)展的數(shù)據(jù)挖掘過程中使用的網(wǎng)絡(luò)診斷方法是智能圖書館的飛躍,是一個重要的研究圖書館的發(fā)展和建設(shè)。
1、數(shù)據(jù)挖掘網(wǎng)絡(luò)診斷法在網(wǎng)絡(luò)圖書館文獻(xiàn)分類中的應(yīng)用
文檔分類是根據(jù)相似性和文學(xué)之間的差異的內(nèi)容和形式定義的,按照一定的體系,有系統(tǒng)地組織和分化的文獻(xiàn)。工作人員在圖書館分類是基于文獻(xiàn)揭示和整理文件,所反映的主題內(nèi)容和功能的外在形式。文學(xué)的主要目的是基于對組織文化的不同類別的學(xué)科知識的系統(tǒng)分類,使文學(xué)的同一學(xué)科性質(zhì)在一起,形成學(xué)科體系,使用文獻(xiàn)檢索,以滿足讀者的需求。
網(wǎng)絡(luò)圖書館收集了大量的書籍和文件,也有幾十萬,上百萬,甚至千萬。每個在這些文獻(xiàn)中引用的文件分類給予DOI。每個CLC對準(zhǔn)對應(yīng)于一個固定的位置。如此大量的文檔可以按照分類系統(tǒng)排列有序。然而,這樣一個龐大的網(wǎng)絡(luò)圖書館系統(tǒng),有效和快速的分類管理,極大地測試計算機系統(tǒng)網(wǎng)絡(luò)的可靠性。當(dāng)嚴(yán)重的網(wǎng)絡(luò)故障發(fā)生在網(wǎng)絡(luò)圖書館系統(tǒng),以及它如何能夠有效排除故障?當(dāng)在網(wǎng)絡(luò)圖書館文獻(xiàn)分類數(shù)據(jù)挖掘的網(wǎng)絡(luò)故障診斷,可以發(fā)揮自己的優(yōu)勢,迅速而準(zhǔn)確地排除網(wǎng)絡(luò)故障,網(wǎng)絡(luò)圖書館文獻(xiàn)分類數(shù)據(jù)挖掘的網(wǎng)絡(luò)診斷具有非常廣闊的應(yīng)用前景。
2、數(shù)據(jù)挖掘網(wǎng)絡(luò)診斷法在網(wǎng)絡(luò)圖書館的檢索工作環(huán)節(jié)的應(yīng)用
現(xiàn)有的網(wǎng)絡(luò)庫的檢索方面是利用人工智能技術(shù)來模擬人腦的收集,存儲,檢索和匹配,推理(感性)和管理。和信息的收集,存儲,檢索和匹配,推理(感性)和管理的檢索過程中其他方面的工作,難免會遇到諸如故障情況。數(shù)據(jù)挖掘的網(wǎng)絡(luò)診斷,以排除網(wǎng)絡(luò)庫中檢索故障的各個方面都有非??焖俸蜏?zhǔn)確的優(yōu)點,將解決這個問題不能得到解決在圖書館遇到的檢索網(wǎng)絡(luò)鏈路上,導(dǎo)致網(wǎng)絡(luò)庫檢索革命?!?/p>
檢索網(wǎng)絡(luò)圖書館是一個綜合的人機系統(tǒng)由一個由幾個子網(wǎng)絡(luò),由全球性組織實現(xiàn)圖書數(shù)據(jù)檢索和共享,提供分析,規(guī)劃,預(yù)測和信息綜合控制系統(tǒng)的一部分。經(jīng)常會發(fā)生在這樣一個大的檢索系統(tǒng)的故障的問題,因此操作系統(tǒng)到網(wǎng)絡(luò)所需的系統(tǒng)維護在固定的時間間隔,例如沒有解決的問題。并解決了數(shù)據(jù)挖掘的核心是研究網(wǎng)絡(luò)診斷方法的一個網(wǎng)絡(luò)問題。如果在先進(jìn)的數(shù)據(jù)挖掘庫網(wǎng)絡(luò)診斷網(wǎng)絡(luò)可靠性分析技術(shù)使用時,將被綁定到一個網(wǎng)絡(luò)庫的變化。
3、數(shù)據(jù)挖掘網(wǎng)絡(luò)診斷法在圖書館自動化網(wǎng)絡(luò)中的應(yīng)用
計算機網(wǎng)絡(luò)連接,并控制了大量的庫現(xiàn)代化圖書館的網(wǎng)絡(luò),也稱為庫計算機網(wǎng)絡(luò)的形成。由于書目數(shù)據(jù)庫的出發(fā)點和它的北美建筑的基礎(chǔ)上,也被稱為書目機構(gòu)。
圖書館自動化網(wǎng)絡(luò)具有多種功能:
①連續(xù)出版物管理,建立連續(xù)劇會員庫,開展自動化業(yè)務(wù)的聯(lián)合目錄。
②權(quán)限控制,通過網(wǎng)絡(luò)集線器規(guī)范文檔書目數(shù)據(jù)庫,編目成員館,以控制名稱規(guī)格(人名,地名,書籍名稱,組織機構(gòu)名等)和主題規(guī)范,以達(dá)到規(guī)范化和標(biāo)準(zhǔn)化。
③在網(wǎng)絡(luò)共享計算機硬件和軟件資源。一般情況下,各個業(yè)務(wù)庫可以使用所有圖書館自動化網(wǎng)絡(luò)的全部或部分,但更側(cè)重于聯(lián)合編目,館際互借和權(quán)限控制等。每個特定的網(wǎng)絡(luò)具有不同的功能。
④聯(lián)合目錄查詢,使用終端來檢查網(wǎng)絡(luò)是否藏在一個特定的文件,隱藏在庫中。
⑤電子郵件,利用計算機網(wǎng)絡(luò)進(jìn)行通信大廳的電子郵箱服務(wù)的成員。
⑥聯(lián)合編目成員館使用的網(wǎng)絡(luò)為中心的大型書目數(shù)據(jù)庫,并取得產(chǎn)品目錄在線目錄,同時生成的工會大廳的中心的所有成員的目錄(請參閱合作編目)。
⑦館際互借,與聯(lián)合目錄,網(wǎng)絡(luò)通過終端大廳的每個成員可以在網(wǎng)上館際互借。
⑧采購協(xié)調(diào),聯(lián)合目錄,以了解情況和西藏博物館收藏功能協(xié)調(diào)采購政策及其成員圖書館和決定是否特定于采購文件。
圖書館自動化網(wǎng)絡(luò)如此強大的功能,在其運行的過程中勢必出現(xiàn)無法解決的可靠性分析問題,數(shù)據(jù)挖掘網(wǎng)絡(luò)診斷法應(yīng)用于自動化網(wǎng)絡(luò)故障診斷技術(shù)中,勢必又會促使圖書館自動化網(wǎng)絡(luò)技術(shù)產(chǎn)生進(jìn)一步提升。
四、結(jié)語
總體而言,與傳統(tǒng)圖書館相比,圖書館的網(wǎng)絡(luò)化具有巨大的發(fā)展?jié)摿蛢?yōu)勢。在大型網(wǎng)絡(luò)庫的可靠性分析各個環(huán)節(jié)的中,數(shù)據(jù)挖掘的網(wǎng)絡(luò)診斷方法應(yīng)用到解決這些問題的理論意義的可靠性和實用價值。但是,數(shù)據(jù)挖掘的網(wǎng)絡(luò)診斷和組合應(yīng)用到網(wǎng)絡(luò)圖書館的建設(shè)的各個方面還需要長期艱苦的努力。因此,在聯(lián)合過程中應(yīng)由易到難,一步一步,最終建設(shè)勢必成為高校發(fā)展過程中一顆燦爛的明珠。
參考文獻(xiàn):
[1]李康.數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)故障診斷中的應(yīng)用研究[J].計算機軟件與理論2004.12
[2]郭淑蘭.交叉撕裂網(wǎng)絡(luò)診斷法在高校網(wǎng)絡(luò)圖書館建設(shè)中的應(yīng)用[J].大江周刊2013.1
[3]李峰,趙海興,徐宗本.構(gòu)建一類新網(wǎng)絡(luò)簇的可靠性控制集[J].計算機學(xué)報,2013.6
[4]郭軍.人工智能技術(shù)在圖書館中的應(yīng)用[J].現(xiàn)代情報.2002.8
[5]楊曉玉.淺談圖書館文獻(xiàn)分類工作[J].投資與合作.2011.12
[6]郭淑蘭.論高校網(wǎng)絡(luò)圖書館的建設(shè)[J].都市家教2010.11