歐衛(wèi)紅
(廣州科技職業(yè)技術(shù)大學(xué),廣東 廣州 510555)
為應(yīng)對信息資源網(wǎng)絡(luò)化和數(shù)字化的需求,人們需要借助網(wǎng)絡(luò)信息計量學(xué)的相關(guān)工具來計量網(wǎng)絡(luò)上的電子信息資源,解決相應(yīng)的計量問題,這對相關(guān)行業(yè)的發(fā)展具有重要的指導(dǎo)價值。因此,當(dāng)前必須明確網(wǎng)絡(luò)信息計量學(xué)的應(yīng)用領(lǐng)域以及軟件開發(fā)方向,朝著既定的方向?qū)W(xué)科進(jìn)行不斷完善優(yōu)化,令其更好地服務(wù)于信息化時代。
從研究現(xiàn)狀及發(fā)展趨勢角度來看待網(wǎng)絡(luò)信息計量學(xué),可以將其看作是一門以統(tǒng)計學(xué)和數(shù)學(xué)為定量研究方法,以組織、傳遞、開發(fā)利用網(wǎng)絡(luò)信息為目的,通過定量描述和統(tǒng)計分析揭示信息內(nèi)在規(guī)律的一門學(xué)科。該學(xué)科的核心構(gòu)成包括網(wǎng)絡(luò)技術(shù)、網(wǎng)絡(luò)管理、信息計量學(xué)以及信息資源管理,學(xué)科交叉性相對較強(qiáng),是網(wǎng)絡(luò)信息的重要研究領(lǐng)域?;诖耍韵聦ζ渲饕芯繉ο筮M(jìn)行系統(tǒng)性介紹。
多媒體數(shù)字信息主要包括文字信息、圖像信息以及音頻信息等,對這部分信息的研究統(tǒng)稱網(wǎng)絡(luò)信息的直接計量問題,隨著網(wǎng)絡(luò)信息的爆炸式增長,如何對數(shù)以億萬計的信息進(jìn)行統(tǒng)計是一項新的挑戰(zhàn)。通過對網(wǎng)絡(luò)信息的統(tǒng)計指標(biāo)、統(tǒng)計類型以及相關(guān)問題展開討論,相關(guān)學(xué)者認(rèn)為信息的計量方向應(yīng)包括站點數(shù)量、靜止的網(wǎng)頁數(shù)、網(wǎng)頁平均規(guī)模、網(wǎng)頁平均壽命甚至語言分布等[1]。
網(wǎng)絡(luò)上分布著大量的電子期刊、讀書報告、學(xué)術(shù)論文等不同表現(xiàn)形式的文獻(xiàn),而文獻(xiàn)信息及相關(guān)特征信息的計量問題主要研究文獻(xiàn)的分布結(jié)構(gòu)、學(xué)科方向、關(guān)鍵詞以及相關(guān)著作信息等,涉及一次文獻(xiàn)、二次文獻(xiàn)甚至是三次文獻(xiàn)的計量。
就網(wǎng)絡(luò)結(jié)構(gòu)單元的信息計量問題這一研究對象來看,其結(jié)構(gòu)單元囊括討論組、聊天室、站點以及電子郵件等,上述結(jié)構(gòu)單元中存在不同程度的信息增長、信息傳遞以及信息老化問題,這正是網(wǎng)絡(luò)信息計量學(xué)的重點研究方向。除此以外,學(xué)科的研究對象還包括上述各單元的相互引證和聯(lián)系[2]。
隨著網(wǎng)絡(luò)信息計量學(xué)的不斷發(fā)展完善,該學(xué)科理論及配套工具的應(yīng)用為各學(xué)科發(fā)展趨勢的探討提供了切入點,有助于專家學(xué)者從專業(yè)角度建立新的科學(xué)發(fā)展指標(biāo),為決策制定提供參考依據(jù)。通過對網(wǎng)絡(luò)上電子期刊、文獻(xiàn)信息、聊天室、討論組等進(jìn)行計量分析,可以大致推斷出網(wǎng)絡(luò)上科學(xué)信息的分布情況。與此同時,借助專業(yè)軟件,可以將特定對象的電子郵件使用情況作為媒介分析網(wǎng)上的科學(xué)信息交流情況。
對網(wǎng)絡(luò)信息資源開發(fā)利用情況的研究是網(wǎng)絡(luò)信息計量學(xué)極具實用性的一個應(yīng)用方向。其主要通過特定指標(biāo)對網(wǎng)絡(luò)信息資源進(jìn)行評價,進(jìn)而指導(dǎo)資源的開發(fā)利用。具體來說,人們可以通過互聯(lián)網(wǎng)檢索到海量的信息資源,但網(wǎng)絡(luò)信息畢竟良莠不齊,其中不乏虛假的數(shù)據(jù)材料,由于用戶辨別信息的能力有限,這部分未經(jīng)權(quán)威認(rèn)證的材料很容易對用戶做出誤導(dǎo),導(dǎo)致網(wǎng)絡(luò)信息資源開發(fā)進(jìn)入僵局。
挖掘并對網(wǎng)絡(luò)信息資源進(jìn)行分類,并在此基礎(chǔ)上開發(fā)網(wǎng)絡(luò)搜索引擎同樣需要應(yīng)用到網(wǎng)絡(luò)信息計量學(xué)相關(guān)知識。由此可見,網(wǎng)絡(luò)信息計量學(xué)對于網(wǎng)絡(luò)信息檢索技術(shù)的發(fā)展具有重要推動意義。一般情況下,搜索引擎開發(fā)主要須涉及做網(wǎng)絡(luò)的關(guān)鍵詞、超鏈接以及相關(guān)特征的定量分析,在上述信息數(shù)據(jù)已知的前提下,專業(yè)學(xué)者可以研究網(wǎng)上的實時的動態(tài)信息特點,并通過相關(guān)程序?qū)討B(tài)信息進(jìn)行自動化的抓取和過濾,實現(xiàn)高效率的信息分類。從某種角度來說,這一研究實踐為信息搜索過程設(shè)計提供了參考,可以對搜索結(jié)果進(jìn)行智能化排序。
在網(wǎng)絡(luò)信息計量學(xué)的支持下,信息技術(shù)人員可以對用戶的信息需求以及上網(wǎng)習(xí)慣進(jìn)行研究,從而為網(wǎng)絡(luò)建設(shè)及網(wǎng)站管理的相關(guān)決策提供重要依據(jù)。隨著網(wǎng)絡(luò)信息技術(shù)的繁榮發(fā)展,電腦等電子媒介逐漸普及,網(wǎng)絡(luò)用戶也整體呈現(xiàn)出迅猛的增長態(tài)勢。而針對網(wǎng)站開發(fā)者而言,若網(wǎng)站不符合用戶的信息需求和上網(wǎng)習(xí)慣,則網(wǎng)站將會大概率面臨虧損。但是,用戶網(wǎng)上行為普遍具有隨意性,對用戶的信息需求以及行為習(xí)慣進(jìn)行記錄和匯總何其困難。針對這一問題,專家學(xué)者主張從兩種角度展開用戶研究,一種是在專業(yè)軟件的配合下進(jìn)行動態(tài)追蹤,另一種則是以互聯(lián)網(wǎng)為載體展開交互式調(diào)查,并對搜查所獲得的數(shù)據(jù)進(jìn)行計量分析。近幾年來,互聯(lián)網(wǎng)行業(yè)爆發(fā)出較大的潛力,相對網(wǎng)絡(luò)競爭也日趨激烈,只有在用戶需求基礎(chǔ)上建立開發(fā)網(wǎng)站,方能真正提升行業(yè)的競爭力,因此對于用戶的信息需求的計量研究至關(guān)重要[3]。
網(wǎng)絡(luò)信息計量學(xué)軟件是該門學(xué)科發(fā)展的重要工具,國內(nèi)外無數(shù)專家學(xué)者聚焦新型信息計量學(xué)軟件開發(fā)工作,并取得了顯著的成效。但長遠(yuǎn)來看,網(wǎng)絡(luò)信息計量學(xué)的發(fā)展仍舊具備無限潛力,其軟件開發(fā)整體存在以下幾個大方向。
雖然網(wǎng)絡(luò)信息計量學(xué)的應(yīng)用領(lǐng)域相對較廣,但其宏觀環(huán)境是信息網(wǎng)絡(luò)。因此,無論是短期還是長期,軟件面向網(wǎng)絡(luò)是軟件開發(fā)的必然方向。以現(xiàn)階段網(wǎng)絡(luò)結(jié)構(gòu)為例,軟件與網(wǎng)絡(luò)集成覆蓋內(nèi)聯(lián)網(wǎng)、外聯(lián)網(wǎng)以及互聯(lián)網(wǎng),這也間接體現(xiàn)了網(wǎng)絡(luò)信息計量學(xué)軟件的基本特征,即內(nèi)嵌于網(wǎng)絡(luò)技術(shù)和網(wǎng)絡(luò)環(huán)境。
網(wǎng)絡(luò)信息計量軟件的功能細(xì)化已經(jīng)初見成效,但隨著網(wǎng)絡(luò)信息計量學(xué)研究的日益深入,各行業(yè)以及各應(yīng)用領(lǐng)域?qū)τ谙盗熊浖膮?shù)要求會愈加嚴(yán)格。面對這一需求,一方面,要對網(wǎng)絡(luò)信息計量軟件的原有功能進(jìn)行補充和完善,增加統(tǒng)計分析指標(biāo)、信息處理等功能,并對功能進(jìn)行細(xì)致的優(yōu)化。另一方面,為滿足網(wǎng)絡(luò)信息計量研究日益增長的需求,軟件在創(chuàng)新中應(yīng)具備多功能集成。具體來說,多功能集成既包括信息的收集、轉(zhuǎn)化、整理以及分析,也包括數(shù)據(jù)庫、功能包、詞典等輔助工具的開發(fā)。
自動化是網(wǎng)絡(luò)信息計量學(xué)軟件開發(fā)的重要方向,伴隨信息的海量增長,借助人工手段對信息進(jìn)行處理已經(jīng)不切實際??陀^來說,自動化信息處理包括信息的自動化轉(zhuǎn)化、整理、歸納以及分析等,其必須依托智能化檢索和智能化分析來實現(xiàn)。在現(xiàn)有技術(shù)水平下,網(wǎng)絡(luò)內(nèi)容分析主要可以從語用層次分析和信息語義分析兩方面來發(fā)展,而隨著軟件的進(jìn)一步更新,網(wǎng)絡(luò)內(nèi)容分析將會向語法層次和語用層次邁進(jìn),而這勢必會推動信息計量學(xué)軟件智能化水平的提升。
由于網(wǎng)絡(luò)信息計量學(xué)軟件開發(fā)上存在短板,現(xiàn)階段網(wǎng)絡(luò)信息計量分析工作還存在不規(guī)范的亂象。但隨著學(xué)科發(fā)展不斷完善,該問題或?qū)⒌玫礁拘越鉀Q。具體來說,規(guī)范化的信息處理工作應(yīng)建立在規(guī)范的軟件自動化收集網(wǎng)絡(luò)信息數(shù)據(jù)項、規(guī)范的軟件數(shù)據(jù)統(tǒng)計指標(biāo)、規(guī)范的軟件讀取、轉(zhuǎn)化以及數(shù)據(jù)格式生成等方面。若上述條件能達(dá)成,則網(wǎng)絡(luò)數(shù)據(jù)的準(zhǔn)確性和完整性將會得到質(zhì)的飛躍。
面對網(wǎng)絡(luò)信息計量學(xué)的不同研究需求,多版本軟件開發(fā)具有必然性。比如說,網(wǎng)站規(guī)模不同,則對應(yīng)的軟件處理版本不同,語言內(nèi)容不同,對版本分析能力的要求也不同。因此,相關(guān)技術(shù)人員可以根據(jù)具體的網(wǎng)絡(luò)信息計量學(xué)研究對象以及研究方向開發(fā)對應(yīng)的版本軟件,從而針對性地對原內(nèi)容進(jìn)行分析,以問題的難度系數(shù)為標(biāo)準(zhǔn)選擇簡易版或集成版、單機(jī)版或網(wǎng)絡(luò)版的軟件,以滿足網(wǎng)絡(luò)信息計量學(xué)的不同需求。
綜上所述,目前國內(nèi)外對于網(wǎng)絡(luò)信息計量學(xué)的研究已經(jīng)形成一定規(guī)模,網(wǎng)絡(luò)信息計量軟件的開發(fā)應(yīng)用也取得顯著成效。隨著信息化時代的日益推進(jìn),相關(guān)領(lǐng)域?qū)<覍W(xué)者及技術(shù)人員應(yīng)立足學(xué)科對軟件支持的需求,不斷開拓學(xué)科應(yīng)用領(lǐng)域,推斷網(wǎng)絡(luò)信息計量學(xué)的深層次、大范圍應(yīng)用。