盧昱佑
摘要:信息檢索是信息科學和計算機科學領域中都有涉獵的部分,與用戶的交互關系密切。信息科學和計算機科學研究人員對信息檢索有不同的認識和理解,所研究出的信息檢索工具功能有較大差異。本文主要針對信息科學領域和計算機科學領域的信息檢索理論架構進行討論,為信息檢索的發(fā)展提供一些思路。
關鍵詞:信息科學;計算機科學;信息檢索理論架構
引言:信息科學是一門研究信息運動規(guī)律和信息應用方法的科學,計算機科學是一門研究計算機結構、程序系統(tǒng)、計算機語言、算法的科學。二者對信息檢索有不同的認識,所研究出的信息檢索功能有不同的側重,用戶對同一信息的檢索結果可能相似,也可能大相徑庭。
1 信息科學領域下的信息檢
1.1 信息科學領域
信息科學以信息為主要研究對象,將信息視為一種普遍存在的事物,這是信息科學與其他科學的根本區(qū)別。信息檢索是信息科學研究的課題方向之一,指用戶查找信息的方法和手段,分為狹義和廣義兩種,狹義信息檢索是指單純借助檢索工具查找到信息目標的過程,廣義信息檢索帶有加工、組織、整理的過程。
1.2 信息檢索
信息科學領域下的信息檢索理論以信息存儲為基礎,將信息與其存在的物理角度、認知角度、情境角度進行匹配,才能形成完整的信息內(nèi)容。從物理角度來看,信息是可以計算價值的一種消息;從認知角度來看,信息讓信息接受者對世界的認知產(chǎn)生一定的轉(zhuǎn)變;從情境角度來看,信息在特定社會語境下發(fā)揮作用,真實度有所側重。
2 計算機科學領域下的信息檢索
2.1 計算機科學領域
計算機科學與計算、信息處理的關系密切,計算機科學領域中有大量與信息有關的研究課題和方向,諸如信息編碼論、數(shù)據(jù)庫和信息檢索、網(wǎng)絡與通信等。計算機從研發(fā)之初就一直被用于處理信息,可以說計算機科學是一門研究信息處理的科學。
2.2 信息檢索
計算機科學領域下的信息檢索理論不關心信息的多層次性,直接將信息視作事實的觀點,或?qū)⑿畔⒁曌饕粋€客觀存在的物理事物,比如文字、圖片、音頻、視頻等。
3 信息檢索理論架構分析
3.1 信息科學領域信息檢索理論架構
3.1.1 用戶視角
第一,信息檢索原則。信息科學領域中的信息檢索原則為最小努力原則,即人們希望付出最小的時間、精力、金錢獲得最想要的信息[1]。鑒于此,信息檢索相關研究遵循檢索功能用戶的需求對檢索系統(tǒng)進行設計,結合上下文、結果展示等間接影響因素來提高檢索速度。
第二,檢索迭代過程。由于信息時刻處于豐富、增長的狀態(tài)之下,所以信息檢索也被視為一個動態(tài)、變化的過程。用戶在不同時間點上對于同一個信息進行檢索,能夠獲取的信息并不相同;信息在不同領域內(nèi)的表達結果也有所不同。因此,信息檢索研究領域為信息檢索增添了迭代元素,供用戶從時間、從常用程度、從信息發(fā)布領域等角度進行信息檢索,充分滿足用戶的信息檢索需求。
3.1.2 技術視角
隨著信息科學相關技術的不斷發(fā)展,信息技術可以實現(xiàn)對用戶檢索首選渠道、偏好的判斷,綜合用戶的日常信息檢索內(nèi)容、瀏覽網(wǎng)站、語境等其他因素,將信息檢索中相關渠道和偏好優(yōu)先展示。這樣的信息檢索結果呈現(xiàn)方式在大多數(shù)時間內(nèi)可實現(xiàn)最小努力原則,滿足用戶的檢索需求。信息科學領域的這一信息檢索理論支持了當前互聯(lián)網(wǎng)大數(shù)據(jù)推薦的技術成果,即用戶在搜索引擎中檢索學術信息,優(yōu)先呈現(xiàn)常瀏覽學術網(wǎng)站的檢索結果等。這樣的技術提高了用戶檢索的效率,但也因為不全面展示信息檢索成果而存在造成用戶信息繭房的隱患。
3.2 計算機科學領域信息檢索理論架構
3.2.1 用戶視角
與信息科學領域不同,計算機科學領域的研究人員在研究和開發(fā)信息檢索功能時更多考慮信息對用戶的有益性,提供給用戶更多的信息。因此,很多信息檢索引擎、工具的研發(fā)都在探索更多的檢索方式,更有效的信息存儲方式,更成功的索引方法。雖然更多的信息未必能夠幫助用戶做出正確的決定,但研究人員認為在用戶并不能總是正確權衡信息檢索努力成本和收獲效益關系的情況下,更多的信息有利于用戶。提供更多的信息還是提供更符合用戶需求的信息,是信息科學與計算機科學在信息檢索理論架構方面的主要矛盾[2]。
3.2.2 技術視角
在計算機科學領域中,用于信息檢索的查詢線索可以是文字、圖片等多種形態(tài),并不局限于字、詞或語法命令。查詢線索是信息檢索的關鍵一環(huán),直接影響檢索結果的排名先后和呈現(xiàn)方式,因此,在計算機科學領域中關于查詢改寫、查詢擴展等研究比較熱門。在查詢的重要性方面,信息科學和計算機科學的研究人員態(tài)度一致。
3.2.3 信息視角
在計算機科學領域中,研究人員同樣承認信息環(huán)境的重要性,實現(xiàn)了對文本的統(tǒng)計分析、文件集合內(nèi)的索引,并通過引入概率等數(shù)學模型來實現(xiàn)對非文本信息的檢索,推動信息檢索領域向著呈現(xiàn)更多信息檢索結果的方向發(fā)展。在對不同信息檢索成果的呈現(xiàn)上,計算機科學研究人員更傾向于通過匹配算法來決定先后順序,而不是文本與檢索對象的相關率,這就導致用戶可能并不能在前排成果中發(fā)現(xiàn)自己想要的檢索結果。但同樣,匹配算法可有效降低相似程度高的檢索結果造成的信息噪聲,幫助用戶更快找到并不相同的類似文件,擴大檢索范圍。
結束語:本文對比了信息科學和計算機科學領域中不同的信息檢索理論架構,可以發(fā)現(xiàn)兩個領域中對信息檢索的認識有較大區(qū)別,且都能夠?qū)τ脩舻男畔z索需求提供幫助。事實上,用戶在不同情況下有不同的檢索需求,并非一個領域下的信息檢索功能能夠滿足,信息檢索功能的適用性發(fā)展還有較長的路要走。
參考文獻:
[1]黃慶榕. 淺析信息科學領域與計算機科學領域信息檢索理論架構研究[J]. 信息系統(tǒng)工程,2016(12):43.
[2]劉蓉梅. 現(xiàn)代信息檢索理論架構研究[J]. 科技情報開發(fā)與經(jīng)濟,2015,25(02):132-134.
[3]楊晴.計算機信息檢索步驟思考[J].現(xiàn)代商業(yè)工貿(mào),2011,23(19)224
[4]劉興達.計算機信息檢索技術的發(fā)展及問題研究[J].科技與創(chuàng)新,2018(02)121-122