楊林慧 孫少華
摘 要:對認(rèn)知信息檢索的德爾文的意義構(gòu)建理論、貝爾金的ASK理論、威爾遜的信息行為模型、薩拉薩維克的認(rèn)知相關(guān)性層次模型、英格沃森的認(rèn)知觀和基于整合認(rèn)知理論的信息檢索模型等理論及模型分別進(jìn)行評述,得出結(jié)論:基于整合認(rèn)知理論信息檢索具有較好發(fā)展前景,認(rèn)知信息檢索需要與系統(tǒng)導(dǎo)向和用戶導(dǎo)向的信息檢索不斷融合,形成統(tǒng)一的認(rèn)知信息檢索系統(tǒng)。
關(guān)鍵詞:認(rèn)知;分面搜索;交互
1 概述
隨著數(shù)字技術(shù)不斷發(fā)展,網(wǎng)絡(luò)承擔(dān)起教育和學(xué)習(xí)的重?fù)?dān),如何利用網(wǎng)絡(luò)檢索來更有效的得到自己所需的信息已成為亟待解決的問題。認(rèn)知心理學(xué)家研究主要是通過探測人的思想進(jìn)行信息檢索,模擬假設(shè)的認(rèn)知功能與計(jì)算機(jī)算法,并觀察不同認(rèn)知水平的用戶在搜索時所產(chǎn)生的不同行為。
信息檢索[1](Information Retrieval)是跨學(xué)科的,主要是基于計(jì)算機(jī)科學(xué),信息科學(xué)和認(rèn)知心理學(xué)。信息檢索所對應(yīng)研究的科學(xué)領(lǐng)域是搜索文檔,因?yàn)椴檎椅臋n的內(nèi)部信息也就是搜索結(jié)構(gòu)化的數(shù)據(jù)庫(例如:數(shù)字圖書館)或者網(wǎng)絡(luò)。與此同時,將計(jì)算機(jī)科學(xué)和心理學(xué)應(yīng)用到認(rèn)知的信息處理模型中,開發(fā)了一門新的研究領(lǐng)域叫人機(jī)交互,這一領(lǐng)域包括簡單人類行為的認(rèn)知模型。在信息檢索和人機(jī)交互這兩個主要的研究領(lǐng)域中,以用戶行為作為主要研究重點(diǎn)的信息搜索已經(jīng)成為一個重點(diǎn)研究搜索的現(xiàn)象。從1977年德梅(Marc de Mey)首次提出認(rèn)知觀概念至今,出現(xiàn)了眾多的需要進(jìn)行梳理和總結(jié)的研究成果,文章的主要目的是介紹基于認(rèn)知信息檢索研究的進(jìn)展。
2 信息檢索理論的認(rèn)知方法
認(rèn)知科學(xué)認(rèn)為,認(rèn)知是人們適應(yīng)周圍環(huán)境以生存的必要條件。人類的認(rèn)知一般包括:認(rèn)識、組織、同化和處理外環(huán)境信息的能力。具體來說,認(rèn)知是一種思想過程,它包含有注意、知覺、思維及記憶等??傊?,認(rèn)知是人們?yōu)榱诉m應(yīng)環(huán)境的需要而獲得和應(yīng)用信息的個體能力。
認(rèn)知觀[2]最早由美德提出:“任何信息的處理,無論是知覺的或符號的,都是通過信息處理設(shè)備,由人的世界模型或概念體系實(shí)現(xiàn)的”。在人類信息處理中,世界模型由個人的認(rèn)知空間組成,該空間包括動態(tài)和交互認(rèn)知結(jié)構(gòu)。個人認(rèn)知空間是由當(dāng)前認(rèn)知結(jié)構(gòu)和多年社會和歷史情境所帶來的經(jīng)驗(yàn)所決定的。在自動信息處理中世界模型是動態(tài)的,而不是獨(dú)立的。
文章認(rèn)為,信息檢索是認(rèn)知觀和社會認(rèn)知觀/整合認(rèn)知理論在信息檢索中的應(yīng)用,以認(rèn)知科學(xué)方法研究信息檢索者認(rèn)知空間、信息檢索系統(tǒng)的信息空間及交互界面,是與傳統(tǒng)系統(tǒng)導(dǎo)向信息檢索和用戶導(dǎo)向信息檢索相區(qū)別的檢索范式。
3 基于認(rèn)知的信息檢索主要模型
德梅的認(rèn)知概念為認(rèn)知信息檢索提供了基本假設(shè):信息檢索過程存在交互作用,信息傳遞與接收都存在知識結(jié)構(gòu)的變化,并以改善知識結(jié)構(gòu)為目標(biāo)。信息檢索的實(shí)質(zhì)是用戶認(rèn)知結(jié)構(gòu)的改善。下面針對相關(guān)理論和模型分別進(jìn)行分析。
3.1 世界模型
對于人類來說,隨著時間的推移和閱歷的增加,認(rèn)知水平是在不斷發(fā)生變化的。在世界模型中,認(rèn)知會“自由落體”到語義水平和詞匯語言。結(jié)果導(dǎo)致交流信息的任何意圖和意義都立即消失,必須得重建,即接受者通過這些前提來參與通信行為。在語言層面的溝通,我們有標(biāo)志。如:語言、圖像或者文本字符串,這是人類認(rèn)知結(jié)構(gòu)轉(zhuǎn)換所產(chǎn)生的。正如之前所說的,信息處理所產(chǎn)生的行為是通過人類行為或者相似的機(jī)器行為來實(shí)現(xiàn)的。溝通的標(biāo)志還停留在語言層面上,就是根據(jù)個體的世界模型和實(shí)際的問題空間以及不確定性來解釋接收者的認(rèn)知狀態(tài)。在認(rèn)知觀點(diǎn)下,我們可以觀察到對信息檢索來說兩個最基本的特點(diǎn):(1)在信息檢索中的不確定性和不可預(yù)知性;(2)在通信信息中,任何假設(shè)、意義和意圖不僅是重要的而且也是不斷持續(xù)的。
3.2 信息搜索過程模型(ISP)
ISP模型[3]在1985年首次出現(xiàn),然后慢慢地被豐富起來。起初,Kuhlthau開發(fā)了一個信息搜索過程的整體模型,該模型將情感、認(rèn)知和身體經(jīng)歷的不同階段融入到了信息檢索中。該模型處于對在信息搜索任務(wù)中,學(xué)生行為的興趣。其可分為七個階段,每一個階段都涉及到三個領(lǐng)域中的一個或者更多,這三個領(lǐng)域包括情感、認(rèn)知和行為。
3.3 認(rèn)知模型
Hill和Hannafin提出,如果模型在搜索行為中給出了大量的有趣信息,在特定心理過程中,認(rèn)知模型會涉及到困難的解釋和能力的預(yù)測。
Ingwersen提出,從一些動態(tài)交互過程所產(chǎn)生的信息行為,將會在多個層面上產(chǎn)生用戶的認(rèn)知空間[4],和數(shù)字系統(tǒng)的信息空間。利用這些信息行為的多重表示,Ingwersen建立了一個交互模型,不僅適用于用戶和電子系統(tǒng),也適用于用戶和系統(tǒng)的信息對象。該模型主要了解了現(xiàn)行的信息系統(tǒng)和發(fā)生在用戶和系統(tǒng)之間的互動認(rèn)知過程。
在同一時段,Saracevic也闡述了信息行為的分層交互模型[5],該模型首先假定了用戶與計(jì)算機(jī)系統(tǒng)交互的目的是為了使用信息。該模型分為三個層次:(1)表層:系統(tǒng)界面和終端用戶的交互層;(2)認(rèn)知:文本內(nèi)容的交互層;(3)情形:提供最初問題時的情境。他的模型與Ingwersen的模型有很大的相似性,包括:表層,通過命令和查詢與系統(tǒng)進(jìn)行交互;認(rèn)知層,用戶與系統(tǒng)輸出交互;情形層,用戶在給定的情境下或者問題所產(chǎn)生的信息以及問題的解答進(jìn)行交互。
4 結(jié)束語
雖然基于認(rèn)知觀的信息搜索模型研究由來已久,但關(guān)于信息搜索和搜索模型尚未解決的問題仍然存在。雖然有關(guān)信息檢索的研究有助于揭示用戶怎樣在不同類型信息檢索系統(tǒng)中進(jìn)行交互,但是只有極少的針對用戶研究的成果應(yīng)用到信息檢索系統(tǒng)的設(shè)計(jì)當(dāng)中。面向用戶的研究和面向系統(tǒng)的設(shè)計(jì)還有很大的差距,我們應(yīng)把針對用戶研究的設(shè)計(jì)原則納入并應(yīng)用到信息檢索系統(tǒng)的設(shè)計(jì)和評價中。
參考文獻(xiàn)
[1]Sacco, G. M. Dynamic taxonomies and guided searches , J. of the American Society for Information Science and Technology, 57:6, pp. 792-797, 2006.
[2]Sacco, G. M. Uniform access to multimedia information bases through dynamic taxonomies, IEEE 6th Int. Symp. on Multimedia Software Engineering, (ISMSE'04),2004:320-328.
[3]陳波.基于開源全文檢索系統(tǒng)Solr的OPAC分面瀏覽[J].應(yīng)用實(shí)踐,2007,11:72-75.
[4]E. Oren, R. Delbru, and S. Decker .Extending Faceted Navigation for RDF Data[C]. ISWC 2006, LNCS 4273, pp. 559-572.
[5]王莉,高仲利.基于分面導(dǎo)航理論的RDF數(shù)據(jù)的持久化研究[J].計(jì)算機(jī)工程與應(yīng)用,2010,46(9):130-133.
作者簡介:楊林慧(1988,3-),山西長治,碩士研究生,電力通信,工程師。
孫少華(1986,3-),河南漯河,碩士研究生,電力通信,工程師。