邱 躍,湯妙吉(1.從化圖書館;2.廣東建設職業(yè)技術學院圖書館)
就傳統(tǒng)的信息檢索而言,信息檢索是查找文獻而不是查找信息內容本身,傳統(tǒng)的信息檢索忽視了用戶在整個自動化處理過程中的地位和作用,從而導致檢索效率不高,檢索效果遠低于用戶期望,造成許多檢索系統(tǒng)在實際應用中不受用戶歡迎,這一現(xiàn)象在信息檢索系統(tǒng)的設計與開發(fā)中比較常見。通過優(yōu)化信息檢索流程可達到簡化繁瑣檢索步驟的目的,而檢索流程隨著信息技術的發(fā)展在未來更多的依賴于用戶主觀意識的傳達。因此深入開展對用戶認知、用戶行為的研究成為信息檢索研究的一個有效方向。建立用戶認知動態(tài)結構、研究用戶認知能力、分析用戶認知特征成為提高信息檢索效率的必然要求[1]。稀缺理論的引入為信息檢索的研究提供了一個嶄新的視角,以重新解釋用戶在信息檢索過程中的認知行為。將稀缺理論與用戶認知理論結合分析,用科學理論解釋人文現(xiàn)象,可以合理地闡明用戶認知行為的發(fā)展趨勢,并提升信息檢索研究的有效性與科學性。
行為經(jīng)濟學家Seidhill Mullina 和心理學家Edel Shafir 在其合著的《稀缺》一書中首次提出了稀缺理論,它為開展用戶認知研究提供了新的視角,成為研究信息檢索過程中用戶認知與用戶行為的重要理論基礎[2]。稀缺理論本質上是一種稀缺的心理狀態(tài),即當用戶接受某項任務時,在初步識別后,會產(chǎn)生一種自身所擁有少于完成工作所需的信息或知識的心態(tài)。在稀缺理論中,用戶一旦有了稀缺的心態(tài),這種心態(tài)就會侵入用戶的大腦,存在于人腦的潛意識中。稀缺心態(tài)會對用戶的信息獲取速度和信息理解深度產(chǎn)生影響,削弱用戶的認知能力并降低用戶對任務的執(zhí)行控制力。
稀缺心態(tài)帶來的負面影響具體表現(xiàn)為“管窺”,即帶寬負擔[3]。帶寬負擔是指當人們的帶寬容量減少時對帶寬產(chǎn)生的負面影響,包括影響人們的認知力和執(zhí)行力。當出現(xiàn)“管窺”現(xiàn)象時,一個人的流體智力將被削弱,導致他的認知能力被影響,執(zhí)行控制力也會隨之弱化。因此,對用戶認知能力的管理成為構建以內容查找為核心的信息檢索模型的重點內容。
認知科學始于20 世紀50 年代,是一門研究認知機制(信息處理)和機器建模的科學。認知科學借鑒了信息論的基本原理來描述和解釋人類的認知過程,是認知心理學與計算機科學的融合。20 世紀70 年代后,關于認知科學的觀點得到了學術界者的普遍認可,形成了關于相互作用理論和認知信息理論的基本假設。
信息檢索過程本質上是用戶的認知過程。就以往的研究而言,信息檢索認知過程的重點在于揭示用戶在信息檢索過程中的認知以及與信息檢索系統(tǒng)之間的交互聯(lián)系,但卻忽略了用戶認知能力的動態(tài)變化。為了彌補該研究領域的不足,有必要對用戶認知的動態(tài)情況進行分析,為信息檢索認知過程的研究提供理論依據(jù)[4]。
在正常情況下,用戶的認知能力處于相對穩(wěn)定的狀態(tài)。當用戶處于任務情境時,其認知能力會發(fā)生相應的變化。用戶接受某項任務,由于其本身知識結構的受限,需要從外界獲取信息以彌補自身知識結構的不足,此時用戶就會產(chǎn)生稀缺心態(tài)。一旦用戶出現(xiàn)了稀缺心理,其認知能力就會在一定程度上被減弱,很難充分表達出真實的信息需求,這將影響到用戶接下來的一系列檢索行為。因此,在研究信息檢索認知過程時,研究的關注點可以放在盡可能減少其他因素對用戶信息需求的干擾,同時,考慮到用戶認知能力的動態(tài)性(見圖1),可對用戶的認知情況進行分階段研究,使其更符合用戶的非理性認知過程。
圖1 用戶認知能力動態(tài)變化圖
根據(jù)稀缺理論,稀缺并不是絕對的,稀缺更多來自人類主觀認知。信息的稀缺源自人們具體的信息需求,而信息需求則是用戶解決當前問題遇到障礙時所自發(fā)形成的,這個障礙使得用戶注意力集中在解決當前的問題上。無形之中,它將降低用戶帶寬的容量,使用戶專注于其缺少的部分而降低對其他事情的關心,致使用戶缺乏前瞻性和洞察力,執(zhí)行力與控制力也被隨之削弱[5]。
當用戶接受任務時,用戶自己的知識結構將與解決任務所需的知識結構進行匹配,形成第一道信息鴻溝,它是知識結構“擁有”與“需要”之間的實際差異,此時,用戶將生成信息需求。當用戶產(chǎn)生信息需求時,稀缺便會捕獲用戶的大腦,產(chǎn)生稀缺心態(tài),此時用戶可以使用的帶寬就會變窄,用戶的認知能力會降低,執(zhí)行控制力也會減弱。在此狀態(tài)下,會出現(xiàn)第二道信息鴻溝,即認知能力所識別的知識結構“擁有”與“需要”之間的差異。通常,新的認知能力小于初始認知能力,后出現(xiàn)的信息鴻溝也是小于先前的信息鴻溝。然后,用戶在新的認知能力中,產(chǎn)生一系列描述概念或者根據(jù)已知事實作出一些推理,從而形成新的語義網(wǎng)絡,再通過信息檢索模型和工具來獲取所需信息資源。
信息檢索研究領域有三大研究趨勢,即用戶導向、系統(tǒng)導向和認知導向[6]。認知信息檢索屬于認知導向的信息檢索研究,認知信息檢索是以認知心理學理論為基礎對用戶的認知信息進行模擬和處理,在對用戶信息檢索認知行為進行深入分析的基礎上從用戶知識結構、檢索環(huán)境、認知能力三要素出發(fā)研究檢索系統(tǒng)與用戶之間信息交互的檢索過程。
在認知信息檢索的發(fā)展初期,它主要面向中介。隨著知識檢索的進一步發(fā)展,人們發(fā)現(xiàn)用戶的信息檢索行為并不是靜態(tài)的,個體信息語境的概念發(fā)生了變化,用戶行為成為研究對象,信息檢索過程中的信息交互和用戶認知變化受到重視[7]。依據(jù)信息檢索行為,用戶的認知信息檢索可分為初始、選擇、探索、形成、整合和表達六個階段。這六個階段的循序漸進,揭示了認知信息檢索的一般過程(見圖2)。
圖2 認知信息檢索的六階段模型
與傳統(tǒng)的信息檢索相比,稀缺理論下用戶的認知變化不是簡單的線性增長而是以網(wǎng)絡狀分布,且基于某一個檢索意圖集中呈現(xiàn),是一種動態(tài)的交互式的檢索行為。因此,交互式信息檢索系統(tǒng)是在用戶信息獲取過程中提供適當?shù)膸椭椭С郑詫崿F(xiàn)認知層次上的相互交流[8]。為此,對交互過程中所涉及的要素進行分析有助于進一步揭示信息交互的規(guī)律。稀缺理論與用戶認知理論下的信息檢索交互過程可以由檢索系統(tǒng)、用戶和中介三部分要素組成。
檢索系統(tǒng)是用戶與信息進行交互作用的橋梁,貫穿于整個檢索過程。檢索系統(tǒng)界面的特性包括易用性、美觀性、個性化、友好性等。對于用戶來說,他們無法看到檢索系統(tǒng)的代碼組成、后臺工作流程等,大部分用戶也不具備專業(yè)的信息檢索能力,檢索系統(tǒng)的界面即是他們所能了解到的一切。因此,在稀缺理論與用戶認知理論指導下設計的檢索系統(tǒng)可以使其幫助用戶更快、更便捷地獲取信息。如,檢索系統(tǒng)的使用方式上應與市場中大部分的檢索系統(tǒng)采用統(tǒng)一的檢索方法,盡量少用專業(yè)術語,以保證用戶在使用新的檢索系統(tǒng)時不會產(chǎn)生困惑,可以盡快了解本系統(tǒng)的功能。此外,從宏觀層面看,檢索系統(tǒng)的構建是根據(jù)不同用戶的使用習慣、信息需求等目的形成具有不同主題的檢索系統(tǒng)。稀缺理論與用戶認知的信息檢索系統(tǒng),需要分析用戶動態(tài)行為,引導用戶在自身信息缺口下依靠檢索系統(tǒng)的鏈接、提示、提醒、模塊等幫助調動主觀思維與信息系統(tǒng)進行交互,最后獲取所需信息。
用戶在信息檢索過程中處于前端,擔任著需求方的角色,是信息檢索系統(tǒng)設計考慮的首要因素。依據(jù)稀缺理論,用戶在出現(xiàn)“管窺”視角后將更多的關注于如何獲取有用的信息來幫助自己解決問題。因此用戶在每次檢索過程中會將檢索結果與解決任務所需的信息進行匹配,如果信息滿足用戶需求,那么檢索行為結束;如果不滿足需求,那么用戶會調整檢索策略,包括改變檢索詞、檢索途徑、信息資源形式等。在社交網(wǎng)絡不斷發(fā)展和完善的背景下,用戶獲取信息不再局限于圖書、報刊等紙質資源,而是更多的面向網(wǎng)絡平臺、專業(yè)數(shù)據(jù)庫等數(shù)字資源去尋求基于網(wǎng)絡的交互式信息檢索服務,網(wǎng)絡平臺的交互信息檢索成為信息檢索系統(tǒng)的有效補充。用戶既可以通過交互軟件與其他用戶進行交流獲取幫助,也可以利用搜索引擎瀏覽網(wǎng)頁、論壇、微博等相關內容。同時,搜索引擎也會根據(jù)用戶的搜索路徑對用戶的興趣進行分析,從而為用戶提供可能感興趣的信息鏈接。
在檢索系統(tǒng)中,中介一般是指系統(tǒng)設計模塊,它是根據(jù)用戶檢索表達式和長期檢索行為描述用戶信息需求的方式。系統(tǒng)設計不再讓用戶靠直覺來判斷是否需求信息,而是將用戶可能的需求用自然語言表達式和查詢表達式銜接。隨著時間的推移,用戶對事物認知的程度加深,系統(tǒng)會將這些方案用符號的方式儲存于檢索系統(tǒng)之中,以符合用戶認知的動態(tài)發(fā)展。同時,系統(tǒng)設計需滿足信息的存儲過程和信息的檢索過程。信息存儲過程是對信息進行加工,將呈現(xiàn)出的信息特征進行存儲并輸入進信息檢索系統(tǒng);而信息檢索過程是當搜索模塊與用戶通信時,檢索系統(tǒng)分析用戶的檢索提問并轉化為檢索語言,并標引出系統(tǒng)能夠識別的檢索標識。當系統(tǒng)產(chǎn)生信息輸出時又將語法信息轉為用戶能理解的語義,即大家所看到的檢索結果。信息檢索系統(tǒng)的中介是對檢索全過程謀劃后的整體設計策略,它能及時反映和分析檢索結果與檢索目標要求是否一致,可以對檢索策略進行相應的修改調整以獲得最佳的查準率,并最終呈現(xiàn)給用戶滿意的檢索結果。
信息檢索認知模型是一種基于數(shù)學工具對用戶檢索文本和查詢過程之間關系的框架。它以認知科學的概念、方法和數(shù)據(jù)為基礎,結合用戶遇到稀缺性心理時的認知變化,研究檢索文本和主題的相似度。在稀缺心態(tài)下,用戶的認知能力在相對穩(wěn)定的狀態(tài)會被打破,注意力主要集中在產(chǎn)生的信息缺口上,從而導致其認知能力降低。加上用戶的認知能力也處于不斷變化的過程中,信息檢索認知模型有必要對用戶的整個認知過程進行分析,并人工干預信息檢索系統(tǒng)的設計,使用戶的信息需求更加準確的表達出來,讓用戶與檢索系統(tǒng)間的交互行為更加默契,從而提高信息檢索系統(tǒng)的利用率。根據(jù)稀缺性理論與用戶認知的信息檢索循序漸進的階段,可分為三個模型進行描述。
該模型首先假設個體在認知結構上存在差異,它受到自身的認知要素及外部環(huán)境的影響;其次從認知的角度分析信息檢索過程中涉及的認知要素,包含信息檢索所需的基本條件,從而通過信息檢索系統(tǒng)傳遞信息,這部分屬于認知的中介機制。最終的檢索結果顯示:如果用戶滿意,則變成用戶新的認知;如果用戶得不到滿足,則會生成新的動態(tài)認知要素,并返回到檢索模型初始段,具體如圖3 所示。
圖3 初始認知下的信息檢索模型
稀缺理論下的信息檢索模型認為用戶具有信息需求的原因是用戶意識到自己的知識結構異常且無法解決某些問題。用戶根據(jù)查詢目標與任務產(chǎn)生信息初始需求,并通過查詢喜好和查詢行為進行信息交互,在信息交互過程中用戶的認知受到稀缺心態(tài)的影響。稀缺會俘獲用戶的大腦,漸漸讓用戶失去認知能力和執(zhí)行控制力,變得更加愚笨和沖動,形成管窺思維[9]。此時,用戶的帶寬變窄,認知受到限制(見圖4)。稀缺理論下的認知信息檢索模型揭示了用戶在目標和任務的驅動下產(chǎn)生的信息需求。
圖4 稀缺理論下的認知模型
用戶與信息檢索系統(tǒng)交互的目的是使用與認知和情境相關聯(lián)的信息。交互行為總是存在于信息查詢過程中,與傳統(tǒng)的信息檢索相比,信息交互行為下的信息檢索模型能更準確的滿足用戶的信息需求。在交互過程中,用戶可以對信息進行表達、查看、導航、比較和總結(見圖5)。由于交互行為受不同因素的影響發(fā)生改變,在不同階段,用戶交互的內容也是不同的。社交網(wǎng)絡行為中除了有傳統(tǒng)的信息檢索文本外,還有大量信息交互層,用戶通過與系統(tǒng)對話,完成搜索、匹配、瀏覽和判斷等過程。此外,系統(tǒng)還可以要求用戶提供反饋信息。
圖5 信息交互行為下的信息檢索模型
基于稀缺理論與用戶認知理論可以發(fā)現(xiàn)用戶的信息檢索行為更具復雜性與動態(tài)性。隨著社交網(wǎng)絡的發(fā)展,用戶自身的知識結構、工作任務情況和自身喜好習慣等促使用戶的檢索行為從傳統(tǒng)的文本信息檢索向新的網(wǎng)絡檢索轉變[10],用戶的檢索意圖在信息稀缺時的認知變化可以對信息檢索行為帶來影響。
以往的研究表明,用戶的檢索意圖通??梢苑譃樾畔㈩?、導航類和交易類三種。信息類檢索是用戶試圖通過網(wǎng)絡獲取有關的信息,如數(shù)據(jù)、網(wǎng)頁和文檔等,它不同于導航類和交易類檢索要求,具有時間跨度大、交互作用多、內容形式豐富的特點。其中,歷時較長和交互方式多樣的信息類檢索意圖,即為長期檢索意圖。
稀缺理論表明用戶在接受任務時,當發(fā)現(xiàn)自身知識不足以應對任務的完成,其認知關注點重在通過查找信息、借助外部的幫助來解決問題。在未解決任務前,稀缺使用戶的關注焦點更集中,表現(xiàn)為長期檢索意圖。而隨著社交網(wǎng)絡的發(fā)展,信息的來源不僅存在于紙質資源、檢索系統(tǒng)等載體,社交網(wǎng)絡平臺也可以提供大量的信息幫助用戶解決問題。因此,用戶利用社交網(wǎng)絡瀏覽、查詢信息與在社交網(wǎng)絡上查看、轉發(fā)和評論文章等行為之間存在語義相似性和一致性[11]。通過對用戶瀏覽器中存儲的Cookie 信息進行分析,可以發(fā)現(xiàn)用戶的社交網(wǎng)絡活動中包含了大量的長期檢索意圖。如用戶在一段時間內搜索的各種求職信息、有關python 語言的一系列知識等。此外,用戶的長期檢索意圖搜索過程通常伴隨著其他社交網(wǎng)絡活動,如瀏覽視頻、新聞、登陸社交平臺等。因此,研究在長期檢索意圖中用戶的信息檢索行為與用戶的社交網(wǎng)絡行為之間的關系是重點。
在自然語言處理中,主題可以被看作文檔中詞匯的概率分布。主題模型可以從文檔中的詞匯共現(xiàn)信息中提取語義相關的集合,并且可以將詞匯空間中的文檔轉換成主題空間,從而在低維空間中獲取文檔的表達[12]。
圖6、7 顯示出了信息檢索詞匯和社交網(wǎng)絡數(shù)據(jù)在長期檢索意圖字段中的主題分布概率(手動設置主題數(shù)量為30,主題分布由LDA 模型獲得)。其中,長期檢索意圖為在一段時間內用戶查詢與求職相關的信息,橫坐標表示不同數(shù)量主題的索引(1-30),縱坐標表示每個主題下文本內容的概率分布。直觀來看,圖中兩種檢索行為的主題分布有很大的相似性;然后,對文本內容的特定分析表明,用戶通過這些主題詞瀏覽的文本主要是互聯(lián)網(wǎng)公司的招聘信息,同時用戶在檢索意圖字段中瀏覽、轉發(fā)、評論和關注的文本信息包含了大量公司實習生招聘的相關內容。
圖6 信息檢索主題分布
圖7 社交網(wǎng)絡主題分布
上述實驗中共有75 個檢索者,期限為90 天。經(jīng)過處理,獲得了66 名檢索者的有效數(shù)據(jù)。如前所述,本研究的目的是驗證長期檢索意圖中用戶信息檢索行為與社交網(wǎng)絡行為之間的語義關系,因此,結構化的信息檢索數(shù)據(jù)和相應的社交網(wǎng)絡數(shù)據(jù)是本實驗的關鍵數(shù)據(jù)。通過使用上述查詢細分方法,共獲取3,667 個有效檢索意圖,并捕獲相應時間段內的社交網(wǎng)絡活動數(shù)據(jù),形成3,667個文檔并分別編號。其中,信息檢索文本的內容包括用戶提交的檢索詞集合、用戶瀏覽的網(wǎng)頁集合、網(wǎng)頁快照集合等。社交網(wǎng)絡數(shù)據(jù)的內容包括用戶在相應時間段內瀏覽和轉發(fā)的微博內容和相關評論。
研究發(fā)現(xiàn)有1,785 個檢索意圖包含社交網(wǎng)絡瀏覽行為,即48.67%的檢索意圖包含社交網(wǎng)絡瀏覽行為。對包括社交網(wǎng)絡瀏覽行為在內的所有檢索意圖的進一步分析表明,社交網(wǎng)絡活動與信息檢索行為的主題詞相似度平均值總是略高于其他類型的網(wǎng)絡活動(如新聞瀏覽、娛樂視頻、網(wǎng)上購物等)(見表1)。
表1 長期檢索意圖中主要社交網(wǎng)絡行為比例
表1 顯示了每個檢索意圖字段中用戶主要社交網(wǎng)絡行為占全部信息檢索行為的比例。從表中的數(shù)據(jù)可以看出,除了文本搜索行為外,平均占比最高的社交網(wǎng)絡行為是社交活動,這為分析信息檢索行為和社交網(wǎng)絡行為主題詞的語義關聯(lián)提供了數(shù)據(jù)基礎。
以上數(shù)據(jù)從統(tǒng)計學角度可以表明,信息檢索與社交網(wǎng)絡行為的相關性高于其他形式的網(wǎng)絡活動,實驗數(shù)據(jù)基本符合《中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告》中用戶不同網(wǎng)絡活動的比例。然而,上述數(shù)據(jù)并不足以說明用戶的信息檢索行為受到社交網(wǎng)絡活動的影響,也無法顯示兩者的語義相關性。為此,在文本語義層進一步研究了檢索意圖字段中的信息檢索行為與社交網(wǎng)絡行為主題數(shù)據(jù)之間的相似性。
為了驗證信息檢索行為與社交網(wǎng)絡行為數(shù)據(jù)之間的語義相似度是否與檢索意圖有關,本文將1,785 個查詢意圖的平均值對應在圖中形成連續(xù)檢索段,并設置1 小時、5 小時、10 小時、15 小時和24 小時作為時間分割,得到的數(shù)據(jù)如圖8 所示,當信息檢索行為和社交網(wǎng)絡行為以相同的檢索意圖分布時,相似度顯著高于僅在時間上相鄰的兩組文本。以上分析證明,在相同的檢索意圖下,信息檢索行為與社交網(wǎng)絡行為數(shù)據(jù)之間的語義相關性高于在相同的檢索意圖下其他網(wǎng)絡行為的語義相關性。
圖8 不同時間劃分下信息檢索行為與社交網(wǎng)絡行為的檢索意圖相似性比較
表2 列出了不同和相鄰檢索意圖下信息檢索行為與社交網(wǎng)絡行為數(shù)據(jù)的語義相似度相關統(tǒng)計。從表中數(shù)據(jù)可以看出,現(xiàn)檢索意圖中的信息檢索行為在語義上分別與前檢索意圖和后檢索意圖中的社交網(wǎng)絡行為文本相似,當信息檢索文本和社交網(wǎng)絡行為數(shù)據(jù)分布在同一檢索意圖中時,詞匯與主題的相似度平均最高,前檢索意圖與后檢索意圖的語義相似度顯示差別不大。
表2 不同檢索意圖中信息檢索行為與社交網(wǎng)絡行為的語義相似度比較數(shù)據(jù)
信息檢索所追求的目標是通過更好地獲取信息來支持人類完成特定的任務,而稀缺理論與認知理論為信息檢索的發(fā)展提供了新的思路和方法,使認知信息檢索理論更加完善,最大化挖掘用戶變化的需求實現(xiàn),提供滿足用戶需求的檢索結果。基于此背景,本研究分析了稀缺心理對用戶認知的動態(tài)影響過程,并在稀缺心理學的基礎上解釋了用戶潛在信息需求的深層原因。通過實驗結果證明了用戶的社交網(wǎng)絡行為與信息檢索行為之間存在一定的語義關系,通過提取用戶社交網(wǎng)絡數(shù)據(jù),為研究用戶個性化需求提供理論依據(jù)和參考數(shù)據(jù),有利于信息檢索個性化服務的實現(xiàn)。