【摘要】對信息檢索可視化的背景進(jìn)行介紹,對信息檢索可視化的特點進(jìn)行闡述,并分析三種信息檢索可視化模式。
【關(guān)鍵詞】信息檢索;可視化;提問搜索;瀏覽
信息檢索可視化指的是將數(shù)據(jù)集中抽象的數(shù)據(jù)及其語義關(guān)系轉(zhuǎn)化為可視展示,以及將內(nèi)部檢索過程展示給用戶這一過程?;旧希畔z索可視化由兩部分組成:可視信息展示和可視信息檢索??梢曅畔⒄故緸榭梢曅畔z索提供執(zhí)行或?qū)嵤┑钠脚_。
一、信息檢索可視化的特點
(1)信息檢索可視化為瀏覽提供了一個理想的天然平臺。在信息檢索可視化環(huán)境中瀏覽能讓對對象的相關(guān)性判斷更直觀,并能更方便地明晰用戶的信息需求??梢暬h(huán)境下瀏覽包括一系列豐富的交互式活動,用以實現(xiàn)信息檢索任務(wù)。這些交互式活動都是由交互式可視化技術(shù)支持的,如觸聯(lián)、鏈接、焦點、內(nèi)容、淘選、縮放、概覽和細(xì)節(jié),以及一些過濾手段。(2)信息檢索可視化實現(xiàn)了信息空間的形象化。這是通過將一個不可見的和抽象的信息轉(zhuǎn)化為可見的和可視空間來完成的。瀏覽具有基本空間性的。包含一系列空間關(guān)注點的瀏覽過程能夠產(chǎn)生一個瀏覽空間,通常是信息空間的子空間,這并不是一個巧合。因此,信息空間和瀏覽空間共有的空間特征組成了數(shù)據(jù)集合的空間可視展示,這不只是必要的也是其前提。(3)信息檢索可視化闡明了數(shù)據(jù)集中宏觀環(huán)境下的聚集信息,并讓人們能夠得到這些信息。在傳統(tǒng)信息檢索系統(tǒng)中很難得到的聚集信息,可以闡明關(guān)聯(lián)環(huán)境信息、關(guān)系信息、啟發(fā)式信息、結(jié)構(gòu)信息和全景概述信息。(4)信息檢索可視化也許能為尋找新的信息檢索手段提供途徑。一個信息檢索可視化環(huán)境能將檢索輪廓線對稱的傳統(tǒng)信息檢索模型展現(xiàn)在信息空間中,它也能將一些檢索輪廓線不對稱的非傳統(tǒng)模型展現(xiàn)在信息空間中。傳統(tǒng)檢索模型一般需要一到兩個參考點。但是檢索過程中涉及的參考點的數(shù)量是可以擴充的,以論證可視環(huán)境下多興趣點對信息檢索的影響。(5)信息檢索可視化能給信息分析提供一個獨特的方法。信息可視化是信息分析的強力工具。例如,一個傳統(tǒng)的信息空間密度分析是基于計算的,并且最終結(jié)果是一個簡單的數(shù)字,但是這并不能解釋以下這些問題:文件是如何在信息空間中分布的,總共有多少個簇,哪些簇是最大的,哪些簇是最小的,一個簇的相關(guān)簇是哪些,哪些簇導(dǎo)致了密度的變化,被選定的詞是如何影響空問密度的。這些問題對于信息分析而言至關(guān)重要,在信息檢索可視化環(huán)境下它們能很輕易地被解答。(6)信息檢索可視化為發(fā)展新的可視展示手段開辟了廣闊的空間。信息檢索可視化最顯著的一個特性就是其空間性。正是它的空間性讓人們在定義可視空間,選擇坐標(biāo)系,選擇展示語義框架的方法,確立投影算法和聚集信息的檢索特性上有很大的靈活性。其結(jié)果就是大量豐富的信息檢索可視化模型迅猛發(fā)展。(7)信息檢索可視化豐富了信息檢索并讓用戶使用方便。信息檢索可視化將信息檢索提升到了一個史無前例的高度,將查找信息的過程變得直觀而簡易。由于信息空間的空間性,交互式瀏覽和可視探索的特性,信息檢索不再是一個簡單的查找信息的過程,而是演變?yōu)橹R發(fā)現(xiàn)與知識獲取。
二、三種信息檢索可視化模式
第一種是QB模式(query searching and browsing)。提交一個初始規(guī)則的提問式到信息檢索系統(tǒng),以縮小到一個有限的搜索結(jié)果集,然后將結(jié)果集可視化。最后,用戶可以通過瀏覽在視覺空間中獲取更多細(xì)節(jié)信息。第二種是BQ模式(browsing and query searching)。對于BQ模式,首先為瀏覽建立數(shù)據(jù)集的可視化展示,然后用戶向可視化環(huán)境提交他們的檢索提問,相應(yīng)的檢索結(jié)果以高亮標(biāo)出或在可視化展示上下文中顯示。第三種模式是僅有瀏覽的BO模式。這種模式?jīng)]有結(jié)合任何提問搜索的部分。提問搜索并沒有被分成一種模式,因為它是一種不需要視覺空間的、傳統(tǒng)的信息檢索模式。顯然,BQ模式僅僅可視化了整個數(shù)據(jù)集的一個子集,而缺少可視空間中索及文獻(xiàn)和未索及文獻(xiàn)之間的關(guān)聯(lián)。然而,如果數(shù)據(jù)庫中的數(shù)據(jù)量如同因特網(wǎng)上的數(shù)據(jù)量那般龐大,那么就很難可視化整個數(shù)據(jù)庫,此時第一種模式可能更加適用。第二種模式的優(yōu)點之一在于它提供了對整個數(shù)據(jù)庫的一個整體觀察,并且保持了進(jìn)一步探究未索及文獻(xiàn)的語義線索。第三種模式?jīng)]有通過提問搜索滿足用戶的特殊需求。
信息可視化是一個正在迅速發(fā)展的領(lǐng)域,其目的在于充分利用人類感知系統(tǒng)的能力來理解抽象信息。可視化超越了視覺的邊界幫助人們理解復(fù)雜信息,因為可視展示不只是一張簡單的圖片而已,它更是內(nèi)心思維的反映??梢暬乇芰巳祟愐曈X的缺陷并提高了人類視覺的能力。信息檢索可視化、形象化之后就是信息空間,因而信息檢索可視化反映了信息空間的空間特性,并為瀏覽提供了天然的理想環(huán)境。
參 考 文 獻(xiàn)
[1][美]Jin Zhang.信息檢索的可視化[J].科學(xué)出版社,2009(4)
[2]王知津編著.信息存儲與檢索[J].機械工業(yè)出版社,2009(2)
[3]馬費成主編.信息管理與信息系統(tǒng)研究進(jìn)展[J].武漢大學(xué)出版社,2010(2)