2012年5月,谷歌公司通過其官方博客正式發(fā)布搜索頁面的新功能——知識圖譜(Mapping Knowledge Domain)。這可能是谷歌搜索引擎上線以來最大的一次改革。
什么是知識圖譜?
知識圖譜也被稱為科學知識圖譜,是顯示知識發(fā)展進程與結構關系的一系列不同的圖形,用可視化技術描述知識資源及其載體,挖掘、分析、構建、繪制和顯示知識及它們之間的相互聯系。具體來說,知識圖譜是把應用數學、圖形學、信息可視化技術、信息科學等學科的理論與計量學引文分析等方法結合,用可視化的圖譜形象地展示學科的核心結構、發(fā)展歷史、前沿領域以及整體知識架構的多學科融合的一種研究方法。它把復雜的知識領域通過數據挖掘、信息處理、知識計量和圖形繪制顯示出來,揭示知識領域的動態(tài)發(fā)展規(guī)律,為學科研究提供切實的、有價值的參考。
下面我們先來舉一個實例進行說明,比如我們在谷歌搜索框里輸入“十三陵”,以往只能在搜索結果頁面顯示10多個由標題、鏈接以及與關鍵詞相關的簡短內文片段組成的搜索結果。雖然現在搜索頁面也會插入圖片等結果,不過搜索結果大體上依然通過文字簡介的形式提供。
如果使用知識圖譜搜索則不同,當我們輸入“十三陵”后,除了在搜索結果頁面顯示相關的文字信息外,在搜索頁面右欄還直觀地顯示出十三陵在地圖上的位置、來自維基百科的文字簡介、建筑相關信息表(高度、開放時間、設計師等)。頁面下方還有與十三陵相關的歷史古跡和旅游景點,讓用戶可以全面了解十三陵。
再比如我們輸入“電腦”這個關鍵詞,谷歌除了在搜索結果頁面顯示電腦的相關信息,還會在頁面右側顯示我們所在城市的各個電腦賣場位置,給用戶購買電腦提供方便。
從用戶角度來看,知識圖譜的好處顯而易見。我們能夠直接獲得搜索內容的基本信息匯總,而不用根據文字片段和網站名稱判斷究竟哪個鏈接最有價值,然后再打開新頁面人工過濾頁面內的有價值信息。
知識圖譜的演變
知識圖譜是谷歌在2010年收購了開放式數據庫公司Metaweb后發(fā)展而來的。Metaweb當時主要專注于將不同文字表述與同一個實體連接起來,并探索這些實體的屬性(例如明星的年齡)以及彼此之間的聯系,最終提供一種新的搜索形式。雖然不能完全替代關鍵詞搜索,但Metaweb的索引、搜索方法在處理諸如“身高160厘米以下的女星”、“喬布斯愛看什么書”之類的搜索時更高效。Metaweb的主要信息來源是 Freebase(一個創(chuàng)作共享類網站,所有內容都由用戶添加,采用創(chuàng)意共用許可證,可以自由引用),但谷歌知識圖譜的信息來源要寬廣得多,不僅包括 Freebase、維基百科等公共資源,也從其他網頁搜集整理了大量信息。谷歌目前已經搜集了35 億條信息。
知識圖譜的搜索效果
了解了知識圖譜的相關知識后,我們再來看知識圖譜會帶來哪些搜索效果。
快速過濾出最想要的信息
當用戶輸入一個模糊的關鍵詞,這樣的一個搜索請求可能會代表多重含義,知識圖譜能夠理解這其中的差別,并可以將搜索結果范圍縮小到用戶最想要的那種含義。
快速查看到最全面的摘要
有了知識圖譜,谷歌可以更好地理解用戶搜索的信息并總結出與搜索話題相關的內容,為用戶找出更加準確的信息,做出全面的總結并提供更有深度的相關信息。例如,當用戶搜索“瑪麗·居里”時,不僅可以看到居里夫人的生平信息,還能獲得關于其教育背景和科學發(fā)現方面的詳細介紹。此外,知識圖譜還會幫助用戶了解事物之間的關系。
讓搜索更有深度和廣度
由于知識圖譜構建了一個與搜索結果相關的完整的知識體系,融合了很多學科,把與關鍵詞相關的知識體系系統(tǒng)化地展示給用戶。所以用戶往往會獲得意想不到的發(fā)現。在搜索中,用戶可能會了解到某個新的事實或新的聯系,促使其進行一系列的全新搜索查詢。
總之,傳統(tǒng)的機械羅列信息的人工網站遲早會被技術進步所淘汰,谷歌知識圖譜提供的簡練歸納既會激發(fā)用戶興趣,又能為用戶提供更便捷、直觀、系統(tǒng)的搜索方式。美中不足的是,搜索引擎直接提供最終信息必然引來第三方網站的擔憂,那么第三方網站是否會受到影響只能等待時間的檢驗。
【責任編輯】趙新宇