文 鄧小軍
語義搜索是指搜索引擎的工作不再拘泥于用戶所輸入請求語句的字面本身,而是準確地捕捉到用戶所輸入語句后面的真正意圖,并以此來進行搜索。
在互聯(lián)網(wǎng)高度發(fā)達的今天,面對網(wǎng)絡上浩瀚的信息洪流,人們早已習慣于運用搜索引擎來搜索和篩選信息,“無網(wǎng)不搜”已成為互聯(lián)網(wǎng)的一大特征和一道風景。隨著人們需求的日益增強,搜索引擎也在發(fā)生著明顯的變化,從最初的簡單化的對詞條的搜索、羅列,發(fā)展為對搜索結果更準確的定位和排序,繼而從單一的詞條搜索延伸出專業(yè)化的詞條篩選,直至圖片搜索等。而如今,在以上的種種搜索方式之后,一個新的熱點又引起搜索引擎從業(yè)者和用戶的廣泛關注,那就是語義搜索。
何謂語義搜索?語義搜索是指搜索引擎的工作不再拘泥于用戶所輸入請求語句的字面本身,而是透過現(xiàn)象看本質(zhì),準確地捕捉到用戶所輸入語句后面的真正意圖,并以此來進行搜索,從而更準確地向用戶返回最符合其需求的搜索結果。
語義搜索相對于傳統(tǒng)的詞條搜索,具有了更高的“智能性”。對搜索引擎而言,要實現(xiàn)語義搜索,須要在海量的詞條之間判斷出相互間的關系,從而推斷出相對準確的語義,繼而進行搜索并給出結果。這樣的方式顯然比簡單的比對詞條的吻合度要復雜和“靈活”得多,因此在較長時間里被認為難以實現(xiàn)。
Kngine語義搜索引擎的問世被業(yè)界稱之為Web 3.0時代的搜索引擎,號稱能提供“更加有用的信息”,正在成為語義搜索行業(yè)的領軍者。
國外試用者提供的資料顯示,Kngine的語義搜索在當前達到了令人驚訝的程度,當輸入“Founders of Twitter”(Twitte的創(chuàng)始人)時,Kngine列出了Twitter三位創(chuàng)始人的名字和照片。當輸入“Who is the director of 2012(movie)?”(誰是電影《2012》的導演)時,Kngine不僅給出了羅蘭·艾默里奇的名字,并且列出了這部電影的劇照、影片類別、出品公司等信息。
使用者反映,Kngine在進行語義搜索時,會參考或直接調(diào)用維基百科、IMDB、elyric等網(wǎng)站的信息,從而令搜索結果更準確,也使其的搜索范圍較為廣泛。從目前的情況看,歷史、影視、歌詞、手機配置、汽車車型、股票、天氣、體育賽事等可能通過Kngine進行語義搜索。Kngine透露,目前在語義搜索引擎資料庫中已擁有超過12 億項數(shù)據(jù),以及超過800萬個概念,包括7 萬個公司、70萬部電影、超過110萬個人、45萬個地點和15萬本書的信息。
>> 語義搜索會不會是未來搜索引擎的發(fā)展趨勢?
毫無疑問,語義搜索代表著搜索引擎的一個發(fā)展方向,是搜索引擎的一次具有革命性的跨步,它將搜索引擎的概念從固化的詞條搜索攀升到智能問答的高度。用戶可以更為隨意地向語義搜索引擎提出各種問題,并實時地得到解答和幫助,這更符合我們的生活習慣,也更加親切和具備“人性關懷”。
不過也應該看到的是,語義搜索作為一個新生的搜索引擎,在各方面仍然有著各種不可避免的缺陷。相對于詞匯,語義在理解上具有更高的難度,每個人都不同詞匯組成的語義都存在著理解上的差異,要想讓搜索引擎準確地迎合每個人都語義的判斷就更加難上加難。其次,世界上各類語言、文字間也存在很大的差異,特別是對于漢語這種語義復雜的語言來說,語義搜索要想高效而準確理解用戶給出的意義顯得猶為困難。
但不論如何,語義搜索已經(jīng)邁出了可喜的一步,隨著科技步伐的前行,我們深信語義搜索在不久之后必將成為網(wǎng)絡中的主流搜索方式。