美國1990年普利策新聞獎得主戴維.懷斯在2007年出版了一本名叫《撬動地球的Google》的暢銷書,意在傳達Google的出現(xiàn)對信息世界和人們獲取各種信息的方式帶來的革命性影響。而今,已于近期發(fā)布公共預覽版的同樣提供搜索服務的Powerset給人們留足了想象和期待空間,猜測和觀望著它是否能成為撬動Google江湖地位的下一代搜索引擎領域的霸主。
位于美國舊金山的搜索引擎公司Powerset挑戰(zhàn)Google的核心技術就是“自然語言處理技術”,理論上這種技術可擁有理解人類所使用的自然語言含義的能力,而這也正是Powerset與Google本質上的區(qū)別。Google使用的是PageRank技術,即通過統(tǒng)計學方法計算用戶所搜索的關鍵詞在網(wǎng)頁中出現(xiàn)的頻率,利用關鍵詞進行搜索的結果導致用戶往往不能真正得到想要的結果。而利用“自然語言處理技術”,用戶可以直接輸入想問的問題進行搜索,比如搜索“誰收購了IBM”,Google給出的結果是被IBM收購的那些公司信息和新聞,甚者還包括了很多毫無關系的分別匹配“IBM”和“收購”兩個關鍵詞的結果,因為Google不能分析出主語和賓語之間的關系;而Powerset的優(yōu)勢就在于此,它給出的結果是那些收購IBM業(yè)務的公司信息和新聞,比如聯(lián)想和ATT與IBM合作的信息。盡管Google一直以來都在苦苦研究自然語言處理技術,但至今為止,我們還沒看到這種技術被應用于Google的搜索引擎里。這一次,Powerset走在了Google前面。
其實早在上世紀90年代,就已經出現(xiàn)了利用自然語言進行搜索的網(wǎng)站,其中最著名的當屬美國的AskJeeves.com,但由于當時還沒有掌握核心技術和正趕上互聯(lián)網(wǎng)泡沫的破滅,該公司轉而使用關鍵詞搜索,也就是現(xiàn)在的Ask.com。比較近期的還有Hakia.com,也曾致力于自然語言研究,但Hakia在應用語言規(guī)則并對分類進行定義以縮小搜索范圍方面差強人意,因而沒有引起多大反響。中國的百度在2000年時也曾經大力協(xié)助當時的ChinaRen.com推出了一個名為“孫悟空搜索”的提問式搜索引擎,但當時的技術仍比較粗淺,還不能給用戶提供很好的體驗,所以最終也就沒有了聲音。
而此次Powerset受到了如此多的關注,并被喻為“比Google還好用的搜索引擎”,大部分原因是因為它已經正式獲得了施樂公司旗下著名的帕洛阿爾托研究中心(PARC,Palo Alto Research Center)所研發(fā)的自然語言處理技術的獨家使用權,此技術號稱是當今最領先的自然語言處理系統(tǒng)。PARC以一些突破性的發(fā)明,如電腦鼠標、個人電腦繪圖界面等而聞名。同時,PARC的頂級自然語言專家Ronald Kaplan現(xiàn)在是Powerset的首席技術執(zhí)行官。
當然到目前為止,在傳統(tǒng)關鍵詞搜索市場中,Google的領先地位毋庸置疑,但要模仿Google的PageRank技術也不是一件難事,Powerset很可能會在應用自己的自然語言搜索技術的同時,結合Google的搜索技術,這將大幅度提高搜索結果的準確性和關聯(lián)性,對Google造成威脅。Powerset目前的團隊成員里就有來自Yahoo!等其他傳統(tǒng)搜索公司的技術專家,一場惡戰(zhàn)必將打響。2006年11月,Powerset獲得了來自Foundation Capital、Founders Fund和其他天使投資人的1250萬美元首輪風險投資,而網(wǎng)站也將在2008年正式推出。
但也有業(yè)內人士指出,在目前自然語言處理技術未完善和成熟之前,一切定論都還言之過早,畢竟根據(jù)2007年8月的數(shù)據(jù)顯示,Google在搜索引擎領域的市場占有率仍然高達54.5%,且近幾年在搜索技術改良方面已累計投入22億美元。Powerset即使能夠提供完善的自然語言搜索技術,但作為搜索引擎市場的一支新秀,要想挑戰(zhàn)Google還尚需時日。