人物搜索鋪開(kāi)了一張包羅萬(wàn)象的大網(wǎng),這種全新的使用體驗(yàn),就像DOS系統(tǒng)到Windows的革命一樣。
有人的地方就有江湖,人物搜索的江湖越來(lái)越熱鬧了。
人物搜索與一般的搜索引擎服務(wù)不同,內(nèi)容只限于和人有關(guān)的信息。幾乎只要是在互聯(lián)網(wǎng)上出過(guò)名的人,就有可能搜到他或她的人際關(guān)系圈、所在的組織機(jī)構(gòu)、頭銜、作品信息等等。而除了具體的人名,還可以通過(guò)關(guān)鍵詞來(lái)匹配相關(guān)的人物,比如在搜索“最?!钡娜藭r(shí),就會(huì)出現(xiàn)具備相關(guān)特征的人物結(jié)果,如最牛的釘子戶(hù)某某、最牛的散戶(hù)某某、最牛的校長(zhǎng)某某某等。
從全球的范圍來(lái)看,目前微軟占整個(gè)互聯(lián)網(wǎng)搜索市場(chǎng)的份額還不到10%,從搜索業(yè)務(wù)得到網(wǎng)絡(luò)廣告銷(xiāo)售份額僅為5%,但這并不妨礙微軟在谷歌顧及不到的人物搜索上大有作為。
8月中旬,微軟發(fā)布了“追趕谷歌”戰(zhàn)略。微軟負(fù)責(zé)搜索與廣告的高級(jí)副總裁Nadella表示,新增投資和新的深度搜索技術(shù)將幫助微軟從搜索市場(chǎng)巨頭谷歌(www.g.cn)手中獲取份額。
雖然Nadella并未表明具體的產(chǎn)品和策略,人立方的推出意味著微軟在中國(guó)搜索市場(chǎng)已經(jīng)有所行動(dòng)了,第一個(gè)版本的推廣有種“潤(rùn)物細(xì)無(wú)聲”的感覺(jué),隨著使用人數(shù)的增多和用戶(hù)口口相傳,這種后發(fā)先至的壓力讓谷歌、百度無(wú)法再熟視無(wú)睹。
大玩具
微軟人立方關(guān)系搜索目前最大的亮點(diǎn)在于趣味性。
從超過(guò)十億的中文網(wǎng)頁(yè)中自動(dòng)的抽取出人名、地名、機(jī)構(gòu)名以及中文短語(yǔ),并且通過(guò)算法自動(dòng)計(jì)算出它們之間存在關(guān)系的可能性,同時(shí)索引了支持它們之間關(guān)系的網(wǎng)頁(yè)文字。無(wú)論是曾經(jīng)在網(wǎng)上曝光過(guò)的親朋好友,或者人們飯后談資里出現(xiàn)過(guò)的花邊緋聞,都可以通過(guò)連線(xiàn)產(chǎn)生交集表現(xiàn)出來(lái)。經(jīng)過(guò)加工處理的結(jié)果用可視化的方式展現(xiàn),打破了人們常規(guī)的從海量重復(fù)的搜索結(jié)果中撿取有效信息的麻煩。
奧運(yùn)期間,微軟人立方搜索推出中國(guó)運(yùn)動(dòng)員的“全家?!?,這個(gè)獨(dú)具特色的人物關(guān)系圖像是散落在銀河中的星座。每個(gè)人以一個(gè)圓圈代表,以不同的人物用不同的顏色體現(xiàn)出來(lái),顏色越不同,人物關(guān)系關(guān)聯(lián)性越弱。以搜索對(duì)象為圓心,從每個(gè)圓圈向四周散射出若干連線(xiàn),發(fā)射出的輻射線(xiàn)條多少和半徑體現(xiàn)人物的熱度和受關(guān)注的程度。作為微軟亞洲研究院的研究員,聶再清博士把人立方的開(kāi)發(fā)看成一種偶然,并沒(méi)有過(guò)多的考慮商業(yè)應(yīng)用的因素?!拔④浀腖ibra學(xué)術(shù)搜索(libra.msra.cn)做得很成功,后來(lái),為了讓這種應(yīng)用更加大眾化,我們?cè)?006年5月份開(kāi)始做人物搜索。人立方這個(gè)名字也是我們一位同事在午飯閑聊時(shí)想到的,后來(lái)越發(fā)覺(jué)得貼切?!甭櫜┦繉?duì)記者說(shuō)。三人成眾,立方代表冪的加乘,而這既體現(xiàn)了六度分隔的無(wú)限關(guān)系,也預(yù)示了未來(lái)搜索引擎將吸收網(wǎng)友的力量。
微軟這個(gè)獨(dú)具賣(mài)點(diǎn)的人物關(guān)系圖采用的是Adobe(www.adobe.com.cn)的Flash而不是微軟自身的Silverlight。聶博士不以為意,“從做研究的角度來(lái)考慮,F(xiàn)lash符合當(dāng)時(shí)做程序的人的使用習(xí)慣,而且Silverlight當(dāng)時(shí)還只是個(gè)Beta版本,沒(méi)有正式發(fā)布。未來(lái)實(shí)現(xiàn)上,人立方搜索關(guān)系圖會(huì)改回Silverlight?!?/p>
繪圖譜
“人立方與傳統(tǒng)搜索技術(shù)的不同在于傳統(tǒng)的搜索引擎不會(huì)把人在互聯(lián)網(wǎng)上的信息總結(jié)得那么好。從幾十億的網(wǎng)頁(yè)中自動(dòng)地抽取結(jié)構(gòu)化的知識(shí)并用于搜索中是一次全新的嘗試。將來(lái),我們會(huì)把索引網(wǎng)頁(yè)從10億擴(kuò)大到100億。那時(shí)我相信絕大部分的用戶(hù)都會(huì)用人立方來(lái)查詢(xún)與人相關(guān)的互聯(lián)網(wǎng)信息。”聶再清充滿(mǎn)信心地說(shuō)?,F(xiàn)在人立方抽取網(wǎng)頁(yè)中人名的準(zhǔn)確率是97%,其中的主要障礙就是搜索對(duì)象的身份識(shí)別問(wèn)題,即如何解決重名的現(xiàn)象。
在姚明的關(guān)系圖譜中,出現(xiàn)了麥克格雷迪和麥蒂兩個(gè)關(guān)系,這兩個(gè)不同的名字指向的是同一個(gè)人。在其中的一條關(guān)系線(xiàn)中,姚明和李宇春因?yàn)椤靶置谩钡年P(guān)系聯(lián)系了起來(lái),因?yàn)椤叭藗兌颊f(shuō)姚明的妹妹是李宇春?!币詫O悅為例,當(dāng)在搜索框中輸入“孫悅”時(shí),關(guān)系圖中可以看到與孫悅有關(guān)的好友、戀人、隊(duì)友等人際關(guān)系。同一個(gè)名字指向的是兩個(gè)現(xiàn)實(shí)生活中不同的人,一個(gè)是歌手,一個(gè)是籃球隊(duì)員。
針對(duì)這種問(wèn)題,聶再清表示,人立方的第二個(gè)版本會(huì)解決掉重名人的身份識(shí)別難點(diǎn),抓取信息的時(shí)候識(shí)別有價(jià)值的網(wǎng)頁(yè),而不是抓取BBS上的口水帖和虛假信息。
搜商
以人為對(duì)象的信息搜索繞不開(kāi)隱私權(quán)的問(wèn)題。
2007年9月,F(xiàn)acebook(www.facebook.cn)宣布允許非會(huì)員公開(kāi)搜索用戶(hù)信息。這些信息包括用戶(hù)的個(gè)人檔案和照片等,而用戶(hù)也可以通過(guò)改變隱私設(shè)置停止搜索引擎索引其信息,現(xiàn)在的校內(nèi)網(wǎng)也具有這項(xiàng)功能。與微軟和雅虎(www.yahoo.cn)的人物搜索不同,SNS網(wǎng)站提供的人物搜索服務(wù)基于用戶(hù)對(duì)自身信息的設(shè)置并且可以隨時(shí)修改,這與抓取網(wǎng)頁(yè)的搜索方式相比多了些可控制的因素。國(guó)內(nèi)的人物搜索網(wǎng)站還有中國(guó)人同學(xué)錄搜索(alumni.chinaren.com)和百度空間搜人找人(hi.baidu.com/sys/uquery)等。
Spock網(wǎng)站的用戶(hù)可以添加信息或?qū)梢运训饺宋锏恼掌?、tag、網(wǎng)上資料、相關(guān)人物等的準(zhǔn)確度進(jìn)行投票,自己可以“認(rèn)領(lǐng)”這些信息,進(jìn)行修改。
“人物搜索會(huì)更多地幫助那些無(wú)心找隱私的人。如果不希望被放上去,可以選擇不被檢索。”聶再清說(shuō)。
微軟數(shù)次提出收購(gòu)雅虎搜索業(yè)務(wù)可以證明在搜索市場(chǎng)上的野心。而人物搜索網(wǎng)站不單要解決同名識(shí)別等技術(shù)問(wèn)題,還需把一個(gè)成熟的市場(chǎng)培養(yǎng)起來(lái),將用戶(hù)一時(shí)興起的八卦心態(tài)轉(zhuǎn)化為穩(wěn)定的使用習(xí)慣。
在人物搜索的市場(chǎng)上,拋開(kāi)錯(cuò)綜的商業(yè)布局,微軟亞洲研究院最終的目標(biāo)就是把網(wǎng)頁(yè)搜索一行行的展示,變成對(duì)象搜索平面關(guān)系的鋪展,“用戶(hù)這種不同的使用體驗(yàn)對(duì)于搜索引擎來(lái)說(shuō),就像DOS系統(tǒng)到Windows的革命一樣。”