胡泳 管理學(xué)者,作家
在語(yǔ)義網(wǎng)中,網(wǎng)絡(luò)變得聰明了,似乎被置入了某些推理能力?;蛟S將來(lái)某個(gè)時(shí)候,具備人工智能的軟件代理人會(huì)替你在線(xiàn)處理所有繁雜的商業(yè)和個(gè)人事務(wù)
語(yǔ)義網(wǎng)是萬(wàn)維網(wǎng)的延伸,不僅可用自然語(yǔ)言表現(xiàn)網(wǎng)絡(luò)內(nèi)容,而且這些內(nèi)容還可以被軟件代理人(software agent)所閱讀和使用。萬(wàn)維網(wǎng)的創(chuàng)始人蒂姆·伯納斯·李將網(wǎng)絡(luò)看做一種數(shù)據(jù)、信息和知識(shí)交換的萬(wàn)有媒介,可以說(shuō),語(yǔ)義網(wǎng)完全符合他的這一夢(mèng)想。
伯納斯·李和兩位合作者在2001年發(fā)表于《科學(xué)美國(guó)人》的一篇文章中,描繪了軟件代理人漫游在網(wǎng)絡(luò)之中,替主人安排旅行、預(yù)約大夫、并在電話(huà)鈴響起時(shí)關(guān)閉音響的情景。語(yǔ)義網(wǎng)的作用第一次得到有力闡釋。這是一種偉大的遠(yuǎn)見(jiàn),但它在今天的互聯(lián)網(wǎng)上還無(wú)法實(shí)現(xiàn)。
雖然目前萬(wàn)維網(wǎng)通過(guò)你的指尖所傳遞的東西之多堪稱(chēng)奇跡——你可以找到挪威人對(duì)冰激凌的奇怪稱(chēng)呼、下一班去巴黎飛機(jī)上的好座位、你長(zhǎng)期心儀的CD令人難以置信的價(jià)格,但它卻無(wú)法避免一個(gè)根本性的缺陷——萬(wàn)維網(wǎng)基本上是由數(shù)以?xún)|計(jì)的文本概要構(gòu)成的,這些文本只能為人所讀。當(dāng)然,你可以搜索關(guān)鍵詞,但如果你不去瀏覽一條條的搜索結(jié)果,還是不可能找到自己想要的信息。
如果網(wǎng)絡(luò)體驗(yàn)想要再上層樓,這些文本中的信息必須被轉(zhuǎn)換成為機(jī)器也能夠加以閱讀和評(píng)估的數(shù)據(jù)。只有到了這一步,電腦才能接過(guò)我們現(xiàn)在手工從事的任務(wù):找到離我們最近的餐館,預(yù)訂最佳的航班,買(mǎi)到最便宜的CD,等等。像G oogle這樣的服務(wù)在篩選網(wǎng)頁(yè)方面干得非常出色,但仍然只有人才能識(shí)別最終的目的物,也只有人才能把信息加以組合,比方說(shuō),計(jì)劃一場(chǎng)早該實(shí)施的滑雪。
萬(wàn)維網(wǎng)還不那么如人意,一個(gè)人的網(wǎng)頁(yè)與他人的網(wǎng)頁(yè)沒(méi)什么不同。某個(gè)網(wǎng)頁(yè)可能擁有較高的Google排名,但網(wǎng)頁(yè)與網(wǎng)頁(yè)之間不存在基于“意義”(meaning)之上的差別。伯納斯·李預(yù)想中的語(yǔ)義網(wǎng)更像是一組組互聯(lián)的數(shù)據(jù)庫(kù),所有信息都以某種結(jié)構(gòu)化的方式存在其中。結(jié)構(gòu)可以被有“意義”地描述出來(lái),令電腦也能夠明白。
在語(yǔ)義網(wǎng)上,一個(gè)人不再是當(dāng)你搜索他時(shí)出現(xiàn)在眾多網(wǎng)頁(yè)中的一個(gè)名字。他是一組聯(lián)系,聯(lián)結(jié)著他的工作場(chǎng)所、他的熟人、他的好友、他的日程,以及他所感興趣的東西。能夠把這些可見(jiàn)與不可見(jiàn)的事物串聯(lián)在一起,正是語(yǔ)義網(wǎng)的威力所在。
舉個(gè)例子,你想為一場(chǎng)即將舉行的會(huì)議安排晚宴。眼下你的做法是翻開(kāi)通訊錄,然后發(fā)一圈電子郵件詢(xún)問(wèn)誰(shuí)能參加,別人可能回信對(duì)晚宴的時(shí)間和地點(diǎn)提出意見(jiàn)。就這樣來(lái)來(lái)回回,所有人最終同意了某種安排,這時(shí)再專(zhuān)門(mén)去訂位。
在語(yǔ)義網(wǎng)中,你的軟件代理人事先就知道如何安排一場(chǎng)晚宴。它拿到會(huì)議參加者的名單,從中選出可能要邀請(qǐng)的人。它甚至可能檢索你的通訊錄中是否有在會(huì)議舉辦地附近居住的朋友,一并邀請(qǐng)他們進(jìn)來(lái)。一旦邀請(qǐng)名單被你確認(rèn),軟件代理人會(huì)通過(guò)一個(gè)日程庫(kù)與被邀請(qǐng)者的代理人商量晚宴的時(shí)間,從餐廳數(shù)據(jù)庫(kù)中根據(jù)排擋期和你的個(gè)人口味擇定餐廳,訂好位子,然后為參加者寄出方向圖。
不妨把這其中的差別想象為二維和三維的差別。人們可以看到,萬(wàn)維網(wǎng)變得聰明了,似乎被置入了某些推理能力。將來(lái)某個(gè)時(shí)候,具備人工智能的軟件代理人會(huì)替你在線(xiàn)處理所有繁雜的商業(yè)和個(gè)人事務(wù)。
那些相信語(yǔ)義網(wǎng)的人將此當(dāng)做一種顛覆性技術(shù),可以用以擊敗現(xiàn)在的互聯(lián)網(wǎng)巨頭如Google和雅虎。而懷疑者則將其當(dāng)做一場(chǎng)白日夢(mèng),是對(duì)一個(gè)永遠(yuǎn)也不會(huì)完全得到解決的問(wèn)題的幻想式答案。伯納斯·李提出語(yǔ)義網(wǎng)的構(gòu)想已經(jīng)六七年了,但前面說(shuō)到的服務(wù)場(chǎng)景還不能夠看到。標(biāo)簽(tagging)是個(gè)開(kāi)始,像Flickr這樣的服務(wù)讓我們看到某種粗糙的語(yǔ)義網(wǎng)的樣子。Google Base是另外一個(gè)試圖把語(yǔ)義技術(shù)帶入更廣泛應(yīng)用的例子,它通過(guò)標(biāo)題、屬性、標(biāo)簽、關(guān)鍵字、描述、位置、作者等元素,把用戶(hù)內(nèi)容變成機(jī)器可理解的規(guī)格化語(yǔ)言,再以搜索的方式來(lái)呈現(xiàn)。
把一個(gè)真正的語(yǔ)義網(wǎng)付諸實(shí)施是個(gè)雞生蛋、蛋生雞的問(wèn)題。直到有了足夠的電腦可以讀取的數(shù)據(jù)和使這些數(shù)據(jù)具備意義的超數(shù)據(jù)的出現(xiàn),沒(méi)有人會(huì)創(chuàng)造任何有意思的服務(wù)。語(yǔ)義網(wǎng)中的代理人需要足夠的配料才能做出好吃的點(diǎn)心。
有些機(jī)構(gòu)在做一些有趣的嘗試。亞馬遜想利用語(yǔ)義技術(shù)幫助用戶(hù)搜索自己的數(shù)據(jù)庫(kù),柯達(dá)想用語(yǔ)義標(biāo)簽幫助攝影者在線(xiàn)組織攝影作品,美國(guó)中央情報(bào)局想通過(guò)對(duì)自己的海外竊聽(tīng)數(shù)據(jù)庫(kù)的語(yǔ)義加工,更輕易地篩選出人、地、事之間的聯(lián)系,以提早發(fā)現(xiàn)恐怖主義威脅。但是要讓語(yǔ)義技術(shù)為普通人所用,可能還需要5—7年。到那時(shí),我們就可以讓我們的軟件代理人出發(fā),給我們混亂的數(shù)字化生活帶來(lái)秩序了。