本刊記者 王銀鳳
近幾年,云計算在世界范圍內都非常熱門。云計算(cloud computing)是基于互聯(lián)網(wǎng)的相關服務的增加、使用和交付模式,通常涉及通過互聯(lián)網(wǎng)來提供動態(tài)易擴展且經(jīng)常是虛擬化的資源。云是網(wǎng)絡、互聯(lián)網(wǎng)的一種比喻說法。狹義云計算指IT基礎設施的交付和使用模式,指通過網(wǎng)絡以按需、易擴展的方式獲得所需資源;廣義云計算指服務的交付和使用模式,指通過網(wǎng)絡以按需、易擴展的方式獲得所需服務。這種服務可以是IT和軟件、互聯(lián)網(wǎng)相關,也可以是其他服務。
目前全世界所有的國家都采用分享帶寬的共享信息的機制。帶寬是一種物質性能資源,享用的人多了就會出現(xiàn)有你沒有我的沖突,共享信息的速度就要慢下來。
與此同時,目前幾乎每個人都擁有數(shù)據(jù)庫,比如手機、PC機,或者IPAD機都有存儲功能,這意味著個人擁有數(shù)據(jù)庫的年代已經(jīng)來到。www已經(jīng)給人類提供了一個各獻所知的大數(shù)據(jù)環(huán)境,能不能把www全世界范圍的網(wǎng)變成個人的私有財產,即能不能使得全民能得到普遍的普惠的各取所需?
記者從此次創(chuàng)新論壇中了解到,這種不限共享分數(shù)的信息分發(fā)機制其實是存在的,那就是播存結構,在科學上擺脫物質分配或者帶寬分配的思維。
從2006年開始,李幼平、陳思剛、倪光南和張耀群四位院士對這個問題做了認真的研究,并得出了以下結論:
第一,文化服務占用互聯(lián)網(wǎng)大半帶寬。
第二,文化服務聚焦前一千種的網(wǎng)站。
第三,衛(wèi)星廣播有能力推送前一千種網(wǎng)站當天內容。衛(wèi)星廣播有能力通過輻射,地面又有儲存器,只要發(fā)明一個選擇的漏斗,這樣互聯(lián)網(wǎng)得到一個巨大的突破,有可能未來互聯(lián)網(wǎng)就形成一個以計算機通訊為主的IP結構,還會加上以廣播和儲存為主的BS結構。
第四,一旦個人成為現(xiàn)實,播存結構將幫助電信網(wǎng)分擔流量,并成為IP結構的次級結構。
從哪入手呢?李幼平院士介紹到:互聯(lián)網(wǎng)從內容的緯度來看,互聯(lián)網(wǎng)或者是萬圍網(wǎng)有三層結構,一個是網(wǎng)站,每個網(wǎng)站底下都有很多欄目,欄目下面才是網(wǎng)頁,欄目是重要的結構?,F(xiàn)在每個網(wǎng)站都有自己的欄目,比如百度網(wǎng)大的欄目有財經(jīng)、軍事,小的比如女人也是一個欄目,一個話題,大家根據(jù)話題分類學的辦法來選擇自己的需求。
只要經(jīng)常統(tǒng)計個人最喜歡到哪個網(wǎng)站去看哪個欄目,就可以對個人的欄目進行排序,獲取個人最有興趣的欄目。故研究人員可以做一個內容漏斗——UCL(Uniform Content Label),統(tǒng)一的內容標簽。可以從一個無限的網(wǎng)頁中根據(jù)個人的需求,根據(jù)昨天、前天的行為判斷明天、后天的需求,定制滿足個人的需求內容。
李幼平院士還表示,要達到這樣的目標,需要發(fā)明一個工具,雖然已經(jīng)研究很多年,還沒有最后成熟。李院士把它叫做UCL,統(tǒng)一的內容標簽。它是一個簡短的數(shù)據(jù)包,即一種貫穿網(wǎng)站、欄目和網(wǎng)頁三層結構的一種代碼,人類智慧的一種代表。
這個可以用中國的國家標準GB/T20092代碼的基礎上形成一個國家監(jiān)管機構統(tǒng)一注冊頒發(fā)的代碼,這個代碼要是能夠被證實和發(fā)明出來,將會在無限的網(wǎng)絡中選擇每一個自己有限的需要去做工作,跟現(xiàn)在所有的搜索引擎概念完全是兩回事。
怎么做呢?目前Internet都有一個邊緣網(wǎng)或者服務器客戶機結構,工作流程如圖所示,C客戶機如果需要一個網(wǎng)頁就把它的URL告訴S, S就到Internet經(jīng)過K跳路由拿到這個網(wǎng)頁給S,然后S再還給客戶機,完成一個從遠處取來網(wǎng)頁的過程。
如果添加多層結構,就是廣播一些熱門的內容,一方面把它的全文告訴服務器,一方面把它的標簽告訴客戶機,客戶機得到標簽,標簽規(guī)定的UCR里面有它的標簽和摘記,人們就可以產生新的要求,C就會告訴我要這個網(wǎng)頁,這個時候由廣播同時要把全文交給接受服務器,因此這個接受服務器S就直接給終端服務器回答,用不著通過K跳路由。就把Internet跳過,直接用邊緣的存儲把內容給個人的網(wǎng)庫。這就是說分擔流量的機制。
非常遺憾的是,萬維網(wǎng)發(fā)明了20年,Web服務一直采用點對點的,你需要什么,請你把URL給我,我用URL到遠處把這個網(wǎng)頁拿來。另外的人如果需要同樣的網(wǎng)頁,他又來一次,他不知道聚類學的生產。
1998年,Watts在頂級雜志上發(fā)表一篇文章,發(fā)現(xiàn)Collective Dynamics 是小世界的成因,感悟網(wǎng)絡也是“可聚類”的。因此如果用這種可聚類的思想,就是用廣播和存儲來代替這種完全個案的Internet訪問,有可能使個案生產的web服務大踏步進入工業(yè)化的全新年代,現(xiàn)在web服務還是個案生產,你要你的,他要他的,可能上海市一天有一萬人同時要向新浪網(wǎng)要同樣一個網(wǎng)頁,它是一個一個來服務,其實完全相同內容的網(wǎng)頁在完全相同的上海和北京這兩個路徑中間一天要冗余的、毫無疑義的走一千次甚至一萬次。
總之,這個聚類概念和聚類計算是祖先留給我們的財富。畢升的聰明過人之處在于,他把單個的漢字當成可聚可分的最小單元,而現(xiàn)在,UCL聚類計算是把網(wǎng)頁當成一個可聚可分的單元,讓13億同胞可以自由的拆卸和裝備,個案生產的電信網(wǎng)絡可以變成一個工業(yè)生產時代。大家都說信息化帶動工業(yè)化,李院士卻表達了相反的觀點,在十年里看信息化本身要進行工業(yè)化。如果工業(yè)化聚類概念把網(wǎng)頁服務一個一個去拿的概念改革掉,巨大的生產力就會迸發(fā)出來。
www是一個人類的偉大發(fā)明,它幾乎是給人類提供了一個各獻所知的大環(huán)境。從信息意義上的各盡所能、各獻所知,我們中國科學技術工作者有沒有可能發(fā)明普惠全民的各取所需呢?
因此創(chuàng)造不限人數(shù)的播存結構也許是個起點。播存結構是一個只有中國做得最有深度的研究領域,現(xiàn)在還在基礎研究階段,總有一天它會用這個域名聚類的計算概念把有限的域名聚類不斷出現(xiàn)的大數(shù)據(jù)網(wǎng)頁。中國有兩句話,一個叫博大精深,李院士認為互聯(lián)網(wǎng)IP網(wǎng)就是博大精深;他希望年輕人做另外一句話——大道至簡。網(wǎng)上東西非常多,但每個人需要的就那么一點,因此發(fā)明漏斗,直接向個人提供有興趣的內容,將來完成各獻所知,各取所需是一個偉大的前景。