金曉紅 整理
科學(xué)與藝術(shù)之間的一座小橋
——李幼平院士在“網(wǎng)絡(luò)科學(xué)”論壇的講話
金曉紅 整理
由中國傳媒大學(xué)主辦的“2012年中國網(wǎng)絡(luò)科學(xué)論壇”4月27日于北京順利召開。論壇圍繞“探討科學(xué)與藝術(shù)的和諧統(tǒng)一之路”的全新主題,以促進(jìn)我國網(wǎng)絡(luò)科學(xué)與社會科學(xué)、藝術(shù)、傳媒、人文之間的交叉與和諧統(tǒng)一發(fā)展為目的而展開。本次論壇也榮幸邀請到重量級演講嘉賓,網(wǎng)絡(luò)科學(xué)領(lǐng)域?qū)<遥浩渲邪ㄖㄐ偶夹g(shù)專家,中國工程院院士李幼平先生。UCL即“統(tǒng)一內(nèi)容定位”,是數(shù)據(jù)廣播網(wǎng)絡(luò)平臺及IP交互網(wǎng)絡(luò)平臺上實現(xiàn)信息資源組織管理的創(chuàng)新技術(shù)理念,其目標(biāo)是實現(xiàn)網(wǎng)絡(luò)信息資源的“個性化按內(nèi)容主動服務(wù)”。4月27日,論壇開幕的首日,UCL概念的提出者中國工程院李幼平院士在重感冒的情況下為我們帶來了他的精彩演講。以下是李院士的演講內(nèi)容整理:
有一個著名的理論叫六度分離,指地球上任意兩個人之間的平均距離為6。而實測數(shù)據(jù)表明,TCP/IP從工程上實現(xiàn) D 因為受到同胞的影響,令李院士產(chǎn)生了很多的啟示。復(fù)雜網(wǎng)絡(luò)有三個概念,一個叫連接度值,一個叫平均路程,還有一個叫聚類系數(shù),這是該領(lǐng)域三個十分重要的概念。但是他們之間沒有聯(lián)系的。我的同胞中國專家用聚類的概念,把聚類突出來了,用聚類的概念把度值和路徑聯(lián)系了起來,讓連接度大的公共內(nèi)容緩存于網(wǎng)絡(luò)邊緣,這樣就形成了路由跳數(shù)少于3-4跳的小跳環(huán)境。為響應(yīng)建設(shè)“國家公共文化服務(wù)體系”,近年國家已經(jīng)投了幾十億的人民幣做小跳數(shù)。已付諸實施具體工程的有鄔江興院士的ACR,A就是一個大規(guī)模匯集路由器,它既是路由器,又是匯聚服務(wù)器。還有中國科學(xué)院唐輝教授帶領(lǐng)做的在P2P技術(shù)上發(fā)現(xiàn)的PPCache,以及有線電視雙向互動的TVCache等。 可以說小跳數(shù)的環(huán)境在中國已經(jīng)初見端倪,鄔江興從互聯(lián)網(wǎng)的橋頭堡,做一個橋向廣播網(wǎng)靠攏,它的概念就是NGB的概念。那么廣播網(wǎng),也想做一個橋往互聯(lián)網(wǎng)靠攏,就是TV Cache。比如說一個信息,二三四個電視臺都可以連起來,然后你就可以就近地去訪問他。那么唐輝所研究的內(nèi)容就可以在廣播網(wǎng)和互聯(lián)網(wǎng)之間,搭建一個交集小跳數(shù)環(huán)境。 我們希望用小跳數(shù)環(huán)境來幫助未來的互聯(lián)網(wǎng)。公共內(nèi)容的度值服從冪律,而且它的∑都在2.2到2.4之間。然而,傳統(tǒng)TCP/IP不過問內(nèi)容,路由跳數(shù)與連接度無關(guān),造成核心層流量隨網(wǎng)絡(luò)規(guī)模和視頻應(yīng)用呈爆炸性增長,大有“十年千倍”之勢。也就是說2010年到2020年這十年里面流量會增加一千倍。如果用小跳數(shù)這個創(chuàng)意就順應(yīng)冪律了,遷移高度值的常用內(nèi)容,賦以邊緣層攔截常用訪問的強(qiáng)大能力。 這樣就可以希望實現(xiàn)核心層流量明顯回落,QoS和耗能問題均獲轉(zhuǎn)機(jī)。QA是有保證的,因為跳數(shù)少,安全比較好做,能耗問題都可以獲得轉(zhuǎn)機(jī)。更重要的是,在大聚類、大遷移過程中,借助于內(nèi)容指紋,獲得科學(xué)治理互聯(lián)網(wǎng)的機(jī)會。因此就希望國家利用衛(wèi)星廣播的泛在(ubiquitous)分發(fā),發(fā)明“更小跳數(shù)” 的另類技術(shù),形成一個技術(shù)上的突破,在物理上形成一個跟節(jié)點數(shù)無關(guān)的輻射,營造無標(biāo)度(scalefree)無扭斗(no tussle)的未來網(wǎng)絡(luò)環(huán)境。 另外一個很重要的概念就是現(xiàn)在用的URL,URL是定值定位,它的前綴在什么網(wǎng)站,后綴就是在這個網(wǎng)站的服務(wù)器的庫里面怎么拿到這篇文章,基本是定位,要改成內(nèi)容定位,要向著UCL來映射,國家制定統(tǒng)一內(nèi)容標(biāo)簽UCL,使各種小跳數(shù)環(huán)境得以科學(xué)整合。 2006-2009年,李幼平、倪光南、陳式剛、張堯?qū)W四位院士,工程院信息學(xué)部兩個咨詢項目《播存網(wǎng)格工程構(gòu)思》、《信息化推動先進(jìn)文化》,總結(jié)國人實證研究,有三個發(fā)現(xiàn): 1、公共文化服務(wù)占用互聯(lián)網(wǎng)的大半帶寬,這是清華大學(xué)在2006年做的流量表,是用數(shù)據(jù)包的數(shù)目來代表流量,不是用點擊數(shù),就發(fā)現(xiàn)大部分業(yè)務(wù)的帶寬都是給公共文化服務(wù)用的,而真正個人使用的像MSN,通話服務(wù)相對只用很少的帶寬; 2、第二個發(fā)現(xiàn)和第三個發(fā)現(xiàn)是連在一起的:文化服務(wù)聚焦在前一千種網(wǎng)站,而且廣播有能力推送前一千種網(wǎng)絡(luò)。因此就產(chǎn)生了所謂小跳數(shù)的創(chuàng)意,這個創(chuàng)意應(yīng)該歸功于北京的李曉明教授,他很大貢獻(xiàn),他有一個說法是“small can act big”,中文意思是四兩可以撥千斤。阿基米德有一個名言,給我一個支點,我可以橇動地球。就是說存儲,實際上就是一個技術(shù)杠桿,而廣播就是一個支點。李教授統(tǒng)計下來,非視頻類的網(wǎng)頁一篇大概只有15K左右,每天全國產(chǎn)生200萬到300萬種網(wǎng)頁,一共也就是30~50GB,那么一年加起來就是12TB。 對于一個衛(wèi)星頻道而言,24小時推送數(shù)據(jù)就有410GB,遠(yuǎn)遠(yuǎn)大于網(wǎng)頁每天所產(chǎn)生的30~50GB的數(shù)據(jù)量。因此可以拓展李曉明教授所想,用廣播來分發(fā)web博物館。 在以上提到的四位院士里面有兩位是從事核武器研究的,他們就覺得這種想法類似于核武器的次級創(chuàng)新??茖W(xué)家發(fā)現(xiàn),單幾何中心的原子彈難以獲得當(dāng)量可持續(xù)擴(kuò)展,于是,發(fā)明了在第二幾何中心工作的氫彈次級。氫彈次級依靠初級產(chǎn)生的x射線驅(qū)動,實現(xiàn)當(dāng)量的極大拓展。 今天的互聯(lián)網(wǎng)遇到的也是“可拓展性”問題,有必要發(fā)明輻射驅(qū)動的某種次級結(jié)構(gòu)。我們把IP當(dāng)成原創(chuàng)主結(jié)構(gòu)(primary),把廣播存儲當(dāng)成是極大拓網(wǎng)民數(shù)量的次結(jié)構(gòu)(secondary),主次結(jié)構(gòu)之間依靠輻射驅(qū)動。所以通信和廣播、對流和輻射、主和次結(jié)構(gòu)其實是一個很美的相異相成的結(jié)構(gòu)。不同的兩個東西組成一個穩(wěn)定的架構(gòu)就像一男和一女組成家庭,帶正電的原子核和帶負(fù)電子層組成一個穩(wěn)定的原子。以后的網(wǎng)絡(luò)應(yīng)該是通信網(wǎng)和廣播網(wǎng),對流和輻射共同來組成相異相成的一個美好網(wǎng)絡(luò)。 此外,李院士還指出,他們發(fā)現(xiàn)了一個用衛(wèi)星來分化安全指紋的問題。公共內(nèi)容同公共藥品、食品一樣,實施注冊管理,如果能對每一項已注冊內(nèi)容附加哈希指紋,并通過“點對面”衛(wèi)星輻射手段在全國發(fā)放內(nèi)容指紋。根據(jù)國家注冊機(jī)構(gòu)發(fā)放的指紋,任何地點上的任何終端,都有可能在域名和路由均不可信的情況下,直接判斷公共內(nèi)容的真?zhèn)危Wo(hù)公共內(nèi)容的安全,防止惡意攻擊,代碼可以造假,但空間、時間關(guān)聯(lián)的“唯一性”指紋難以造假。 這也是最近美國人提出的廣播信道從物理上增強(qiáng)NDN的內(nèi)容指紋安全概念。 而這個創(chuàng)意的內(nèi)核是統(tǒng)一內(nèi)容標(biāo)簽,映射并拓展web服務(wù)的URL標(biāo)簽。URL只提供地址信息,缺失標(biāo)題、摘要等語義元數(shù)據(jù)。 我們建議國家制定統(tǒng)一內(nèi)容標(biāo)簽(Uniform Content Label),它是一種感知內(nèi)容屬性的簡短數(shù)據(jù)包。那么UCL是做什么的,主要是感知內(nèi)容的度值,可以把高度值的內(nèi)容自動的鏡像在網(wǎng)絡(luò)的邊緣。針對個人,統(tǒng)計個人過往的UCL歷史數(shù)據(jù),感知個人優(yōu)先連接性(經(jīng)常到何網(wǎng)站何話題獲取內(nèi)容),按話題排序從廣播中過濾內(nèi)容,維持庫存最高服務(wù)度值;針對邊緣存儲,統(tǒng)計用戶群過往的UCL歷史數(shù)據(jù),感知每一項標(biāo)題的受訪頻度排序,按排序優(yōu)先淘汰訪頻度低的網(wǎng)頁,維持庫存最高服務(wù)度值;針對廣播發(fā)送端:統(tǒng)計全國過往的UCL/ URL歷史數(shù)據(jù),感知各網(wǎng)站長期的“人分鐘總數(shù)”排序,決定應(yīng)當(dāng)廣播那些網(wǎng)站的內(nèi)容。 其實科學(xué)家和鞋匠的感悟存在相似,鞋匠按手工方式做鞋,因各人尺寸各異,覺得鞋子采用個案生產(chǎn),天經(jīng)地義,但做到第1000雙時,感悟復(fù)雜中存在簡單,幾十種鞋碼足以滿足大眾個性,他不再做鞋,開鞋廠去了?!靶a”,是一種“可類聚”的感悟。 我們新聞傳播界也有這種感悟,就是全中國如果有1千類,1千個話題,或者1萬個話題,大概是千到萬之間的話題,就能滿足老百姓的個性化需求了。Web服務(wù)20年歷史,一直采用點對點個案生產(chǎn)。十幾年前,Watts發(fā)現(xiàn)Collective Dynamics 是小世界的成因,感悟網(wǎng)絡(luò)也是“可類聚”的。而今天,我們終于感悟:引入輻射復(fù)制與聚類計算,有可能使個案生產(chǎn)的web類服務(wù),大踏步進(jìn)入工業(yè)化生產(chǎn)的全新年代。因此,可聚類,科學(xué)家與鞋匠所見略同。 B(C/S)小跳數(shù)平臺代表廣播/客戶機(jī)/服務(wù)器三點架構(gòu)。通過BC、BS兩種單向下載,幫助IP的C/ S架構(gòu)。BC下載:針對全民的公益、免費(fèi)、自選下載, 向全國所有終端(含手機(jī)電視機(jī))送去統(tǒng)一內(nèi)容標(biāo)簽UCL,讓所有公民都獲知最新網(wǎng)頁的標(biāo)題、摘要,并告知如何通過電信商獲取全文。BS下載:針對電信服務(wù)器的收費(fèi)、自選下載,向全國電信行業(yè)邊緣服務(wù)器送去最新網(wǎng)頁全文,讓用戶只用最少路由跳數(shù)獲取全文,廣播可用CA碼收費(fèi),電信商也可按流量向用戶收費(fèi)。 B( C/S )小跳數(shù)平臺,既幫助傳統(tǒng)TCP/IP,也幫助不久前提出的NDN、SOFIA、CoreNet等新體系結(jié)構(gòu)。 網(wǎng)絡(luò)建立播存結(jié)構(gòu)就是兩個因素,網(wǎng)絡(luò)周邊都是CS結(jié)構(gòu),C就是終端客戶機(jī),S就是接收服務(wù)器。那么現(xiàn)在多了一個東西,客戶既需要的東西,告訴接入服務(wù)器,接入服務(wù)器從internet拿了網(wǎng)頁回來,現(xiàn)在我們多了一個廣播,廣播可以把全文廣播給接入服務(wù)器,可以把標(biāo)題和摘要廣播給C,就是這個終端客戶機(jī),這樣的話很多用處,就在S和C之間一跳就解決了??赡苡貌坏?0幾跳,這樣整個網(wǎng)絡(luò)的運(yùn)作就會出現(xiàn)很大的變化。那么很重要就要遷移這個大度值的內(nèi)容,你要識別什么是大度值的內(nèi)容,這就要靠USR的工具來識別,如果講的是一個接入服務(wù)器,如果許多接入服務(wù)器都接受廣播的幫助,那實際上就是讓它在intelnet的邊緣就建筑一個銅墻鐵壁,穿一個外套,你常用的媒體都在一跳兩跳里面都可以拿到的話,internet的負(fù)擔(dān)就可以大大減輕。這樣其實可以組成很有趣的,相異相成的小跳數(shù)環(huán)境: 以地址為中心-小跳環(huán)境-以內(nèi)容為中心 地址命名數(shù)據(jù)包-小跳環(huán)境-內(nèi)容命名數(shù)據(jù)包 名稱地址合一-小跳環(huán)境-名稱地址分離 網(wǎng)絡(luò)內(nèi)核-小跳環(huán)境-網(wǎng)絡(luò)外延 網(wǎng)絡(luò)外延-小跳環(huán)境-網(wǎng)絡(luò)內(nèi)核 信源指定信宿-小跳環(huán)境-信宿指定信源 未聚類無限內(nèi)容-小跳環(huán)境-已聚類有限內(nèi)容 全民各獻(xiàn)所知-小跳環(huán)境-全民各取所需 盡力而為傳輸-小跳環(huán)境-盡力而為存儲 民主思想-小跳環(huán)境-科學(xué)手段 大眾民主權(quán)-小跳環(huán)境-大眾知情權(quán) 文化產(chǎn)業(yè)-小跳環(huán)境-文化事業(yè) 單網(wǎng)絡(luò)多服務(wù)-小跳環(huán)境-單服務(wù)多網(wǎng)絡(luò) share式分享-小跳環(huán)境-copy式共享 收費(fèi)經(jīng)營 -小跳環(huán)境-公益免費(fèi) 由上我們可以看出,互聯(lián)網(wǎng)廣播網(wǎng)兩園相交,小跳數(shù)是交集。小跳數(shù)理念就是相異相成和諧至美。 剛才講到社區(qū)網(wǎng)絡(luò),或者叫社交網(wǎng)絡(luò),它有一個特點就是短,短是它很重要的自然科學(xué)的特征,短就可以快。一個因短而快的文化載體就誕生了。UCL,1kB,是短的數(shù)椐分組,也是一篇短文。短文含25字的標(biāo)題300字摘要,幾秒至幾十秒內(nèi)讀完 ,是熱門網(wǎng)站中連接度值最大的網(wǎng)頁,以每1Mb/ s的廣播帶寬,每天推送千萬種短文,任何人總可以從中找到滿足好奇心的最新短文。我們可以隨時打開隨身攜帶個人數(shù)據(jù)庫,立即得知你有興趣天下事,第一時間滿足好奇心。同時,一秒內(nèi)把地震、海嘯、戰(zhàn)爭信息告知全國同胞,比“navigated in ultrashort time”更快。 有這樣一個科學(xué)道理,凡是緊要的事一般都是短的,還有因短而泛的概念,就是時時處處人人的概念。但這種文化有問題要解決,就是防偏止假的概念,“快與泛” ,難免產(chǎn)生“假與偏”,假和偏是兩個概念,安全不等于可信,應(yīng)該分兩手治理假和偏。廣播UCL指紋,從內(nèi)容上防止造假與惡意攻擊;物理學(xué)的“測不準(zhǔn)”,人文科學(xué)的“說不準(zhǔn)”,都與獨立樣品數(shù)目不足有關(guān)。淀積多元內(nèi)容( 正面反面、贊成反對、過去當(dāng)前),就是用聚類計算儲存內(nèi)容來解決的問題。例如,我們?nèi)绾握J(rèn)知非典,如何認(rèn)知九級地震?我們經(jīng)過非典的知道是怎么回事,9級地震也是有一個過程,所以它這是一個過程,這個問題我們以后可以再來討論。什么叫民主,民主就是對多元世界的科學(xué)表達(dá),或者叫統(tǒng)計表達(dá),相關(guān)表達(dá)。 演講最后,李院士為我們留下了兩個深刻而值得思考的問題:“五四”運(yùn)動已經(jīng)快100周年了,我想提個問題,科學(xué)和民主是不是正在出現(xiàn)由于網(wǎng)絡(luò)科學(xué)的進(jìn)展,正在呈現(xiàn)出某種交集,就像是兩頭,中間一個交,左邊是德先生,右邊是賽先生,未來網(wǎng)是不是應(yīng)該承擔(dān)起這么一個交集的作用?第二問題,未來網(wǎng)應(yīng)該成為溝通科學(xué)和民主的某種渠道,就所謂社會網(wǎng)絡(luò),社區(qū)網(wǎng)絡(luò),或者社交網(wǎng)絡(luò),應(yīng)該起到這個渠道的作用,而我們現(xiàn)在做的UCL,內(nèi)容定位好像是科學(xué)和人文之間的一座小橋,能不能這樣理解這個問題呢?