holiso
存儲(chǔ)的未來是什么?
DNA存儲(chǔ)!這一定是很奇妙的事情,但你無法想象這會(huì)是怎樣的畫面。只能在顯微鏡下才能看到?能否將你的所有數(shù)據(jù)備份到DNA然后將其植入人體內(nèi)?全球70多億人口的檔案(包括家庭相片、自拍文件、影像資料、音樂文件和個(gè)人信息等)儲(chǔ)藏,只需一個(gè)不到100平方米的房間??梢源_定的是,在未來半個(gè)世紀(jì)里,甚至更短的時(shí)間內(nèi),DNA確實(shí)能夠儲(chǔ)存數(shù)量驚人的信息,比如照片、書籍、音樂,甚至是視頻!這一點(diǎn)也不“科幻”,事實(shí)上,在科學(xué)家完全繪制出基因組圖譜之前,在破解核苷酸的密碼過程中,少數(shù)人就已經(jīng)想到這種生命結(jié)構(gòu)單元的新用途??瓷先ィ@些雙螺旋能做的不僅僅是承載藍(lán)色眼睛、微積分天才或是三分線外遠(yuǎn)射能力的基因。那些扭曲的淘氣鬼也可以用來存儲(chǔ)數(shù)據(jù)。這里的數(shù)據(jù)指的是我們過去幾年間涉及到的——大數(shù)據(jù)、物聯(lián)網(wǎng)數(shù)據(jù)、網(wǎng)絡(luò)數(shù)據(jù)、移動(dòng)數(shù)據(jù)、社交數(shù)據(jù)。
科學(xué)家?guī)啄昵熬土私獾竭@個(gè)事實(shí),人們已經(jīng)知道怎么在DNA上保存數(shù)據(jù)了。2016年4月,著名的好萊塢影視技術(shù)公司特藝集團(tuán)研發(fā)團(tuán)隊(duì)發(fā)布的一則消息引起了轟動(dòng),他們宣稱自己已經(jīng)在幾段DNA上儲(chǔ)存了100萬份《月球旅行記》的拷貝,那是一部由電影藝術(shù)先驅(qū)、法國導(dǎo)演喬治·梅里愛于1902年拍攝的電影。特藝集團(tuán)的成就并非首創(chuàng)。早在2012年和2013年,就有兩個(gè)團(tuán)隊(duì)將一本300頁的書、若干圖像、一個(gè)PDF文件,甚至聲音成功地儲(chǔ)存在了DNA上。新奇之處在于其所編碼的信息類型。這是人類第一次成功地把視頻資料儲(chǔ)存到了DNA上。這也意味著現(xiàn)在已經(jīng)可以在這種分子上存儲(chǔ)一切數(shù)碼信息。
生物分子變身硬盤
這個(gè)消息來得正是時(shí)候!如今,人類產(chǎn)生越來越多的信息,而儲(chǔ)存它們變得越來越困難。在電腦和手機(jī)的時(shí)代,我們現(xiàn)在每年制造出來的數(shù)據(jù)要比人類有文字以來產(chǎn)生的數(shù)據(jù)總和還要多!與我們每時(shí)每刻產(chǎn)生的上千億條短信、郵件、推文、自拍和視頻相比,把古埃及的象形文字、達(dá)·芬奇的手稿、狄德羅和達(dá)朗貝爾的《百科全書》,以及雨果的小說全集全部數(shù)字化加起來也比不上!預(yù)計(jì)從2013年到2020年,這一數(shù)據(jù)量將增長11倍,且這種趨勢(shì)并無逆轉(zhuǎn)跡象。根據(jù)數(shù)據(jù)儲(chǔ)存專業(yè)公司易安信的計(jì)算,如果用內(nèi)存為128GB的蘋果iPad Air來儲(chǔ)存這些數(shù)據(jù),那所需的蘋果iPad Air疊起來可以在地球到月球之間堆6次。數(shù)字化信息數(shù)量的飛速增長很快就會(huì)令人應(yīng)接不暇,人類呼喚比現(xiàn)有儲(chǔ)存系統(tǒng)更高效的新系統(tǒng)。DNA存儲(chǔ)恰能滿足以上需求。作為最古老的信息儲(chǔ)存系統(tǒng),數(shù)十億年來,它一直是生物遺傳信息的載體,DNA能將數(shù)量驚人的數(shù)據(jù)儲(chǔ)存在極小的體積里,因此也是最高效的:在體積不到一只螞蟻的百分之一的人類細(xì)胞核中,DNA包含有35億對(duì)堿基,而堿基是編碼遺傳信息最基本的材料。在硬盤上,信息以字節(jié)0或1的形式記錄,每個(gè)字節(jié)要占200納米(0.0002毫米)的空間;而在DNA上,記錄一個(gè)字節(jié)只需0.2~0.3納米。
如今,谷歌和亞馬遜為了儲(chǔ)存數(shù)據(jù),需要多個(gè)面積數(shù)倍于標(biāo)準(zhǔn)足球場的數(shù)據(jù)中心的支持,而且這還很耗電。而用DNA這種新型載體,只需一個(gè)汽車后備箱就能滿足它們所有數(shù)據(jù)的儲(chǔ)存需求!DNA在儲(chǔ)存體積上的優(yōu)勢(shì)也引起了電影公司的興趣。僅就我國而言,每年要拍攝上千部電影和電視劇,這將產(chǎn)生龐大的數(shù)據(jù)量。一首MP3格式的歌曲差不多有4MB,但是一部長達(dá)兩小時(shí)的電影,即使壓縮成MP4的格式,也要占據(jù)700MB。有了DNA儲(chǔ)存技術(shù),現(xiàn)在可以成功地把自20世紀(jì)以來拍攝的所有影片都儲(chǔ)存在兩到三個(gè)火柴盒里!
其實(shí),特藝集團(tuán)的科學(xué)家又是如何把100萬份電影拷貝存到DNA上的呢?過程并不容易。為此他們還請(qǐng)來美國基因?qū)W家喬治當(dāng)顧問,因?yàn)樵缭?012年,他就成功地把一本300頁的書存到了DNA上面。他們首先將梅里愛的電影數(shù)碼化,轉(zhuǎn)化成電腦能識(shí)讀的二進(jìn)制語言,也就是轉(zhuǎn)化成一系列0和1的編碼。然后研究人員將這些二進(jìn)制編碼轉(zhuǎn)化成由4個(gè)堿基(A、C、G、T)構(gòu)成的DNA編碼。得到這串編碼后,就能制成相應(yīng)的DNA序列,并在合成器(一種能自動(dòng)拼接A、C、G、T的機(jī)器)的幫助下,拷貝數(shù)千份。這樣就獲得了一些DNA片段,它們?nèi)珙^發(fā)絲一樣漂浮在裝有液體的玻璃容器里,每一份都包含著電影的一個(gè)片段。
未來道路一片光明
接著就要證實(shí)反向操作的可行性了,也就是從這些片段中讀取電影。研究人員使用了另一種名為排序器的機(jī)器,它能自動(dòng)按序讀取DNA分子里A、C、G、T序列。電腦接手完成剩余工作,把這一系列編碼轉(zhuǎn)化成一連串0和1,再把二進(jìn)制編碼轉(zhuǎn)成圖像。只需一天不到的時(shí)間,就能將電影精準(zhǔn)重現(xiàn)。不過,目前這項(xiàng)技術(shù)還在實(shí)驗(yàn)階段:現(xiàn)在把電影轉(zhuǎn)化成能漂在試管里的DNA要花費(fèi)一個(gè)多月的時(shí)間!但是前景一片光明。尤其是因?yàn)镈NA儲(chǔ)存的另一張王牌就是它的持久性。只要儲(chǔ)藏空間保持寒冷干燥且避光,保存時(shí)效就可長達(dá)數(shù)世紀(jì),甚至更長。人們?cè)诒鶎永锇l(fā)現(xiàn)了幾萬年前猛犸象的DNA,還能成功將其破譯出來,就是最好的證明。
現(xiàn)有的其他載體,無論是硬盤、CD還是DVD,最多只能保存數(shù)十年,過了這個(gè)期限,首先硬件就會(huì)更新?lián)Q代,再也找不到能讀取它們的機(jī)器了!但DNA儲(chǔ)存就沒有此類問題:只要有人類存在,就一定會(huì)有破譯編碼的技術(shù)。不過DNA儲(chǔ)存還無法立即取代硬盤。讀?。ㄅ判颍┯绕涫菍懭耄ê铣桑┧璧臅r(shí)間還是太漫長了。排序最快也要幾個(gè)小時(shí),而合成則需要花上幾周的時(shí)間。不僅如此,這兩個(gè)步驟目前耗資甚巨,合成成本可達(dá)數(shù)百甚至數(shù)千歐元。但數(shù)十年后,或許DNA儲(chǔ)存就會(huì)普及,要知道此類技術(shù)的花費(fèi)會(huì)大幅降低。比如與2002年時(shí)相比,如今DNA測(cè)序費(fèi)用僅為當(dāng)初的5萬分之一!對(duì)于沒有迫切使用需求的信息,我們就可以考慮用DNA來儲(chǔ)存。事實(shí)上,DNA儲(chǔ)存已經(jīng)引起了電影公司、博物館、檔案館,還有諸如亞馬遜、谷歌這類有長期信息儲(chǔ)存需求機(jī)構(gòu)的興趣。信息技術(shù)巨頭微軟公司即于2016年4月28日宣布,將購買1 000萬條DNA,用于研究數(shù)據(jù)儲(chǔ)存。毫無疑問DNA存儲(chǔ)渾身都散發(fā)著未知的光芒,不久的將來人類會(huì)迎來一個(gè)全新的數(shù)據(jù)存儲(chǔ)新時(shí)代。