亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        DNA數(shù)據存儲:保存策略與數(shù)據加密

        2021-07-21 09:30:46周廷堯羅源蔣興宇
        合成生物學 2021年3期
        關鍵詞:加密測序編碼

        周廷堯,羅源,蔣興宇

        (南方科技大學生物醫(yī)學工程系,廣東 深圳 518055)

        隨著互聯(lián)網和人工智能等信息技術的高速發(fā)展,人類產生的數(shù)據信息呈爆炸式增長。據國際數(shù)據公司(IDC)發(fā)布最新全球DataSphere顯示,2020年創(chuàng)建和使用的數(shù)據量高達5.9×1022字節(jié),并且今后每年數(shù)據量將以26%的速度增長?,F(xiàn)有的數(shù)據存儲體系主要有磁性存儲(磁盤、磁帶和機械硬盤)、光學存儲(CD、DVD)和固體存儲(閃存芯片、DRAM芯片)[1]。這些存儲體系雖然近些年來得到了較大的發(fā)展,但其劣勢日益凸顯,如存儲密度有限、有效存儲時間短、生產設備能耗高、原材料硅的供應量有限且易污染環(huán)境等,已無法滿足當前海量數(shù)據爆炸式增長的需求[2-3]。因此,迫切需要發(fā)展一種具有更好存儲性能的新技術與新方法。

        DNA是一種古老的存儲介質,儲存著從微生物到人類億萬生命的海量遺傳信息。自20世紀60年代以來,因DNA分子的存儲密度高、耗能低、壽命長、無磨損等潛在優(yōu)勢,人們曾就DNA分子作為存儲媒介的可行性展開討論[4-8]。近年來,隨著DNA合成技術和新一代測序技術的突破性發(fā)展,DNA數(shù)據存儲已成為當前全球數(shù)據信息存儲技術的研究熱點。2012年,哈佛醫(yī)學院和約翰·霍普金斯大學合作利用DNA編碼了一整本6.58×105字節(jié)的巨著,使DNA存儲技術邁進了一大步[9]。2013年,歐洲生物信息研究所科研團隊[10]將包含5種類型數(shù)據7.39×105字節(jié)的計算機文件(文本、PDF、照片、MP3和霍夫曼編碼)編碼到肉眼看不到DNA序列中,為大規(guī)模、長期且不經常訪問的數(shù)字檔案信息提供一種實用的存儲技術。2016年,微軟研究院和華盛頓大學合作將超過2.0×108字節(jié)的數(shù)據信息編碼到DNA分子中,同時,微軟公司已計劃于2020年建立基于DNA分子的數(shù)據存儲系統(tǒng)[11]。2017年,紐約基因組中心和哥倫比亞大學聯(lián)合開發(fā)了一種高度可靠的DNA噴泉算法,該方法可接近每個核苷酸存儲的信息的理論最大值[12]。與此同時,國內外一些企業(yè)也陸續(xù)推出基于DNA數(shù)據存儲的商業(yè)化服務。

        本文以DNA數(shù)據存儲技術為主線,闡述DNA數(shù)據存儲的基本理論和工作流程,重點介紹DNA保存的方法與策略、信息安全與數(shù)據加密的研究進展,最后討論DNA數(shù)據存儲現(xiàn)階段面臨的主要挑戰(zhàn)及發(fā)展趨勢。

        1 DNA數(shù)據存儲的基本理論和工作流程

        在自然界中,DNA是由4種堿基——腺嘌呤(A)、胞嘧啶(C)、胸腺嘧啶(T)和鳥嘌呤(G)按照特定順序鍵合而成的大分子聚合物。通過A與T、C與G堿基互補配體的原則,可形成雙螺旋的DNA雙鏈分子結構,承載著億萬生命的海量遺傳信息。DNA存儲技術即是以人工合成的DNA為存儲介質,按照一定編碼規(guī)則將文本文檔、圖片和聲音文件等數(shù)據轉化為DNA序列,進行存儲并完整讀取的技術[13-14]。與傳統(tǒng)的存儲介質相比,DNA數(shù)據存儲具有如下優(yōu)勢。首先,存儲密度高。根據Shannon信息的定義,單個核苷酸可存儲最大容量為0.25字節(jié);通過換算為物理密度可知,1 g DNA可理論上存儲4.6×1020字節(jié)的數(shù)據量,存儲密度比目前主流的存儲介質(如磁帶、HDD或固態(tài)存儲)高出多個數(shù)量級[15]。2019年,華盛頓大學報道文件存儲密度可達1.7×1019字節(jié)/g。以此推測,大約10 kg DNA分子就可滿足2025年全球數(shù)據總量存儲要求(預計數(shù)據量為1.75×1023字節(jié)),所占體積與籃球大小相似[16]。其次,DNA數(shù)據存儲易復制。雖然DNA分子存儲的數(shù)據不需要經常復制保存,如果需要,亦可輕松完成。DNA可利用聚合酶鏈式反應(PCR)進行指數(shù)化復制,顯著提高了數(shù)據的復制效率[17]。此外,與當前存儲在HDD上在線數(shù)據不同,DNA數(shù)據存儲不需要電力供應,耗能低,即可長時間穩(wěn)定地保存數(shù)據信息[18]。

        DNA數(shù)據存儲的基本工作流程主要包括將數(shù)據信息編碼為DNA序列(編碼),根據序列合成DNA分子(寫入),組織這些DNA分子進行長期保存和數(shù)據加密(保存和加密),檢索和有選擇地訪問(隨機訪問),讀取DNA序列(讀出),將其轉換為數(shù)字信息(解碼)[19],如圖1所示。

        圖1 DNA數(shù)據存儲的基本工作流程[主要包括編碼(i)、寫入(ii)、保存和加密(iii)、隨機訪問(iv)、讀出(v)與解碼(vi)]Fig.1 Major steps of DNA data storage[including encode(i),write(ii),store and encrypt(iii),random access(iv),read(v)and decode(vi)]

        1.1 編碼

        計算機中文本、圖片、音頻和視頻等信息文件的保存與處理均采用以0、1為基元的二進制數(shù),需按照一定的編碼規(guī)則將其映射成以A、T、C、G四字符編碼的DNA序列。雖然每種類型信息所用的模型有所差別,但其編碼過程大致相似,一般包括數(shù)據壓縮、引入糾錯和轉換DNA序列三個過程。

        1.2 寫入

        根據編碼的DNA序列完整無誤地合成出來,制備一系列人工DNA分子。目前,合成DNA分子的主要方法有芯片法[20]、PCR法[21]、柱式合成法[22]和酶促合成法[23]。

        1.3 保存和加密

        選擇合適的載體將合成DNA分子進行保存。目前合成DNA保存方法主要是細胞外保存法和細胞內保存法。將DNA分子包埋在特殊的基質中隔絕空氣和水分,可有效延長其保存時間[24]。在延長DNA保存時間的同時,增強信息存儲的安全性,也是DNA數(shù)據存儲重要的研究方向。本文將在后續(xù)部分重點介紹DNA保存方法的研究進展,并簡要總結信息安全與數(shù)據加密的最新研究成果。

        1.4 隨機訪問

        隨機訪問是用于計算機科學中選定信息的讀取,是DNA數(shù)據存儲可行性的一個關鍵特征。為了避免讀取整個存儲系統(tǒng),需要設計索引方法來提取特定的DNA序列。目前索引方法主要是基于PCR的引物擴增[25]和基于修飾特定DNA序列的磁珠法[26]。

        1.5 讀出與解碼

        通過DNA測序儀器讀取DNA序列。DNA測序法主要有“大規(guī)模并行合成測序法”[27]“DNA納米球測序法”[28]和“納米孔測序法”[29]。前者技術成熟,錯誤率低,但周期較長;后者技術在發(fā)展中,錯誤率相對較高,但能夠實時讀出。根據測定的DNA序列,設計解碼程序,轉換為二進制數(shù)據,最后還原成計算機文件。

        2 DNA保存的方法與策略

        與其他存儲介質相比,DNA數(shù)據存儲一個巨大的優(yōu)勢在于可以長久保存數(shù)據。近期考古學研究還可以對來自30萬年前熊和人類的線粒體DNA測序[30-31]。然而,天然未受保護的DNA是一種非常脆弱的生物分子,易水解或者被氧化,有著特征性的半衰期[32-33]。它們的半衰期與存儲溫度和DNA鏈長密切相關,低溫和防水環(huán)境可顯著提高其穩(wěn)定性,如常溫下30個堿基DNA半衰期有500年,而-5℃存儲DNA化石的半衰期可延長至15.8萬年[34]。為了更有效地進行數(shù)據長期存儲,國內外科研工作者發(fā)展了多種DNA保存的方法與策略,主要分為細胞外保存法和細胞內保存法。

        2.1 細胞外保存法

        DNA溶液通常在室溫下可以穩(wěn)定3~6個月,4℃可以穩(wěn)定大約1年,而-20℃冷凍可以延長至2年[35]。將DNA分子保存在溶液中的最大優(yōu)勢是可以隨機索引,可支持多次信息讀?。?5,36-37]。為防止樣品在運輸、存儲、處理過程中發(fā)生降解,人們通常把DNA分子進行凍干處理進行保存。這樣不但適用于長期穩(wěn)定保存樣本,并且能快速完整地回收樣本。通過評估商品化Biomatrica、自制海藻糖和聚乙烯醇3種材質塑料孔板對DNA分子的穩(wěn)定效果,發(fā)現(xiàn)Biomatrica塑料孔板在室溫和56℃對DNA保護效果最佳;海藻糖孔板更適合對DNA短期56℃條件保存[38]。華盛頓大學科研人員[39]將脫水DNA斑點保存在玻璃上,研發(fā)一種基于數(shù)字微流控的可擴展DNA數(shù)據存儲的方法(圖2)。脫水DNA的斑點可以密集地排列在微流控設備上,回收過程不受鄰近斑點影響。他們還將1.0×1012字節(jié)的數(shù)據存儲在DNA的單個斑點中,并使用此方法成功實現(xiàn)了檢索。另外,DNA還可以吸附存儲在一種特殊材質濾紙中,可保護DNA分子在36個月內不被降解[40]。最近,瑞士聯(lián)邦理工學院科學家發(fā)現(xiàn)堿土金屬鹽可增強干粉狀DNA的穩(wěn)定性,即使在相對濕度為50%、高DNA負載量(質量分數(shù)大于30%)情況下也具有顯著穩(wěn)定DNA的功能,可方便地進行數(shù)據的隨機訪問和信息讀?。?1]。

        圖2 基于數(shù)字微流控的高密度干粉DNA數(shù)據存儲[(a)干粉DNA保存在玻璃板上;(b)將玻璃板置于數(shù)字微流控裝備上便于檢索數(shù)據,插圖為一個斑點成像圖,比例尺為275μm;(c)夾在玻璃板與電極間的水滴被激活,并移動到斑點DNA下進行補水[39]]Fig.2 High density dehydrated DNA data storage with digital microfluidic retrieval[(a)Dehydrated DNA stored on glass cartridges;(b)Cartridge was loaded onto digital microfluidic device to retrieve data,and inset showed photo‐graph of an actual magnified spot,scale bar:275μm;(c)A water droplet sandwiched between cartridge and electrodes was actuated to move under spotted DNA for rehydration[39]]

        DNA分子可以在骨骼殘骸或者沉積物中保存長達數(shù)十萬年之久,主要得益于外層密集的骨骼殘骸或者沉積物將DNA與環(huán)境中的水分和活性氧隔絕開。受此啟發(fā),國內外科研人員先后報道了一系列封裝DNA分子的方法,使DNA分子得到更好的保護。不同介質保存DNA的情況見表1。DNA可包裹在二氧化硅顆粒中,模仿化石保護DNA免受侵蝕性環(huán)境(200℃、高濃度自由基)的影響,并利用氫氟酸對二氧化硅顆粒的刻蝕作用,可將DNA釋放出來進行信息讀?。?2]。此外,借助同樣的方法將DNA封裝在二氧化硅顆粒,并采用糾錯代碼來糾正與存儲相關的錯誤。由于DNA對熱非常敏感,根據DNA衰敗激活能(120~155 kJ/mol)[32,44]和70℃下DNA衰減曲線,可推斷DNA保存在20℃的半衰期。通過加速老化試驗(70℃和相對濕度50%)推測,數(shù)據信息可以在多種環(huán)境條件下保存DNA數(shù)千年。即使在70℃存放一周,原始信息可以無差錯地恢復[24]。但是這些方法存在著DNA負載量低的缺陷,只有0.7%,降低了DNA數(shù)據存儲密度。為了增加存儲密度,瑞士聯(lián)邦理工學院科研人員利用層層自組裝技術,將DNA和陽離子聚合物聚乙烯亞胺(PEI)交替包覆在磁性顆粒表面,并在最外層包裹一層硅殼,制備了一種高DNA負載的磁性納米顆粒。該方法大幅度提升了DNA存儲密度,密度最高可達155 ng/cm,質量負載率為7.8%(不包裹硅)和3.4%(包裹硅)[43]。最近,瑞士聯(lián)邦理工學院與以色列科學家聯(lián)合開發(fā)了一種信息存儲結構,可用于創(chuàng)建具有嵌入式存儲DNA信息編碼的材料[45]。他們設計了“萬物DNA”框架體系,將用于3D打印兔子的信息編碼到DNA分子,封裝在160 nm硅球內部,并進一步分散在熱塑性聚酯中,用于兔子的3D打印。通過剪下兔子一小塊材料,提取、擴增和測序,就可以獲取兔子3D打印信息,完美地復制五代兔子。這些包裹在二氧化硅顆粒中保存DNA的方法,通常不支持可逆的信息釋放與封裝,以及多次的信息讀取。除了二氧化硅納米顆粒,還利用其他材料如磷酸鈣和聚合物等進行封裝保護[46-47],并且對DNA自組裝納米結構可以實現(xiàn)精準生物礦化[48-51]。例如,如圖3所示,上海交通大學樊春海院士團隊[51]利用核酸框架結構為模板和靜電吸附作用為驅動力,成功地制備出幾何形狀高度可控的磷酸鈣納米晶體。由于外層磷酸鈣的隔絕保護作用,DNA的穩(wěn)定性大大增強,同時保留核酸框架的結構信息,有效增加其在細胞內的轉運效率,進一步拓寬了DNA框架結構的應用范圍。與細胞內保存法相比,細胞外保存法因成本低、耐久性好、可延展性等優(yōu)勢更具有實用性。

        圖3 DNA框架結構誘導合成磷酸鈣[51]Fig.3 Schematic Illustration for preparation of CaP templated by DNA-framework[51]

        表1 不同DNA保存介質的比較Tab.1 Comparison of different DNA storage media

        2.2 細胞內保存法

        與體外DNA保存法相比,細胞內保存法可利用細胞內高效的DNA復制、校對和長鏈DNA修復機制,提供高效的隨機訪問路徑和實時記錄生物事件[25,52]。天然和工程化的DNA靶向和修飾酶常被用作DNA數(shù)據存儲的寫入工具。例如,天津大學元英進教授團隊[53]利用釀酒酵母體內組裝系統(tǒng)對長序列數(shù)據信息進行組裝,可實現(xiàn)生物信息的低成本、高保真存儲。天津大學齊浩教授團隊[54]發(fā)現(xiàn)攜帶大量寡核苷酸池的細菌混合培養(yǎng)物是一種穩(wěn)定的信息存儲媒介,能夠將4.45×105字節(jié)的數(shù)據文件存儲在細菌內。根據寫入機制不同,目前報道的研究工作大致分為兩類。一類是利用重組酶進行細胞內數(shù)據存儲。借助重組酶,信息被儲存在一個特定的基因組位置[55-56]。例如,利用不同的重組酶在大腸桿菌內存儲了1.375字節(jié)的記憶陣列,證實了重組酶可以分層并用于永久記錄轉錄邏輯門的瞬時狀態(tài)[57]。通過控制重組酶方向性,將可重寫的信息數(shù)據存儲在活細胞中[58]。需要說明的是,對于基于重組酶的DNA數(shù)據存儲,在特定的位置需要一個特定的重組酶,因此,數(shù)據存儲的密度不高,且與宿主基因組的接口有限,最終導致數(shù)據寫入效率比較低。另外一類是利用CRISPR-Cas體系進行DNA數(shù)據存儲[59-60]。其中,最受關注的是Cas9蛋白[61],它是一種可編程DNA切割酶,被用于定位由多個相同靶點組成的DNA地址[62-63]。這種方法除大規(guī)模記錄細胞譜系信息外,還可通過將Cas9表達與細胞信號耦合來記錄模擬信號,如將非二進制的基因突變(數(shù)據信息)記錄到DNA中[64]。各種其他核酸酶也具有類似的功能,如CRISPR相關的核酸內切酶Cpf1、鋅指蛋白核酸酶(ZFNs)以及類轉錄激活因子效應物核酸酶(TALENs)[65-69]。與上面介紹的基于重組酶的體系相比,此功能使模擬數(shù)據的存儲密度更高,同時具有更直接的與宿主生理學接口。目前細胞內保存法還不能充分利用細胞基因組,而且還存在著由于遺傳不穩(wěn)定性而造成信息丟失的風險[70-71]。為了減少這種遺傳不穩(wěn)定性帶來錯誤信息富集,德國漢堡工業(yè)大學[72]提出了一種用于活細胞正交信息編碼、具有錯誤自我檢測功能的三基塊編碼方案(SED3B)。SED3B采用一種全新的方法在小數(shù)據基塊中添加錯誤檢測的堿基,可與DNA分子固有的冗余部分相結合,進行有效的糾錯。試驗結果表明,SED3B在大腸桿菌中編碼信息可連續(xù)復制超過12 000年,仍能提供可靠的數(shù)據結果。

        3 信息安全與數(shù)據加密

        3.1 數(shù)據加密

        在大數(shù)據時代,信息數(shù)據安全扮演著尤為重要的角色。信息加密技術可用于防范未經授權的非法訪問。密碼術和隱寫術是信息加密常用的兩種策略,前者是使信息無法被外人理解,后者則是隱藏信息的存在[73-74]。傳統(tǒng)的密碼術和隱寫術由于當今數(shù)學和計算機技術的介入很容易被破解,失去原有的信息加密效果[75-76]。隨著生物學和信息學的發(fā)展,人們開始利用生物分子尋求新型加密技術[77],如蛋白質、適配體、細菌被用來保護信息安全[78-81]。然而,在這些研究中,信息安全很大程度上依賴于固定的生物分子反應模式,一旦對手發(fā)現(xiàn)相關的解密方式,其安全性將受到嚴重的威脅。發(fā)展新型安全可靠的密碼體制,是信息安全和數(shù)據加密的研究重點和難點。

        3.2 DNA密碼

        1994年,美國南加州大學利用DNA計算來解決一個NP完全問題的試驗,標志著信息時代進入一個新階段[82]。DNA密碼是隨DNA計算發(fā)展而產生的一項新興技術[83-84],它主要是利用現(xiàn)代生物技術,以DNA分子為載體,充分發(fā)揮DNA固有的高存儲密度和高并行性等優(yōu)勢,從而實現(xiàn)加密、認證和隱寫等密碼學功能[85-88]。DNA密碼體系主要有3種方式。

        (1)一次一密。1999年,美國杜克大學[89]利用映射替代和異或的方法提出了一次一密的密碼體系。映射替代法是根據定義的映射關系將一定長度的DNA明文序列替換為對應的DNA密文序列;而異或法是利用光刻技術和熒光標記技術進行DNA明文和密文序列的異或運算。

        (2)DNA隱寫術。它的原理是利用大量的無關信息隱藏加密后的DNA信息,只有根據事前雙方約定的信息,才能找到正確的DNA鏈,并獲取隱藏的信息[87]。1999年,美國紐約西奈山醫(yī)學院[7]發(fā)明了一種基于DNA的密碼術策略來隱藏秘密消息,他們將第二次世界大戰(zhàn)中著名的一條信息隱寫在DNA微點中,并利用PCR技術成功地將其提取出來。最近,上海交通大學樊春海院士研究團隊[90]開發(fā)了一套基于DNA折紙的分子加密系統(tǒng)。如圖4所示,發(fā)送者Alice首先將文本信息HEY按字母順序編碼成盲文圖案,然后進一步加密為雜交若干個生物素修飾短鏈的骨架鏈。接收者Bob通過加入訂書鏈,將骨架鏈折疊為含有生物素化圖案的DNA納米結構。再加入鏈酶親和素,使盲文圖案在原子力顯微鏡(AFM)下可識別讀出,最終獲得文本信息。該方法實現(xiàn)了加密術與隱寫術的完美整合,大大超越當前基于計算問題加密協(xié)議的限制。同時,還可通過對DNA折紙不同區(qū)域位點的定義以及DNA折紙間的特異性識別,實現(xiàn)完整性保護和訪問控制的功能。

        圖4 基于DNA折紙的分子加密系統(tǒng)工作流程[90]Fig.4 Workflow of DNA origamicryptography for secure information communication[90]

        (3)PCR引物作為密鑰。該方法是基于DNA二元串對數(shù)據信息進行編碼,然后混入大量相似DNA二元串,只有悉知PCR反應中引物序列的接收方,才能提取正確的消息[88]。由于引物信息的泄露可能導致消息不安全,中國科學院上海生命科學研究院[91]最近通過將特定引物(真實密鑰)與非特定引物(假密鑰)混合或將真實密鑰與3′-端冗余序列連接來開發(fā)預密鑰,然后利用CRISPR/Cas12a技術切割假密鑰或去除3′-端冗余序列,從而產生用于信息提取的真實密鑰,可更好地保護DNA編碼數(shù)據的存儲和傳輸。此外,上海交通大學左小磊教授團隊[92]將特異序列DNA包裹在碳納米管表面,研發(fā)了一種新型管狀核酸,利用形成的特征高度和距離的不同模式對碳納米管進行二維編碼,并且可利用金納米顆粒進行視覺解碼。

        3.3 數(shù)據清除

        數(shù)據清除是保障信息安全重要的一環(huán),將數(shù)據快速從存儲設備中擦除,達到保護機密信息數(shù)據的目的。然而,DNA分子的良好化學穩(wěn)定性對DNA存儲中高度機密的數(shù)據清除提出了新的挑戰(zhàn)。

        破壞DNA分子的傳統(tǒng)方法主要有使用紫外線照射[93]、DNase I[94]、>200℃的高溫[95-96]以及氧化劑等[97]。這些銷毀DNA分子方法各不相同,但一般難以在沒有專門設備以及在合理的時間內完成。美國萊斯大學研究人員[98]報道了一種基于亞穩(wěn)定雜交的DNA數(shù)據存儲系統(tǒng),可通過簡單的加熱過程快速永久擦除數(shù)據信息。如圖5所示,在該存儲系統(tǒng)中,每個文件地址都包含一個真實消息和至少一條錯誤消息,并且真實信息通過與“真實標記”寡核苷酸的雜交來區(qū)分。DNA雜交體的穩(wěn)定性對溫度非常敏感,只要溫度高于其解鏈溫度,DNA雜交體立即解離。原始真實信息通過加熱解離(95℃加熱5 min),將永遠無法恢復。最近,美國北卡羅萊納州立大學[99]報道了一種由T7啟動子和單鏈突出域(ss-dsDNA)組成的動態(tài)DNA數(shù)據存儲系統(tǒng)。該ss-dsDNA系統(tǒng)可通過從DNA轉錄信息而不破壞它來實現(xiàn)可重復的信息訪問,同時,還可以進行DNA數(shù)據存儲中文件的鎖定與解鎖、重命名以及刪除等操作,為具有多種功能的信息存儲奠定了堅實的基礎。

        圖5 基于亞穩(wěn)定雜交的DNA數(shù)據存儲系統(tǒng)的原理[(a)圖片文件被編碼為DNA序列,可以在室溫下穩(wěn)定地長時間保存,但是在暴露于95℃時會被永久快速擦除;(b)基于DNA雜交的真實信息編碼[98]]Fig.5 Metastable hybridization-based DNA data storage[(a)Image file was encoded as DNA sequences,which could be stored steadily at room temperature for long periods of time,but was permanently and quickly erased when exposed to 95℃.(b)Truthful information encoding based on DNA hybridization[98]]

        4 展望

        以互聯(lián)網與全球化普及為重要標志的信息革命正逐步改變人與數(shù)據間的相處方式,使人類社會步入了大數(shù)據時代。爆炸式增長的信息數(shù)據量與存儲空間和技術不足的矛盾也日益突出。因其存儲密度大、出錯率低、能耗低等優(yōu)勢,DNA作為極具發(fā)展?jié)摿Φ男乱淮鎯橘|,有望替代當今磁盤和光盤等主流存儲方式。近些年,DNA數(shù)據存儲技術的研發(fā)已取得較大進展。本文以DNA數(shù)據存儲為主線,闡述了DNA數(shù)據存儲的基本理論和工作流程,重點綜述DNA保存方法與策略最新研究成果和信息安全與數(shù)據加密的研究進展。如圖6所示,DNA數(shù)據存儲除了用于文件存檔和數(shù)據加密外,還被擴展用于驗證物品真實性的分子標簽和生物計算[100]。如國際上多個研究小組開發(fā)了一種基于DNA分子鑒定的方法,用于油品條形碼的標簽[101],還應用于含水層的環(huán)境示蹤[102]。

        圖6 DNA數(shù)據存儲的主要工作流程及其應用Fig.6 Process overview and applications of DNA Data Storage

        目前,諸多研究進展仍停留在實驗室水平,主要原因如下:

        首先,信息的寫入和讀取成本仍然很高,存儲數(shù)據的效率太低。近期的研究發(fā)現(xiàn)創(chuàng)建存儲1.0×106字節(jié)的數(shù)據大約需要花費3500美元[10,103-104]。盡管在過去10年中,DNA合成和測序成本下降了幾個數(shù)量級,但DNA合成與測序技術本身存在的瓶頸問題,導致成本降低的步伐有所放緩。此外,先進的編碼和解碼算法同樣需要提升DNA合成與測序方面技術要求,才能實現(xiàn)產業(yè)級的DNA數(shù)據存儲。

        其次,隨機訪問是信息存儲另一個必需的功能。如何高效快速地從整個存儲系統(tǒng)中讀取某一數(shù)據文件是一個挑戰(zhàn)。通常使用特異性引物進行PCR,以選擇性訪問存儲在DNA中的某一特定的信息。美國華盛頓大學[25]利用強大的糾錯碼和算法,可以獨立檢測35個文件,而不相互干擾和產生錯誤。盡管這些技術復雜、緩慢且昂貴,但這些技術還是邁向DNA數(shù)據存儲隨機訪問的第一步。

        最后,雖然細胞外保存法和細胞內保存法都取得了一定的研究進展,但它仍然離便捷的實際應用還有很長的距離。兼顧存儲持久性與簡易讀取數(shù)據,擦除數(shù)據與信息重寫,自動化集成化寫入、儲存、讀取數(shù)據等方面,面臨著諸多挑戰(zhàn),還有很多技術難點有待突破。特別是,提升DNA數(shù)據存儲效率、存儲讀取高度集成自動化以及數(shù)據加密新策略等將是今后DNA數(shù)據存儲研究的重要發(fā)展方向。DNA數(shù)據存儲憑借自身的獨特優(yōu)勢受到國內外越來越多的科研工作者關注和重視,雖然現(xiàn)階段仍存在著一些難點和挑戰(zhàn),但大量科學試驗表明DNA作為一種新型的數(shù)據存儲介質,無論是在存儲容量、持久性上,還是在可擴展性上,都遠勝于現(xiàn)有的存儲介質。相信隨著合成生物學的不斷發(fā)展,這些挑戰(zhàn)和技術難題將逐步得到解決,DNA數(shù)據存儲將成為未來最有應用潛力的新型存儲方式,引領人類社會進入更便捷、更智能的新時代。

        猜你喜歡
        加密測序編碼
        杰 Sir 帶你認識宏基因二代測序(mNGS)
        新民周刊(2022年27期)2022-08-01 07:04:49
        基于SAR-SIFT和快速稀疏編碼的合成孔徑雷達圖像配準
        二代測序協(xié)助診斷AIDS合并馬爾尼菲籃狀菌腦膜炎1例
        傳染病信息(2021年6期)2021-02-12 01:52:58
        《全元詩》未編碼疑難字考辨十五則
        子帶編碼在圖像壓縮編碼中的應用
        電子制作(2019年22期)2020-01-14 03:16:24
        一種基于熵的混沌加密小波變換水印算法
        Genome and healthcare
        認證加密的研究進展
        基因捕獲測序診斷血癌
        基于ECC加密的電子商務系統(tǒng)
        北条麻妃国产九九九精品视频 | 日本亚洲色大成网站www久久| 亚洲高清无码第一| 国内色精品视频在线网址| 二区免费在线视频观看| √新版天堂资源在线资源| 国产日韩成人内射视频| 人妻av午夜综合福利视频| 国产亚洲精品一区在线| 99精品国产丝袜在线拍国语| 乌克兰少妇xxxx做受6| 蜜桃成人永久免费av大| 日本一区二区在线免费看| 亚洲国产天堂久久综合网| 亚洲饱满人妻视频| 亚洲国产精品第一区二区三区| 国产亚洲精品品视频在线 | 爱v天堂在线观看| 少妇又紧又爽丰满在线视频| 日韩国产精品无码一区二区三区| 精品性影院一区二区三区内射 | 四虎永久免费影院在线| 国产精品毛片大尺度激情| 国产av一区二区三区性入口| 毛片亚洲av无码精品国产午夜| 国产精品白浆一区二区免费看 | 亚洲丝袜美腿精品视频| 男人的天堂av网站| 国产人妻黑人一区二区三区| 人妻少妇久久精品一区二区| 国产精品黑丝高跟在线粉嫩| 亚洲精品无码不卡在线播放he| 9久9久女女热精品视频免费观看| 久久精品国产亚洲av四区| 7777色鬼xxxx欧美色妇| 久久精品久久精品中文字幕| 午夜男女视频一区二区三区| 成人av片在线观看免费| a级国产乱理论片在线观看| AV中文字幕在线视| 久久精品亚州中文字幕|