王欣,趙鵬,李清揚(yáng),田平芳
(1北京化工大學(xué)生命科學(xué)與技術(shù)學(xué)院,北京100029;2華南理工大學(xué)食品科學(xué)與工程學(xué)院,廣東廣州510641)
合成生物學(xué)(synthetic biology)是從最基本要素開(kāi)始設(shè)計(jì)和構(gòu)建新生物體系,或修改現(xiàn)有生物體系的一門(mén)交叉學(xué)科[1-2]。近年來(lái),人工基因電路已取得顯著進(jìn)展,在此基礎(chǔ)上耦合半導(dǎo)體材料形成了生物-非生物混合體系(living-nonliving hybrid system)。在該雜合體系中,人工細(xì)胞可與半導(dǎo)體材料建立聯(lián)系,由此形成一個(gè)新的研究方向——半導(dǎo)體合成生物學(xué)(semiconductor synthetic biology/SemiSynBio,SSB)。半導(dǎo)體合成生物學(xué)探索工程細(xì)胞與半導(dǎo)體材料之間的協(xié)同作用。無(wú)論是半導(dǎo)體材料還是細(xì)胞,二者都涉及電子的受控流動(dòng),區(qū)別在于半導(dǎo)體材料涉及物理現(xiàn)象中電子在線(xiàn)路中的長(zhǎng)程運(yùn)動(dòng),而細(xì)胞則涉及化學(xué)反應(yīng)中電子在分子間的短程運(yùn)動(dòng)。當(dāng)半導(dǎo)體縮小到物理極限時(shí),就能幾乎匹配活細(xì)胞以化學(xué)方式處理的電子傳遞。因此在半導(dǎo)體合成生物學(xué)領(lǐng)域,物理信號(hào)將超越以往簡(jiǎn)單的傳遞方式,轉(zhuǎn)變?yōu)榧?xì)胞-半導(dǎo)體間的雙向通信,即一方面細(xì)胞能接收來(lái)自半導(dǎo)體的電、熱、機(jī)械等物理信號(hào),從而調(diào)控其代謝行為;另一方面半導(dǎo)體材料也能感知來(lái)自細(xì)胞的電子、代謝物及生物大分子等信號(hào),從而實(shí)現(xiàn)物質(zhì)或信號(hào)的輸出[3]。由此可見(jiàn),半導(dǎo)體合成生物體系包括:(1)以活細(xì)胞為感應(yīng)基礎(chǔ)的“生物前端”層;(2)以非生物材料為信息計(jì)算模塊的“半導(dǎo)體后端”層。因此,該研究方向?qū)儆诮徊鎸W(xué)科,具有理論和應(yīng)用雙重意義。本文綜述了近年來(lái)半導(dǎo)體合成生物學(xué)具有代表性且發(fā)展迅速的領(lǐng)域。
為滿(mǎn)足日益增長(zhǎng)的能源需求并克服化石燃料的局限性,人們正在尋求可持續(xù)的新能源生產(chǎn)方法。光合作用對(duì)碳元素的利用率接近100%,但整個(gè)過(guò)程的能量轉(zhuǎn)換效率非常低(一般在5%以下)[4]。固態(tài)半導(dǎo)體光吸收器比生物體更能有效地捕獲光,能量轉(zhuǎn)換效率接近20%(Shockley-Queisser極限為33.7%)[5-6]。因此,將高選擇性生物催化體系和高效光收集器進(jìn)行集成,建立混合系統(tǒng),其碳利用效率將超過(guò)天然光合作用[7-9]。該半導(dǎo)體-細(xì)胞混合體系包括三部分:細(xì)胞、半導(dǎo)體材料及界面接口。
細(xì)胞通過(guò)復(fù)雜的表面結(jié)構(gòu)與外環(huán)境進(jìn)行物質(zhì)與能量交換。非光合微生物例如大腸桿菌(Escherichiacoli)[10]、酵 母 菌(Saccharomyces cerevisiae)[11]、卵形鼠孢菌(Sporomusa ovata)[12]、熱醋穆?tīng)柺暇∕oorella thermoacetica)[13]和羅爾斯通氏菌(Ralstonia eutropha)[14-15]等已被開(kāi)發(fā)為半導(dǎo)體-細(xì)胞雜交體系進(jìn)行人工光合作用。在這種混合雜交系統(tǒng)中,厭氧菌能在有氧條件下接收外界非生物組件傳遞的信號(hào)或還原當(dāng)量,之后利用細(xì)胞內(nèi)特有途徑進(jìn)行氧化-還原反應(yīng),從而合成化學(xué)品或能源燃料。非生物部分應(yīng)具有親微生物表面,可促進(jìn)材料和微生物的穩(wěn)定整合。與聚合物和金屬相比,半導(dǎo)體材料因其在生物界面處的多種信號(hào)傳導(dǎo)機(jī)制而更適用于電子和光子生物界面。同時(shí),高性能無(wú)機(jī)半導(dǎo)體可被精確制造成各種納米級(jí)結(jié)構(gòu),以匹配亞細(xì)胞和分子成分的大小。例如,硅納米線(xiàn)(SiNWs)的直徑(d=1~100 nm)比哺乳動(dòng)物細(xì)胞(dcell≈10μm)小幾個(gè)數(shù)量級(jí),且具有較大的長(zhǎng)徑比(約103),這有助于在分子水平上研究復(fù)雜的信號(hào)調(diào)控模式[16]。除硅(Si)[17]之外,常見(jiàn)的非生物體部分還包括磷化銦(InP)[11]、硫化鎘(CdS)[13,18]、磷酸鈷(CoP)[19]、金納米團(tuán)簇(AuNCs)[20]、石墨相碳氮化物(g-C3N4)[14-15]等半導(dǎo)體材料。生物體和非生物體之間的耦合需要穩(wěn)定且高效的界面接口,如此才能構(gòu)建與自然系統(tǒng)相同的信號(hào)傳導(dǎo)機(jī)制,從而準(zhǔn)確地調(diào)控細(xì)胞-半導(dǎo)體混合系統(tǒng)。界面接口的形成則需要細(xì)胞和半導(dǎo)體材料間極為緊密和高表面積的接觸,以便維持細(xì)胞活力和半導(dǎo)體性能[21]。在細(xì)胞-半導(dǎo)體雜交體中實(shí)現(xiàn)這種界面需要做到三個(gè)方面:(1)選擇并設(shè)計(jì)適當(dāng)?shù)纳锖头巧锍煞忠源_保二者的相容性;(2)通過(guò)親和結(jié)合或自組裝進(jìn)行化學(xué)耦合;(3)建立人工材料與細(xì)胞之間的能量轉(zhuǎn)導(dǎo)及耦合。
細(xì)胞與半導(dǎo)體的連接一般為直接物理接觸(圖1)。Kim等[16]將哺乳動(dòng)物細(xì)胞培養(yǎng)在含垂直排列的SiNW陣列的基底上,數(shù)天后,SiNW陣列與正在生長(zhǎng)的細(xì)胞緊密結(jié)合,該研究表明無(wú)外力作用下半導(dǎo)體材料與細(xì)胞的自然結(jié)合。Sakimoto等[13]則采用生物沉淀的方法使M.thermoacetica表面附著CdS納米顆粒,建立了良好的生物界面。再如,Wei等[10]在大腸桿菌中融合表達(dá)外膜蛋白OmpA和金屬結(jié)合蛋白PbrR,可特異性吸附Pb和Cd離子,從而在菌表面形成PbS和CdS界面層,促使菌體在有氧條件下持續(xù)產(chǎn)氫。Tremblay等[14-15]則將g-C3N4顆粒與R.eutrophaH16共培養(yǎng)構(gòu)建雜交光合系統(tǒng),轉(zhuǎn)化光能后得到部分還原當(dāng)量,然后通過(guò)乙酰乙酰輔酶A還原酶PhbB直接供給聚羥基丁酸酯的合成。在人工光合雜交系統(tǒng)中,半導(dǎo)體光吸收器具有較高的載流子遷移率,比生物體更高效地吸收光,但卻不能有效地將光激發(fā)電子的能量轉(zhuǎn)移至碳鍵合成中。因此,利用非光合細(xì)菌的優(yōu)異胞內(nèi)固碳能力將半導(dǎo)體吸收的光能轉(zhuǎn)換成化學(xué)能,從而最大限度地利用太陽(yáng)能。此前研究中,自養(yǎng)細(xì)菌已廣泛用于生產(chǎn)簡(jiǎn)單有機(jī)分子,而將異養(yǎng)生物與半導(dǎo)體光收集器融合,則在復(fù)雜代謝物的合成方面更具優(yōu)勢(shì)。
圖1 半導(dǎo)體-細(xì)胞雜合體系介導(dǎo)的生物催化示意圖Fig.1 Schematic diagram of biocatalysis mediated by semiconductor-cell hybrid system
人工光合雜交系統(tǒng)的電子轉(zhuǎn)移機(jī)制可根據(jù)細(xì)胞膜上是否存在氫化酶而分為兩種:(1)非氫化酶介導(dǎo)的直接電子轉(zhuǎn)移,該過(guò)程發(fā)生在光合作用的前3 h,其特點(diǎn)符合慢電荷轉(zhuǎn)移動(dòng)力學(xué),當(dāng)細(xì)胞與半導(dǎo)體直接接觸后,通過(guò)自身的還原蛋白[例如,細(xì)胞色素(Cyt)、鐵氧還蛋白(Fd)、黃素蛋白(Fp)]或?qū)щ姳廾珜怆娮觽鬟f到自身細(xì)胞的化學(xué)反應(yīng)中,并不依賴(lài)H2或NAD(P)H作為還原當(dāng)量的來(lái)源[22];(2)氫化酶介導(dǎo)的間接電子轉(zhuǎn)移,該過(guò)程遵循驅(qū)動(dòng)電子到膜結(jié)合氫化酶的電荷轉(zhuǎn)移動(dòng)力學(xué),在24 h內(nèi)積累足量的H2、甲酸等代謝物,并通過(guò)HydABC絡(luò)合物氧化進(jìn)入Wood-Ljungdahl途徑,為細(xì)胞提供還原當(dāng)量(圖1)[23-25]。總之,以細(xì)胞色素和氫化酶為代表的膜結(jié)合蛋白在電子-空穴對(duì)分離過(guò)程中發(fā)揮重要的電子傳遞作用[22,26]。Jensen等[27]在大腸桿菌中異源表達(dá)希瓦氏菌(Shewanella oneidensis)的胞外電子傳遞色素蛋白(CymA、MtrA、MtrB、MtrC),重構(gòu)了胞外電子傳遞路徑(CymA-MtrCAB),使外膜上的固體金屬氧化物被還原。該研究表明,合成生物學(xué)可改變細(xì)胞特性,使其成為與無(wú)機(jī)納米材料相容的界面細(xì)胞。因此,研究重點(diǎn)將著眼于提高材料的電子-空穴對(duì)分離效率以及電子從半導(dǎo)體到細(xì)胞的轉(zhuǎn)移能力[28-29]。深入了解電子在細(xì)胞內(nèi)的分子響應(yīng)機(jī)制有助于改進(jìn)半導(dǎo)體材料對(duì)信號(hào)的集成和傳導(dǎo)性能。
當(dāng)電子或還原當(dāng)量通過(guò)細(xì)胞膜進(jìn)入胞內(nèi),細(xì)胞內(nèi)分子響應(yīng)機(jī)制可分為人為調(diào)控和胞內(nèi)自主調(diào)控(圖1)。人為調(diào)控是根據(jù)需求對(duì)胞內(nèi)代謝途徑進(jìn)行改造,使細(xì)胞從半導(dǎo)體材料中獲得的能量集中用于某特定代謝途徑或途徑中某一步驟,對(duì)細(xì)胞獲得的還原力進(jìn)行有目的地分配。該方面Guo等[11]構(gòu)建的基因工程酵母-InP雜化平臺(tái)是一成功案例。NADPH是生物合成中的關(guān)鍵氧化還原輔因子。酵母中的NADPH主要來(lái)自磷酸戊糖途徑(PPP)。當(dāng)缺失葡萄糖-6-磷酸脫氫酶基因zwf1時(shí),PPP的氧化部分被破壞,極大降低胞漿NADPH的再生能力,直接影響莽草酸的合成,最終導(dǎo)致其前體3-脫氫莽草酸(DHS)的積累[30]。研究者在此基礎(chǔ)上利用附著在酵母細(xì)胞表面的光收集半導(dǎo)體顆粒InP提供缺失的還原當(dāng)量,促使DHS高效合成莽草酸[11]。此外,在釀酒酵母表面覆蓋氮化鎵(GaN)納米薄膜,使其能夠吸收紫外線(xiàn)提供的能量,在細(xì)胞表面積累電荷,激活細(xì)胞壁中的幾丁質(zhì)合成途徑[31]。另一種胞內(nèi)自主調(diào)控機(jī)制則是遵循細(xì)胞正常代謝途徑所需,利用半導(dǎo)體材料的電子或還原當(dāng)量生產(chǎn)簡(jiǎn)單有機(jī)小分子。如Sakimoto等[13]建立了M.thermoacetica-CdS雜交體系,CdS經(jīng)光照激發(fā)的光生電子產(chǎn)生還原當(dāng)量[H]直接進(jìn)入Wood-Ljungdahl途徑,驅(qū)動(dòng)CO2經(jīng)乙酰-CoA合成乙酸。Wood-Ljungdahl途徑是已知厭氧生物固碳途徑中能耗最低、路徑最短的途徑,符合細(xì)胞自主調(diào)節(jié)的能量分配原則。
半導(dǎo)體-細(xì)胞雜交體系介導(dǎo)的生物催化發(fā)展極為迅速,已開(kāi)發(fā)出若干細(xì)胞和半導(dǎo)體材料的組合。除光合雜交體系外,Kladko等[32]開(kāi)發(fā)了一種海膽狀磁性納米顆粒。附著在酵母細(xì)胞表面的磁性顆??山?jīng)低頻磁場(chǎng)(100 Hz)驅(qū)動(dòng)而改變空間排布,在不影響細(xì)胞生存的范圍內(nèi)改變細(xì)胞膜通透性,使釀酒酵母利用葡萄糖生產(chǎn)乙醇的轉(zhuǎn)化率提高了150%。隨著對(duì)雜交系統(tǒng)的電子轉(zhuǎn)移機(jī)制及細(xì)胞能量代謝方式的深入研究,半導(dǎo)體合成生物學(xué)將為清潔能源開(kāi)發(fā)、大宗化學(xué)品生產(chǎn)及高值藥物合成等提供重要技術(shù)支撐。
生物傳感器(biosensor)是一種可識(shí)別生物分子并將代謝物濃度轉(zhuǎn)化為光、電等信號(hào)的檢測(cè)儀器。它以生物敏感材料為識(shí)別元件,以可響應(yīng)光、電、壓力、場(chǎng)效應(yīng)等信號(hào)的材料為理化換能器,實(shí)現(xiàn)生物信號(hào)的轉(zhuǎn)換與輸出。自1967年第一個(gè)生物傳感器——葡萄糖傳感器[33]問(wèn)世以來(lái),科學(xué)家們以酶、抗體、細(xì)胞器、動(dòng)植物組織等為特異性響應(yīng)元件,開(kāi)發(fā)出多種生物傳感器。傳統(tǒng)生物傳感器靈敏度高、特異性好,但功能有限?;罴?xì)胞-半導(dǎo)體材料雜交體系可通過(guò)胞內(nèi)生化反應(yīng)實(shí)現(xiàn)對(duì)外環(huán)境的實(shí)時(shí)監(jiān)測(cè),且可對(duì)外界信號(hào)做出反應(yīng),從而執(zhí)行普通生物活性材料無(wú)法完成的功能。這種新型智能生物傳感器在個(gè)性化診斷、疾病治療、微觀(guān)生物致動(dòng)機(jī)器人開(kāi)發(fā)等方面發(fā)揮重要作用。
生物標(biāo)志物是指器官、組織或細(xì)胞結(jié)構(gòu)功能發(fā)生改變的一類(lèi)生化指標(biāo),為疾病診斷提供確切依據(jù)。生物標(biāo)志物的檢測(cè)通常是將樣本(包括血液、體液、組織液等)取出后在體外進(jìn)行,樣本穩(wěn)定性及檢測(cè)時(shí)效性對(duì)結(jié)果有一定影響。為此,Mimee等[34]制備了一種可攝入的微型生物電子器件(IMBED),用于診斷胃腸道疾病。在該設(shè)備中,工程益生菌與半導(dǎo)體微電子系統(tǒng)形成的雜交系統(tǒng)共同集成于一種可吸收的微型膠囊中[圖2(a)]。當(dāng)患者攝入該膠囊后,血紅素可透過(guò)半透膜與細(xì)胞接觸,并借助細(xì)胞外膜轉(zhuǎn)運(yùn)蛋白ChuA進(jìn)入胞內(nèi)與轉(zhuǎn)錄阻遏物HrtR互作,表達(dá)細(xì)菌熒光素酶操縱子luxCDAB。工程菌將血液信號(hào)轉(zhuǎn)換為生物光信號(hào),隨后由光電探測(cè)器轉(zhuǎn)換為電信號(hào),并從設(shè)備無(wú)線(xiàn)傳輸?shù)酵獠繜o(wú)線(xiàn)電或蜂窩電話(huà),用于讀取和分析。裝載不同工程菌的設(shè)備可對(duì)血紅素、?;呓z氨酸內(nèi)酯(AHL)以及硫代硫酸鹽等腸道炎癥的相關(guān)生物標(biāo)記物產(chǎn)生響應(yīng),為胃腸道疾病檢測(cè)提供一種快速、微創(chuàng)且經(jīng)濟(jì)有效的檢測(cè)手段。除了用于個(gè)性化診斷,智能化生物傳感器的信號(hào)接收器和轉(zhuǎn)換器的定位并非一成不變。當(dāng)半導(dǎo)體材料成為信號(hào)接收載體,活細(xì)胞就能以此調(diào)節(jié)自身功能從而實(shí)現(xiàn)疾病精準(zhǔn)治療。葉海峰團(tuán)隊(duì)[35]將電子設(shè)備生成和讀取數(shù)字信號(hào)的能力與光遺傳工程細(xì)胞相結(jié)合,通過(guò)智能手機(jī)無(wú)線(xiàn)調(diào)控工程菌在小鼠體內(nèi)生產(chǎn)胰島素或胰高血糖素樣肽1(shGLP-1),推動(dòng)糖尿病細(xì)胞療法的臨床應(yīng)用。他們以一個(gè)32位的嵌入式微處理器芯片作為系統(tǒng)的智能控制器,在接收電子指令后觸發(fā)生物相容性的遠(yuǎn)紅光源(FRL),并激活細(xì)菌的環(huán)二鳥(niǎo)苷酸(c-di-GMP)合酶BphS和c-di-GMP特異性磷酸二酯酶YhjH,從而實(shí)現(xiàn)基因表達(dá)調(diào)控[圖2(b)]。通過(guò)該半自動(dòng)生物傳感平臺(tái),采用手機(jī)App即可實(shí)現(xiàn)遠(yuǎn)程控制糖尿病患者血糖,顛覆了傳統(tǒng)口服和藥物注射治療糖尿病的方法。
DNA是一種天然生物高分子,可通過(guò)堿基互補(bǔ)配對(duì)完成精準(zhǔn)高效自組裝,也可響應(yīng)不同刺激改變自身結(jié)構(gòu)。因此,DNA作為結(jié)構(gòu)基元可合成多種功能材料。DNA水凝膠不僅包含水凝膠的骨架結(jié)構(gòu),而且具有DNA的生物功能?;贒NA構(gòu)象變化的可逆性,可實(shí)現(xiàn)水凝膠溶液狀態(tài)和凝固狀態(tài)的可逆調(diào)控,體現(xiàn)了材料結(jié)構(gòu)與功能的完美融合[36]。仰大勇課題組[37]提出了構(gòu)建超軟動(dòng)態(tài)DNA水凝膠的新策略,制備了一種能對(duì)不同極性溶劑快速而靈敏響應(yīng)的DNA/多巴胺接枝葡聚糖軟體水凝膠,并成功利用這種DNA水凝膠導(dǎo)線(xiàn)電路控制釀酒酵母發(fā)酵過(guò)程[圖3(a)]。此外,該課題組還基于滾環(huán)擴(kuò)增(RCA)方式合成了具有形狀適應(yīng)性的DNA水凝膠機(jī)器人。在遠(yuǎn)距離磁力驅(qū)動(dòng)下,該機(jī)器人可通過(guò)快速變形和恢復(fù)形狀來(lái)實(shí)現(xiàn)狹窄和結(jié)構(gòu)復(fù)雜環(huán)境中的導(dǎo)航。具有良好生物相容性的DNA機(jī)器人成為智能運(yùn)輸活細(xì)胞的工具,可在體內(nèi)診斷治療、植入式醫(yī)療和微創(chuàng)手術(shù)等方面執(zhí)行復(fù)雜任務(wù)[圖3(a)][38]。Hamada等[39]受新陳代謝的啟發(fā),提出DASH機(jī)制——基于DNA的層次材料組裝與合成。該理論認(rèn)為,DNA分子可被合成并組裝為一種層級(jí)結(jié)構(gòu),它在液體環(huán)境中可攝取外界能量,并按指令自動(dòng)進(jìn)行生長(zhǎng)與降解,從而得到一種由人工代謝提供動(dòng)力的動(dòng)態(tài)材料[圖3(a)]。這種材料有望用于開(kāi)發(fā)新一代生物芯片或傳感機(jī)器人。
圖2 可吸收的微電子設(shè)備(IMBED)示意圖(a);智能手機(jī)調(diào)控工程細(xì)胞的表達(dá),實(shí)現(xiàn)半自動(dòng)血糖穩(wěn)態(tài)(b)Fig.2 Schematic diagram of absorbable microelectronic equipment(IMBED)(a);Smart phones regulate engineered cells to achieve semi-automatic blood glucose homeostasis(b)
圖3 DNA水凝膠的應(yīng)用(a);工程細(xì)胞-柔性材料軟機(jī)器人示意圖(b)Fig.3 Applications of DNA hydrogel(a);Schematic diagram of engineered cell-flexible materials-based soft robot(b)
當(dāng)半導(dǎo)體-智能細(xì)胞與生物基材料耦合時(shí),信號(hào)轉(zhuǎn)換與傳遞得到進(jìn)一步擴(kuò)展,一種新型生物混合機(jī)器也隨之誕生[40-42]。Justus等[43]用聚醚砜膜(PES膜)、聚碳酸酯軌跡蝕刻膜(PCTE膜)和多孔PDMSNaHCO3膜將重組大腸桿菌與嵌入式電子元件集成到密封的彈性體材料中[圖3(b)]。PES膜和PCTE膜孔徑分布均勻,可在截留大腸桿菌的同時(shí)允許化學(xué)刺激從外部環(huán)境傳輸?shù)皆O(shè)備;多孔PDMS-NaHCO3膜具有彈性和光學(xué)透明性,可使工程菌在流體通道的液體介質(zhì)中運(yùn)動(dòng)并輸送光遺傳信號(hào)。當(dāng)生物傳感模塊中的菌株接受刺激并合成熒光蛋白后,嵌入式電子元件被激活,將生物信號(hào)轉(zhuǎn)換成電子信號(hào)并通過(guò)調(diào)整下一級(jí)層中水凝膠的狀態(tài),來(lái)控制微型軟夾持器的抓取行為。這項(xiàng)工作真正賦予機(jī)器人的自主功能,為軟材料和集成界面機(jī)器人的研發(fā)開(kāi)辟了新方向。
半導(dǎo)體器件的特點(diǎn)是響應(yīng)速度快、可放大信號(hào)并具有一定容錯(cuò)性,這些優(yōu)點(diǎn)很適于調(diào)控生物系統(tǒng)的復(fù)雜動(dòng)力學(xué)[44-45];而活細(xì)胞具有復(fù)雜的基因表達(dá)及代謝能力,能夠執(zhí)行無(wú)機(jī)材料無(wú)法完成的工作。因此,二者結(jié)合將同時(shí)打破材料及生物系統(tǒng)等領(lǐng)域的技術(shù)瓶頸,具有廣闊應(yīng)用前景。
目前,數(shù)據(jù)存儲(chǔ)介質(zhì)大多是性能良好的半導(dǎo)體材料。數(shù)據(jù)存儲(chǔ)密度與材料的物理尺寸以及電路集成能力密切相關(guān)。然而,半導(dǎo)體材料構(gòu)成的電路已接近其性能極限;此外,亞納米水平的集成也因元件間距過(guò)小而面臨量子干擾、庫(kù)侖阻塞等物理效應(yīng)的限制。因此,開(kāi)發(fā)新的數(shù)據(jù)存儲(chǔ)方法才能解決當(dāng)今信息太多而存儲(chǔ)能力弱的矛盾。分子數(shù)據(jù)存儲(chǔ)是一種密集且持久的信息存儲(chǔ)方式,但半導(dǎo)體材料需在極低溫度下(約-210℃)才能保持單分子級(jí)的數(shù)據(jù)存儲(chǔ)性能,昂貴的冷卻系統(tǒng)限制了該方法大規(guī)模應(yīng)用。DNA作為生物遺傳信息的載體,其獨(dú)特的生物學(xué)特性使其在存儲(chǔ)時(shí)間、存儲(chǔ)密度和數(shù)據(jù)讀取等方面具有優(yōu)勢(shì)。
首先,DNA具有雙螺旋結(jié)構(gòu),脫氧核苷酸外側(cè)通過(guò)共價(jià)的3,5-磷酸二酯鍵結(jié)合,內(nèi)部則通過(guò)堿基互補(bǔ)配對(duì)形成大量氫鍵。DNA的穩(wěn)定結(jié)構(gòu)確保其較長(zhǎng)的半衰期,因而可長(zhǎng)期甚至永久存儲(chǔ)數(shù)據(jù)[46-48]。第二,DNA具有極高的數(shù)據(jù)存儲(chǔ)密度。DNA分子中的堿基分為腺嘌呤(A)、鳥(niǎo)嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)四種(以A-T,C-G方式配對(duì),形成堿基對(duì),bp),它們類(lèi)似于計(jì)算機(jī)二進(jìn)制代碼中的“0”和“1”[49-50]。與二進(jìn)制代碼相比,DNA序列由于堿基種類(lèi)的倍增而可容納更多信息。例如,對(duì)于一段長(zhǎng)度為X的字符串,二進(jìn)制系統(tǒng)只能包含2X倍信息,而含四種堿基的DNA則可容納4X倍信息,即單個(gè)脫氧核苷酸可表示兩個(gè)比特的信息[51]。此外,單個(gè)脫氧核苷酸分子的質(zhì)量極小(約為4.982×10-22g),理論上每克單鏈DNA能夠存儲(chǔ)高達(dá)455艾字節(jié)的數(shù)據(jù)(1艾字節(jié)=260字節(jié)≈1.15×1018字節(jié))[52]。當(dāng)這些龐大數(shù)據(jù)信息存儲(chǔ)在大腸桿菌基因組DNA(5.44×106bp)時(shí),卻只占用不到1 cm3的空間。電子顯微觀(guān)察發(fā)現(xiàn),約200 bp的DNA分子被壓縮在直徑為10 nm的核小體結(jié)構(gòu)中。一個(gè)核小體的尺寸及其包含的遺傳信息量已經(jīng)優(yōu)于一個(gè)晶體管電路所具有的信息存儲(chǔ)能力。DNA在細(xì)胞內(nèi)還可進(jìn)一步纏繞形成染色體,最終完成近8400倍的壓縮。這意味著如果能成功利用DNA來(lái)存儲(chǔ)數(shù)據(jù),那么當(dāng)前的海量信息可包裝在一個(gè)0.00352 m3盒子里,約1 kg DNA即可滿(mǎn)足2040年世界的存儲(chǔ)需求(3×1024位)[51]。第三,DNA可通過(guò)聚合酶鏈?zhǔn)椒磻?yīng)(PCR)方便快速且高保真地復(fù)制,這使得大規(guī)模數(shù)據(jù)備份變得簡(jiǎn)單[53]。同時(shí),日益成熟的全基因合成及測(cè)序技術(shù)為大片段DNA的數(shù)據(jù)寫(xiě)入和讀取提供了保障[52,54]。
DNA數(shù)據(jù)存儲(chǔ)的基本過(guò)程包括:(1)編碼——將數(shù)字信息編碼為DNA序列;(2)合成——將序列寫(xiě)入實(shí)際的DNA分子;(3)存儲(chǔ)——將合成的DNA片段保存在載體或細(xì)胞中;(4)訪(fǎng)問(wèn)——檢索和選擇性讀取序列信息;(5)解碼——將測(cè)定的序列信息轉(zhuǎn)換回?cái)?shù)字信息(圖4)[55]。
信息寫(xiě)入需通過(guò)計(jì)算機(jī)算法將二進(jìn)制代碼映射為DNA序列。由于保真度的要求及合成技術(shù)的限制,DNA序列不能無(wú)限延長(zhǎng),因此信息常被存儲(chǔ)于多個(gè)DNA片段。即每段DNA序列都被加入一些冗余信息,用于檢索和排序以確保信息的正確讀取。盡管額外的冗余有助于提高信息讀取的準(zhǔn)確性,但同時(shí)也占用了空間,采用適當(dāng)?shù)木幋a方案和糾錯(cuò)策略可以平衡讀取準(zhǔn)確性和數(shù)據(jù)冗余度之間的沖突[56]。在設(shè)計(jì)編碼方案時(shí)要充分考慮堿基比率的均一性,從而避免特殊序列(如GC%過(guò)高或包含大量重復(fù)片段)對(duì)擴(kuò)增效率及測(cè)序準(zhǔn)確率的干擾[57-58]。此外,目前的DNA合成和測(cè)序技術(shù)仍難以保證100%的準(zhǔn)確率,所以糾錯(cuò)策略必不可少[59]。最直接的糾錯(cuò)方法就是添加冗余信息,用于提高在數(shù)據(jù)丟失或錯(cuò)誤情況下仍能檢索到原始信息的概率。冗余越多,存儲(chǔ)結(jié)果對(duì)錯(cuò)誤的容忍度越高。例如,Blawat等[60]使用前向糾錯(cuò)方案實(shí)現(xiàn)對(duì)DNA中22 MB數(shù)字?jǐn)?shù)據(jù)的存儲(chǔ)和無(wú)錯(cuò)誤檢索。Erlich等[58]報(bào)道了一種魯棒性很強(qiáng)的“DNA噴泉碼”的存儲(chǔ)策略,該策略在DNA寡核苷酸中存儲(chǔ)了2.14×106字節(jié)的內(nèi)容,并能夠從相當(dāng)于Illumina測(cè)序儀的一個(gè)測(cè)序覆蓋率中完美地檢索到信息。迄今為止,若干課題組建立了多種糾錯(cuò)方法以適應(yīng)不同存儲(chǔ)情況[52,61-62]。除了編碼過(guò)程有嚴(yán)格要求,隨機(jī)訪(fǎng)問(wèn)能力也是DNA數(shù)據(jù)存儲(chǔ)面臨的一項(xiàng)重大挑戰(zhàn)。從計(jì)算機(jī)科學(xué)的角度來(lái)看,預(yù)計(jì)存儲(chǔ)的數(shù)據(jù)將具有隨機(jī)訪(fǎng)問(wèn)權(quán)限。缺乏隨機(jī)訪(fǎng)問(wèn)會(huì)阻礙數(shù)據(jù)容量的擴(kuò)大,當(dāng)檢索少量數(shù)據(jù)時(shí),對(duì)整個(gè)數(shù)據(jù)集進(jìn)行排序和解碼是不切實(shí)際的[56]。目前比較流行的訪(fǎng)問(wèn)DNA數(shù)據(jù)的方法是磁珠提取和PCR擴(kuò)增。Baum[63]基于分子探針原理,展示了如何利用磁珠調(diào)取已做好標(biāo)識(shí)符的數(shù)據(jù)項(xiàng)?;赑CR的隨機(jī)訪(fǎng)問(wèn)由于使用數(shù)據(jù)片段對(duì)應(yīng)的唯一引物,因而具有較高特異性[64]。Organick等[65]研究發(fā)現(xiàn),當(dāng)樣本池的規(guī)模達(dá)到TB級(jí)(1012字節(jié)),PCR方法仍可準(zhǔn)確調(diào)取所需數(shù)據(jù),但該規(guī)模不足以滿(mǎn)足未來(lái)分子數(shù)據(jù)存儲(chǔ)的要求。由于被調(diào)取的DNA片段需經(jīng)測(cè)序解碼來(lái)得到原始信息,所以測(cè)序能力直接影響該存儲(chǔ)方式的發(fā)展。目前使用最廣泛的是Illumina公司開(kāi)發(fā)的DNA測(cè)序平臺(tái)。該平臺(tái)基于合成測(cè)序和圖像分析的概念,以熒光斑點(diǎn)顏色指示序列中的各個(gè)堿基,精確的光學(xué)捕獲裝置和圖像處理技術(shù)有助于提高測(cè)序通量[66-67]。另一是牛津納米孔技術(shù)公司(ONT)商業(yè)化的納米孔測(cè)序技術(shù),可在捕獲DNA后使其通過(guò)一個(gè)電壓箝位的納米級(jí)孔隙,不同堿基將導(dǎo)致孔隙電流出現(xiàn)相對(duì)應(yīng)的微小波動(dòng),從而實(shí)時(shí)讀取序列數(shù)據(jù)[68]。
圖4 DNA數(shù)據(jù)存儲(chǔ)流程圖Fig.4 Flowsheet of digital information storage in DNA
DNA數(shù)據(jù)存儲(chǔ)方興未艾,未來(lái)面臨諸多挑戰(zhàn)。首先,當(dāng)前DNA存儲(chǔ)的寫(xiě)入吞吐量約為每秒千字節(jié)級(jí)別,與主流云存檔存儲(chǔ)系統(tǒng)的每秒億字節(jié)讀寫(xiě)能力仍有數(shù)量級(jí)差距。其次,DNA分子的物理保存方式也需斟酌[69-70]。體內(nèi)和體外存儲(chǔ)各有其優(yōu)勢(shì):在備份成本方面,雖然體內(nèi)存儲(chǔ)比體外寡核苷酸文庫(kù)的合成更復(fù)雜,但細(xì)胞自主的DNA合成和糾錯(cuò)更具成本優(yōu)勢(shì);在長(zhǎng)期儲(chǔ)存方面,體內(nèi)條件下的DNA降解度慢于體外,因此更適合長(zhǎng)期保存數(shù)據(jù)[71]。隨著DNA合成技術(shù)精度的不斷提高,體外合成比體內(nèi)復(fù)制過(guò)程中由突變?cè)斐傻恼`差更低。目前仍缺乏時(shí)間讀取短且空間占用小的存儲(chǔ)方法,DNA數(shù)據(jù)的讀取過(guò)程仍耗時(shí)長(zhǎng)。未來(lái)新一代合成、測(cè)序及檢索技術(shù)將為DNA數(shù)據(jù)存儲(chǔ)帶來(lái)質(zhì)的飛躍。
半導(dǎo)體合成生物學(xué)利用材料科學(xué)的工具和方法去發(fā)展和調(diào)控生物系統(tǒng),同時(shí)基于合成生物學(xué)思路開(kāi)發(fā)新材料。生物學(xué)、材料學(xué)、電子學(xué)和計(jì)算機(jī)科學(xué)等多學(xué)科交叉可促進(jìn)生物學(xué)與半導(dǎo)體技術(shù)的日益融合,衍生出具有重要價(jià)值的研究課題。
(1)半導(dǎo)體材料能高效吸收轉(zhuǎn)化光能、磁能、化學(xué)能,活細(xì)胞則將能量用于自身代謝并合成高附加值產(chǎn)品。用于生物催化的半導(dǎo)體-細(xì)胞雜合體系是目前研究熱點(diǎn)[72]。本課題組致力于工業(yè)微生物的遺傳改造和調(diào)控,其中包括將還原性三羧酸循環(huán)及C4模塊導(dǎo)入大腸桿菌,使其固定CO2而生產(chǎn)化學(xué)品。對(duì)于大腸桿菌等非光合細(xì)菌,該途徑提供的還原力及能量不足,而細(xì)胞與半導(dǎo)體材料耦合可彌補(bǔ)該缺陷,從而提高CO2利用率。材料與細(xì)胞表面的接觸對(duì)細(xì)胞間原有信號(hào)傳遞、生物被膜等造成干擾。如何減輕或平衡能量傳輸對(duì)細(xì)胞的負(fù)荷和不良刺激,加速能量傳遞,是發(fā)展半導(dǎo)體生物催化的關(guān)鍵。此外,經(jīng)半導(dǎo)體材料傳輸?shù)哪芰吭谶M(jìn)入細(xì)胞后會(huì)遵循胞內(nèi)能量代謝方式,缺乏可控性。未來(lái),利用合成生物學(xué)手段開(kāi)發(fā)胞內(nèi)多模塊間正交能量分配或許是新突破。
(2)半導(dǎo)體器件可放大信號(hào)、具有一定容錯(cuò)性且響應(yīng)速度快,適于調(diào)控復(fù)雜生物系統(tǒng)[44-45];而活細(xì)胞具有精密的基因表達(dá)及代謝能力,能夠執(zhí)行無(wú)機(jī)材料無(wú)法完成的工作。二者結(jié)合將同時(shí)打破材料及生物系統(tǒng)等領(lǐng)域的技術(shù)瓶頸。例如,通過(guò)課題組之間的協(xié)作,以極端微生物為底盤(pán)細(xì)胞,將其與多重納米材料相結(jié)合,以便監(jiān)測(cè)與修復(fù)環(huán)境。其中的工程細(xì)胞可感知環(huán)境中污染物的濃度,而半導(dǎo)體材料傳感器則負(fù)責(zé)信息的反饋;之后,信息集成模塊根據(jù)污染物的種類(lèi),通過(guò)不同信號(hào)輸入激活工程菌中相應(yīng)的污染物降解途徑,從而實(shí)現(xiàn)“自感知-自反饋-多樣化處理”的目標(biāo)。目前,生物傳感器的應(yīng)用已經(jīng)從基礎(chǔ)的物質(zhì)檢測(cè)擴(kuò)展到了復(fù)雜的生物醫(yī)療。然而,相對(duì)于半導(dǎo)體響應(yīng)元件,人們對(duì)活細(xì)胞功能的開(kāi)發(fā)程度還較低。今后,將外部傳感信號(hào)與胞內(nèi)如群體感應(yīng)(quorum sensing)等自主交流方式相耦合,同時(shí)結(jié)合人工智能手段賦予細(xì)胞“感應(yīng)-分析-指令-行動(dòng)”等能力,有望使生物傳感技術(shù)邁向新臺(tái)階。
(3)DNA數(shù)據(jù)存儲(chǔ)是未來(lái)信息存儲(chǔ)的發(fā)展趨勢(shì),其優(yōu)點(diǎn)在于存儲(chǔ)密度大、易保存且受外界條件影響小。然而,DNA合成成本高以及讀取速度慢等缺點(diǎn)仍是挑戰(zhàn)。盡管如此,現(xiàn)有物種DNA圖譜復(fù)雜多樣,包含信息量巨大,若將DNA存儲(chǔ)的編碼算法與之耦合即可將生物基因組作為天然存儲(chǔ)單元,節(jié)約合成成本。此外,新一代測(cè)序技術(shù)助力DNA的精確和快速讀取。
未來(lái)半導(dǎo)體合成生物學(xué)仍將遵循“設(shè)計(jì)-構(gòu)建-測(cè)試-學(xué)習(xí)”(design-build-test-learn)的閉環(huán)思路,在細(xì)胞、組織和系統(tǒng)各個(gè)水平不斷發(fā)展和優(yōu)化生物-非生物雜合體系并拓展其應(yīng)用。