閆 晗 惠 敏 沙忠利① 程 嬌①
(1.中國科學(xué)院海洋研究所海洋生物分類與系統(tǒng)演化實(shí)驗(yàn)室 青島市海洋生物多樣性與保護(hù)重點(diǎn)實(shí)驗(yàn)室 山東青島 266071;2.嶗山實(shí)驗(yàn)室 山東青島 266237; 3.中國科學(xué)院大學(xué) 北京 100049)
自1977 年美國深海潛水器阿爾文號在加拉帕戈斯裂谷附近發(fā)現(xiàn)深海熱液活動(dòng)和高密度的熱液生物群落以來, 深?;芎铣缮鷳B(tài)系統(tǒng)開始展現(xiàn)于世人面前(Corlisset al, 1979)。隨后, 1983 年美國研究人員在廣闊的墨西哥灣3 200 m 深處首次發(fā)現(xiàn)了海底冷泉系統(tǒng)(Andersonet al, 1983)。與依賴太陽光能的光合生態(tài)系統(tǒng)不同, 以熱液和冷泉為代表的深海化能合成生態(tài)系統(tǒng)主要依靠化能自養(yǎng)微生物利用硫化氫(H2S)、元素硫(S)、甲烷(CH4)和氫氣(H2)等還原性物質(zhì)氧化產(chǎn)生的能量進(jìn)行固碳、合成有機(jī)物, 從而維持生態(tài)系統(tǒng)的運(yùn)轉(zhuǎn), 這種“黑暗食物鏈”的發(fā)現(xiàn)改變了人們對深海初級生產(chǎn)力主要來源的認(rèn)知(Dubilieret al, 2008)。此外, 深海化能生態(tài)系統(tǒng)是認(rèn)識特殊生命過程和研究生物適應(yīng)性進(jìn)化的天然實(shí)驗(yàn)場所。深?;墉h(huán)境具有黑暗、高壓、低氧、寡營養(yǎng)且富含高濃度硫化物、甲烷和重金屬等特征, 大型生物卻能在如此極端環(huán)境中生存并形成群落, 主要原因是它們經(jīng)過長期的適應(yīng)與歷史進(jìn)化過程, 形成了獨(dú)特的生命特征和環(huán)境適應(yīng)機(jī)制(程嬌等, 2021)。因此, 對深?;芎铣缮鷳B(tài)系統(tǒng)中生物的環(huán)境適應(yīng)機(jī)制的研究, 不僅將有助于加深對深海極端環(huán)境中特殊生命過程的理解, 也將為深海生物資源的開發(fā)利用奠定理論基礎(chǔ)。
近年來, 高通量測序技術(shù)的快速發(fā)展及大數(shù)據(jù)分析能力的提高, 使得在組學(xué)水平探究深海生物演化和環(huán)境適應(yīng)機(jī)制成為可能。作為后基因時(shí)代應(yīng)用最為廣泛的技術(shù)手段, 轉(zhuǎn)錄組測序技術(shù)可以全面快速獲得生物體在特定時(shí)空或生理?xiàng)l件下幾乎所有轉(zhuǎn)錄本的序列信息和表達(dá)信息, 已經(jīng)在深海生物適應(yīng)性演化機(jī)制研究中逐步得到應(yīng)用。例如, 在雙殼綱貝類中, Zheng 等(2017)通過與淺海貽貝的比較轉(zhuǎn)錄組分析發(fā)現(xiàn)兩種深海偏頂蛤(Bathymodiolus platifrons和B.manusensis)中與共生菌識別相關(guān)的免疫識別受體發(fā)生收縮, 物質(zhì)轉(zhuǎn)運(yùn)、溶酶體活動(dòng)以及細(xì)胞凋亡等相關(guān)基因受正選擇或高表達(dá), 可能有助于共生關(guān)系的建立和維持; 在多毛類環(huán)節(jié)動(dòng)物中, Zhang 等(2017)對分布于熱液區(qū)深海多鱗蟲(Branchipolynoe pettiboneae和Lepidonotopodiumsp.)與淺海近緣物種進(jìn)行了比較轉(zhuǎn)錄組分析, 發(fā)現(xiàn)熱液多鱗蟲可能通過不同類型的血紅蛋白的快速進(jìn)化或高表達(dá)等策略實(shí)現(xiàn)對深海低氧環(huán)境的適應(yīng); 在十足目甲殼動(dòng)物中, Cheng 等(2019)對沖繩熱液與南海冷泉共有優(yōu)勢物種柯氏潛鎧蝦(Shinkaia crosnieri)進(jìn)行轉(zhuǎn)錄組測序和進(jìn)化分析, 提出柯氏潛鎧蝦很可能是通過功能基因的適應(yīng)性進(jìn)化和改變基因的表達(dá)水平來適應(yīng)熱液與冷泉兩種不同的深?;墉h(huán)境。以上研究結(jié)果表明轉(zhuǎn)錄組學(xué)分析方法已成為探究深海極端環(huán)境中特殊生命過程的重要研究手段。然而, 由于二代測序讀取長度短, 轉(zhuǎn)錄本易發(fā)生拼接錯(cuò)誤, 無法準(zhǔn)確獲取完整轉(zhuǎn)錄本, 可變剪切和轉(zhuǎn)錄本多樣性在很大程度上仍然是未知(Zhanget al, 2020), 這限制了深海生物環(huán)境適應(yīng)機(jī)制及深?;蛸Y源開發(fā)方面的深入研究。
十足目鎧甲蝦類是深海多樣性最高的甲殼動(dòng)物類群之一。在深?;苌鷳B(tài)環(huán)境中, 鎧甲蝦是底棲生態(tài)群落中的常見種或優(yōu)勢種。勞盆擬刺鎧蝦(Munidopsis lauensis)隸屬于十足目(Decapoda)、異尾下目(Anomura)、鎧甲蝦總科(Galatheoidea)、擬刺鎧蝦科(Munidopsidae)、擬刺鎧蝦屬(Munidopsis), 是深?;苌虫z甲蝦類代表性物種, 在西太平洋勞海盆(Lau Basin)、馬努斯海盆(Manus Basin)、北斐濟(jì)海盆(North Fiji Basin)、南海東北部以及印度洋等海域的熱液、冷泉區(qū)均有分布, 分布水深在1 120~2 000 m之間(Baba, 2005; Martinet al, 2005; Cubelioet al,2007; Hwanget al, 2022)。目前對勞盆擬刺鎧蝦分子生物學(xué)方面的研究僅局限于線粒體基因組的測定(Sunet al, 2019), 以及微衛(wèi)星分子標(biāo)記的篩選(Boyleet al, 2013)。針對勞盆擬刺鎧蝦深海適應(yīng)性的相關(guān)研究尚未開展, 且該物種基因序列信息相對匱乏, 限制了對其適應(yīng)性分子機(jī)制的深入研究。本研究利用PacBio 平臺的SMRT 測序技術(shù)開展了勞盆擬刺鎧蝦全長轉(zhuǎn)錄組測序, 對獲得的轉(zhuǎn)錄本進(jìn)行注釋分析, 預(yù)測其編碼序列、轉(zhuǎn)錄因子、長鏈非編碼RNA 等, 挖掘可能與其適應(yīng)深海化能極端環(huán)境相關(guān)的關(guān)鍵基因和通路。研究旨在豐富勞盆擬刺鎧蝦的基因資源, 為進(jìn)一步探究深海化能生態(tài)系統(tǒng)中大型底棲甲殼動(dòng)物的進(jìn)化和環(huán)境適應(yīng)分子機(jī)制提供數(shù)據(jù)支持。
用于本研究全長轉(zhuǎn)錄組分析的勞盆擬刺鎧蝦樣品于2021 年6 月由“科學(xué)號”(中國科學(xué)院海洋研究所)科考船上搭載的遙控潛水器Quasar MkII 從位于中 國 南 海 的 臺 西 南 冷 泉(119°17.01′E, 22°06.91′N,~1 118 m)采集。樣品收集到船上后, 通過形態(tài)學(xué)初步鑒定立即進(jìn)行解剖。將肝胰腺、鰓、肌肉和腸組織分離并在液氮中速凍后保存在–80 °C 條件下, 以便用于后續(xù)RNA 提取。保留部分肌肉組織儲存于濃度為70%的乙醇中, 以備于DNA 提取與COI 序列的擴(kuò)增,從而進(jìn)行分子鑒定。
參照使用說明書, 使用Trizol 試劑盒(Invitrogen,Carlsbad, CA, USA)提取各組織的總 RNA。使用Nanodrop2000 微分光光度計(jì)(Thermo Fisher)測定總RNA 的純度和濃度, 使用Agilent 2100 生物分析儀(Agilent Technologies, Palo Alto, CA, USA)檢測總RNA 的完整度以評估RNA 的質(zhì)量。不同組織檢測合格后的總RNA 等量混合, 用于下一步全長轉(zhuǎn)錄組cDNA 文庫的構(gòu)建。
首先用 Oligo(dT) 磁珠富集 mRNA, 再用NEBNext?Single Cell/Low Input cDNA Synthesis &Amplification Module 將mRNA 反轉(zhuǎn)錄成cDNA。然后進(jìn)行PCR 周期優(yōu)化, 用于確定下游大規(guī)模PCR 反應(yīng)的最佳擴(kuò)增周期數(shù), 之后進(jìn)行大規(guī)模PCR 富集合成cDNA。cDNA 經(jīng)過DNA 損傷修復(fù), 末端修復(fù), 并與adapter 連接。將SMRTbell 模板與測序引物退火并與聚合酶結(jié)合形成完整的SMRTbell 文庫之后, 在PacBio Sequel II 平臺(美國太平洋生物科學(xué)公司)上進(jìn)行測序。
使用SMRT Link-v8.0.0 (Gordonet al, 2015)處理下機(jī)的PacBio 序列數(shù)據(jù)。首先, 從subreads.bam 文件中提取高質(zhì)量的環(huán)形一致性序列(circular consensus sequence, CCS)。通過去除序列中包含的5'端引物、3'端引物和多聚體結(jié)構(gòu), 獲得全長非嵌合體(full length non-concatemer, FLNC)序列。然后使用Minimap2 (Li,2018)對同一轉(zhuǎn)錄本的FLNC 序列進(jìn)行聚類, 獲得到一致性序列。再使用Quiver 算法對序列進(jìn)行校正, 獲得高質(zhì)量一致轉(zhuǎn)錄本。使用CD-HIT-v4.6.7 (Cluster Database at High Identity with Tolerance) (Fuet al,2012)對獲得的一致性序列去冗余, 得到勞盆擬刺鎧蝦的全長轉(zhuǎn)錄本。最后, 基于BUSCO (Benchmarking Universal Single-Copy Orthologs)的節(jié)肢動(dòng)物單拷貝直系同源基因標(biāo)準(zhǔn)集數(shù)據(jù)庫, 使用 BUSCO-v3.0.2(Sim?oet al, 2015)對勞盆擬刺鎧蝦的全長轉(zhuǎn)錄本集進(jìn)行完整性評估。
為了獲得勞盆擬刺鎧蝦全長轉(zhuǎn)錄本的注釋信息,將isoform 序列與NCBI 非冗余蛋白質(zhì)(Nr)數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov)、Swiss-Prot 蛋白質(zhì)數(shù)據(jù)庫(http://www.expasy.ch/ sprot) 、 KEGG 數(shù) 據(jù) 庫(http://www.genome.jp/kegg)和 KOG 數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/COG)進(jìn)行比對分析, 閾值設(shè)置為 1E-5。根據(jù) Nr 數(shù)據(jù)庫的注釋信息, 使用Blast2GO (Conesaet al, 2005)軟件對全長轉(zhuǎn)錄本進(jìn)行GO (Gene Ontology)注釋與功能分類。
使用上述數(shù)據(jù)庫blast 比對和ANGEL (Shimizuet al, 2006)軟件預(yù)測兩種方法獲得全長轉(zhuǎn)錄本蛋白編碼區(qū)(CDS)的核酸序列和氨基酸序列。通過hmmscan 將Isoform 的編碼序列與動(dòng)物TFdb 數(shù)據(jù)庫(http://www.bioguo.org/AnimalTFDB/)進(jìn)行比對, 預(yù)測轉(zhuǎn)錄因子(transcription factor, TF)家族。使用CNCI-v2 (Sunet al,2013)和CPC (Konget al, 2007)軟件預(yù)測編碼能力,并將兩個(gè)軟件判定為非編碼序列的結(jié)果合集作為最終長鏈非編碼RNA (LncRNA)的預(yù)測結(jié)果。利用Perl腳本 MISA (http://pgrc.ipk-gatersleben.de/misa/misa.html)對勞盆擬刺鎧蝦的全長轉(zhuǎn)錄組進(jìn)行簡單重復(fù)序列檢測。
使用Genedoc 軟件(Nicholaset al, 1997)對勞盆擬刺鎧蝦全長轉(zhuǎn)錄組中注釋到的谷胱甘肽 S-轉(zhuǎn)移酶(glutathione S-transferase, GST)候選序列與其他節(jié)肢動(dòng)物不同亞家族的GST 氨基酸序列進(jìn)行多重序列比對?;卩徑臃?neighbor-joining, NJ), 使用MEGA軟件(Kumaret al, 2016)進(jìn)行系統(tǒng)發(fā)育樹的構(gòu)建, 并設(shè)置1 000 次重復(fù)。使用Genedoc 軟件對勞盆擬刺鎧蝦GST theta 亞家族的蛋白序列與包括柯氏潛鎧蝦、家蠶(Bombyx mori) 、 美州東部熊蜂(Bombus impatiens)、二化螟(Chilo suppressalis)在內(nèi)的四種節(jié)肢動(dòng)物的GST-theta 蛋白序列進(jìn)行比對。利用SMART(http://smart.embl-heidelberg.de/)預(yù)測勞盆擬刺鎧蝦GST-theta 蛋白的結(jié)構(gòu)域。
很高興收到你的來信。真的,十六年我從來不知什么叫高興。我以為高興和我無緣了。沒想到,突然收到你的信。你想我能不高興嗎?這是我十六年來第一次擁有一個(gè)最快樂的日子,比過節(jié)還開心快樂。
經(jīng)COI 序列擴(kuò)增、測序與NCBI 數(shù)據(jù)庫進(jìn)行同源比對后, 從形態(tài)和分子層面鑒定所采樣品為勞盆擬刺鎧蝦。采用PacBio Sequel II 平臺對勞盆擬刺鎧蝦肝胰腺、鰓、肌肉和腸組織的RNA 進(jìn)行全長轉(zhuǎn)錄組測序, 共獲得55 402 300 條原始序列, 平均長度為1 506 bp, N50 長度為1 587 bp。經(jīng)零模波導(dǎo)孔(ZMW)循環(huán)過后, 通過環(huán)型一致性序列分析, 共得到1 210 829個(gè)CCS, 平均長度為1 793 bp, 循環(huán)數(shù)為43。對從CCS 得到的FLNC 序列進(jìn)行聚類后獲得36 573 條一致性序列, 經(jīng)過校正后的高質(zhì)量一致轉(zhuǎn)錄本為36 037條。去冗余后, 獲得28 811 條高質(zhì)量非冗余isoform,平均長度為2 086 bp, N50 長度為2 275 bp (表1)。BUSCO 結(jié)果顯示勞盆擬刺鎧蝦全長轉(zhuǎn)錄組中包括節(jié)肢動(dòng)物核心單拷貝同源基因數(shù)的60.51% (圖1a), 表明本研究三代全長轉(zhuǎn)錄組測序獲得的非冗余轉(zhuǎn)錄本相對完整, 可繼續(xù)進(jìn)行下游的數(shù)據(jù)處理。
圖1 勞盆擬刺鎧蝦轉(zhuǎn)錄本的功能注釋Fig.1 Functional annotation of M. lauensis full-length transcripts
表1 基于PacBio 測序的勞盆擬刺鎧蝦全長轉(zhuǎn)錄組測序結(jié)果Tab.1 Summary for the full-length transcriptome of M.lauensis using PacBio sequencing
2.2.1 基本注釋 為了獲得勞盆擬刺鎧蝦更全面的遺傳信息, 將獲得的全長轉(zhuǎn)錄本在Nr、SwissProt、KOG 和 KEGG 數(shù)據(jù)庫中進(jìn)行了比對分析, 共有20 616 (71.6%)條isoform 得到注釋。Nr 數(shù)據(jù)庫搜索比對顯示, 共注釋到348 個(gè)物種, 其中凡納濱對蝦(13 363; 65.01%)、克氏原螯蝦(Procambarus clarkii,881; 4.29%)和中華絨螯蟹(Eriocheir sinensis, 458;2.23%)是比對到同源序列數(shù)目前三的物種。
2.2.2 KOG 功能分類 共有17 957 條isoform 注釋到25 個(gè)KOG 分類中。其中, 占比前三位的功能分類首先是一般功能預(yù)測(general function prediction only), 具有2 990 條(16.65%)注釋信息, 其次是翻譯后修飾、蛋白質(zhì)周轉(zhuǎn)、伴侶(posttranslational modification,protein turnover, chaperones)和信號轉(zhuǎn)導(dǎo)機(jī)制(signal transduction mechanisms), 分別有2 095 (11.67%)和1 690 (9.4%)條基因注釋信息(圖1b)。
2.2.3 GO 功能注釋 將測序獲得的基因與GO 數(shù)據(jù)庫進(jìn)行匹配, 共有17 339 條isoform 被劃分到三個(gè)大類。其中基因劃分最多的類別是分子功能(molecular function, 6 669 個(gè)), 其次是生物過程(biological process, 5 955 個(gè))和細(xì)胞成分(cellular component, 4 715 個(gè))。分子功能類別中可以細(xì)分為18個(gè)亞類別, 其中占比最多的是結(jié)合活性(binding), 占比42.04%; 其次是催化活性(catalytic activity), 占比34.78%。生物過程類別中注釋到26 個(gè)亞類別, 占比最多的是細(xì)胞過程(cellular process), 占比 12.40%;其次是代謝過程(metabolic process), 占比11.30%。注釋到細(xì)胞成分類別中的基因被劃分為23 個(gè)亞類別,其中比例最大的為細(xì)胞(cell)和細(xì)胞組分(cell part),占比分別為 16.98%和 16.95%; 其次為細(xì)胞器(organelle), 占比為14.14% (圖1c)。
2.2.4 KEGG 功能注釋 共有20 117 條isoform 被注釋到144 條已知的KEGG 通路中, isoform 數(shù)量分布前20 條通路見表2。其中isoform 數(shù)量最多的通路是代謝途徑(metabolic pathways), 包括3 210 條isoform,其次是溶酶體(lysosome)與RNA 轉(zhuǎn)運(yùn)(RNA transport),分別有551 條和439 條isoform。
表2 前20 個(gè)KEGG 代謝途徑Tab.2 Top 20 KEGG pathways
通過對勞盆擬刺鎧蝦全長轉(zhuǎn)錄本進(jìn)行CDS 預(yù)測,共得到21 848 個(gè)CDS 序列。CDS 序列長度分布在102~7 719 bp, 平均值為1 049 bp; 5'UTR 的長度分布在3~4 831 bp, 平均值為266 bp; 3'UTR 的長度分布在3~7 189 bp, 平均值為970 bp。
2.3.1 轉(zhuǎn)錄因子 轉(zhuǎn)錄因子是在轉(zhuǎn)錄過程中識別和結(jié)合特定核苷酸序列的蛋白質(zhì), 通過與其他相關(guān)蛋白的相互作用介導(dǎo)附近基因的表達(dá), 發(fā)揮重要的調(diào)控作用(Babu, 2010)。在勞盆擬刺鎧蝦全長轉(zhuǎn)錄組中共發(fā)現(xiàn)了41 個(gè)轉(zhuǎn)錄因子家族, 包含537 個(gè)轉(zhuǎn)錄因子。其中最多的轉(zhuǎn)錄因子家族是zf-C2H2 家族, 其次是轉(zhuǎn)錄因子ZBTB 和CSD 家族(圖2a)。
圖2 勞盆擬刺鎧蝦全長轉(zhuǎn)錄組結(jié)構(gòu)分析Fig.2 Analysis of full-length transcriptome structure of M. lauensis
2.3.2 長鏈非編碼RNA LncRNA 被定義為長度超過200 個(gè)核苷酸且未被翻譯成蛋白質(zhì)的RNA 分子,它們從根本上參與一些生物過程, 如轉(zhuǎn)錄、翻譯、蛋白質(zhì)定位、細(xì)胞結(jié)構(gòu)完整性、重編碼以及其他細(xì)胞活動(dòng)(Maet al, 2013)?;贑PC 和CNCI 兩種預(yù)測方法,在勞盆擬刺鎧蝦全長轉(zhuǎn)錄組中共發(fā)現(xiàn)了6 430 個(gè)LncRNA。
2.3.3 簡單重復(fù)序列 簡單重復(fù)序列又稱為微衛(wèi)星DNA、短串聯(lián)重復(fù)序列, 通常指以1~6 個(gè)堿基為單位組成的短串聯(lián)重復(fù)序列。本研究共檢測到6 517條包含SSR 位點(diǎn)的isoform, 其中1 765 條包含超過1個(gè)SSR 位點(diǎn), 以復(fù)合形式存在的SSRs 數(shù)目為2 044個(gè)。進(jìn)一步根據(jù)短串聯(lián)重復(fù)單元的類型對所檢測到的10 060 個(gè)SSRs 進(jìn)行分類(圖2b)。依據(jù)重復(fù)核苷酸數(shù)目, SSRs 可分為5 種類型, 核苷酸重復(fù)數(shù)目為2~6 個(gè),其中勞盆擬刺鎧蝦全長轉(zhuǎn)錄組中數(shù)量最多的是三核苷酸重復(fù)序列(4 233, 42.08%), 其次是二核苷酸重復(fù)(4 199, 41.74%)。SSRs 重復(fù)次數(shù)在4~99 次之間, 主要集中在4~7 次, 且SSRs 數(shù)量隨著重復(fù)次數(shù)的增加而降低。
對isoform 數(shù)量分布最多的前20 個(gè)KEGG 通路進(jìn)行分析, 發(fā)現(xiàn)其中有兩個(gè)通路可能與勞盆擬刺鎧蝦適應(yīng)深?;軜O端生境相關(guān), 分別為過氧化物酶體(Peroxisome, ko: 04146)和谷胱甘肽代謝(Glutathione metabolism, ko: 00480)。在過氧化物酶體通路中, 共有180 條isoform 編碼該通路的31 個(gè)關(guān)鍵酶, 其中脫氫酶/還原酶SDR 家族的數(shù)量最多, 為27 條; 其次是D-天冬氨酸氧化酶(21 條)和過氧化氫酶(19 條); 甲羥戊酸激酶、α-甲?;o酶A 消旋酶、(S)-2-羥基-酸性氧化酶、ATP 結(jié)合盒亞家族D(ALD)成員2、2-羥基酰基-CoA 裂解酶1、谷胱甘肽硫轉(zhuǎn)移酶kappa1 等數(shù)量最少, 分別有1 條(圖3a)。共有213 條isoform 參與谷胱甘肽代謝通路中19 個(gè)關(guān)鍵酶的編碼, 其中GST 的數(shù)量最多, 為59 條, 其次是前列腺素H2 D 異構(gòu)酶谷胱甘肽轉(zhuǎn)移酶(25 條)和谷胱甘肽過氧化物酶(18 條), 最少的是γ 谷氨酰環(huán)化轉(zhuǎn)移酶、蛋白質(zhì)二硫還原酶(谷胱甘肽)以及谷胱甘肽特異性γ-谷氨酰環(huán)轉(zhuǎn)移酶1, 數(shù)量僅為1 條(圖3b)。
圖3 代謝通路圖Fig.3 Maps of the metabolic pathway
GSTs 屬于多功能酶, 可被分為15 個(gè)亞家族, 包括Alpha、Beta、Delta、Epsilon、Kappa、Lambda、Mu、Omega、Pi、Phi、Rho、Sigma、Theta、Tau 和Zeta (Huanget al, 2017)。勞盆擬刺鎧蝦全長轉(zhuǎn)錄組中共有20 條isoform 被分別注釋到theta、delta、mu、kappa 四個(gè)GST 亞家族中。我們利用鄰接法對勞盆擬刺鎧蝦全長轉(zhuǎn)錄組中注釋到的GST 候選序列與其他節(jié)肢動(dòng)物的GST 氨基酸序列進(jìn)行了系統(tǒng)發(fā)育樹的構(gòu)建(圖4a)。結(jié)果顯示勞盆擬刺鎧蝦全長轉(zhuǎn)錄組中被注釋為不同亞家族的GSTs 分別聚類在相應(yīng)亞家族的分支上。多重序列比對結(jié)果顯示勞盆擬刺鎧蝦的GST-theta 序列與柯氏潛鎧蝦的序列相似度最高, 第2~74 位氨基酸為N 端結(jié)構(gòu)域, 第108~201 位氨基酸為C 端結(jié)構(gòu)域(圖4b)。
近年來, 以Pacbio 平臺為代表的第三代測序技術(shù)因其強(qiáng)大的讀長優(yōu)勢改變了二代測序序列讀長短和碎片化的局限性, 極大地提高了獲得完整基因信息的能力(Eidet al, 2009)。全長轉(zhuǎn)錄組測序目前已成為從超大、復(fù)雜基因組物種中獲取海量基因序列信息的重要工具, 并逐步應(yīng)用于水生生物生長發(fā)育、脅迫響應(yīng)、物種適應(yīng)性進(jìn)化以及重要基因挖掘等研究(Mehjabinet al, 2019; 王菁等, 2022; Chenget al,2022; Wanget al, 2022)。本研究通過Pacbio Sequel II平臺首次對深?;苌虫z甲蝦類的全長轉(zhuǎn)錄組進(jìn)行測序和分析。與之前深?;軜O端環(huán)境中的其他甲殼動(dòng)物二代轉(zhuǎn)錄組結(jié)果相比(Huiet al, 2018; Chenget al, 2019), 雖然本研究所獲得的轉(zhuǎn)錄本數(shù)量(28 811 條)相對較少(143 516 條, Huiet al, 2018; 108 237 條,Chenget al, 2019), 但在轉(zhuǎn)錄本完整性和質(zhì)量(N50,2 275 bp)方面卻遠(yuǎn)高于二代(1 068 bp, Huiet al, 2018;1 125 bp, Chenget al, 2019) (圖5), 可為后續(xù)勞盆擬刺鎧蝦基因資源的挖掘提供基礎(chǔ), 并為探究該物種在不同條件或不同組織的轉(zhuǎn)錄表達(dá)差異提供了參考序列。功能注釋是了解基因功能、研究基因的表達(dá)調(diào)控機(jī)制與預(yù)測蛋白功能的前提。勞盆擬刺鎧蝦各數(shù)據(jù)庫的轉(zhuǎn)錄本注釋率為71.56%, 顯著高于基于二代測序的長角阿爾文蝦(40.27%, Huiet al, 2018)和柯氏潛鎧蝦(36.78%, Chenget al, 2019)。然而仍有8 195 個(gè)轉(zhuǎn)錄本未被注釋, 推測可能是鎧甲蝦類或該物種的特有基因, 公共的數(shù)據(jù)庫中缺乏其相關(guān)的基因信息等原因造成。通過Nr 數(shù)據(jù)庫的注釋發(fā)現(xiàn), 勞盆擬刺鎧蝦與凡納濱對蝦比對到的同源信息最多, 所占比例為65.01%。僅注釋到兩個(gè)擬刺鎧蝦科物種, 分別為勞盆擬刺鎧蝦(116 條)和威氏擬刺鎧蝦(Munidopsis verrilli, 2 條), 表明擬刺鎧蝦科的已有基因資源相對匱乏。GO 注釋和KEGG 注釋結(jié)果顯示勞盆擬刺鎧蝦的轉(zhuǎn)錄組功能主要集中于細(xì)胞過程與代謝過程。這些基因注釋和分類信息將有助于對勞盆擬刺鎧蝦基因功能的理解與深入研究。
轉(zhuǎn)錄因子通過特異性結(jié)合調(diào)控區(qū)域的DNA 序列來識別下游靶基因, 從而在調(diào)控各種生物過程的激活或者抑制中發(fā)揮重要作用(Charoensawanet al,2010)。本研究預(yù)測了勞盆擬刺鎧蝦的轉(zhuǎn)錄因子, 其中zf-C2H2 和ZBTB 是最豐富的轉(zhuǎn)錄因子家族。C2H2型是鋅指蛋白最常見的類型之一, 在真核生物的生長發(fā)育以及應(yīng)激反應(yīng)過程中起重要的調(diào)控作用(Liuet al, 2015)。ZBTB 蛋白是鋅指蛋白家族的亞家族之一, 在DNA 損傷反應(yīng)和細(xì)胞發(fā)育以及先天淋巴細(xì)胞的發(fā)育和分化等過程中起重要作用(Renet al, 2019)。本結(jié)果與馬氏珠母貝(Pinctada fucata martensii,Zhanget al, 2020)、口蝦蛄(Oratosquilla oratoria,Chenget al, 2022)、大菱鲆(Scophthalmus maximus, Fuet al, 2022)的全長轉(zhuǎn)錄組解析得到的轉(zhuǎn)錄因子分析結(jié)果相似。近年來研究發(fā)現(xiàn)長鏈非編碼RNA 可以通過與DNA 相互作用來調(diào)節(jié)轉(zhuǎn)錄、表觀遺傳修飾、翻譯和翻譯后修飾等生物過程(Bridgeset al, 2021)。截至目前, 尚未有關(guān)于勞盆擬刺鎧蝦的長鏈非編碼RNA的報(bào)道。本研究鑒定出勞盆擬刺鎧蝦的 6 430 個(gè)LncRNA, 將為LncRNA 具體功能的進(jìn)一步研究提供基礎(chǔ)。SSRs 廣泛存在于真核生物體內(nèi), 因其分布廣、種類多及重復(fù)單元的重復(fù)次數(shù)在個(gè)體間呈現(xiàn)高度特異性, 已成為檢測物種遺傳多樣性的有效工具。通過勞盆擬刺鎧蝦的全長轉(zhuǎn)錄組分析共預(yù)測到了10 060個(gè)SSRs, 結(jié)合Boyle 等(2013)對馬努斯盆地的勞盆擬刺鎧蝦開發(fā)的10 個(gè)SSRs, 可為勞盆擬刺鎧蝦在不同海盆的遺傳連通性和種群遺傳結(jié)構(gòu)研究提供候選分子標(biāo)記。
環(huán)境壓力可導(dǎo)致細(xì)胞內(nèi)活性氧(ROS)水平的增高(Lushchak, 2011), 而過氧化物酶體是在ROS 的代謝中起主要作用的細(xì)胞器(Mannaertset al, 1993)。據(jù)報(bào)道, 過氧化物酶體在各種化合物包括誘導(dǎo)抗氧化酶的污染物刺激下在生物體內(nèi)發(fā)生增殖(Orbeaet al,2002)。本研究發(fā)現(xiàn)過氧化物酶體通路位于isoform 數(shù)量分布最多的前20 條KEGG 通路中, 且有部分轉(zhuǎn)錄本注釋到參與過氧化物酶體生物發(fā)生的蛋白質(zhì)peroxin 編碼基因上, 因此我們推測勞盆擬刺鎧蝦極有可能在深海極端環(huán)境中受到外界因子刺激后發(fā)生了過氧化物酶體增殖現(xiàn)象, 以應(yīng)對細(xì)胞內(nèi)高ROS 水平。GSTs 廣泛分布于生物體內(nèi), 主要通過協(xié)助對抗內(nèi)源或者外來有害物質(zhì)從而實(shí)現(xiàn)細(xì)胞解毒功能(楊海靈等, 2006)。真核生物中參與谷胱甘肽代謝的GSTs主要屬于MAPEG 超家族, 在內(nèi)源性脂類新陳代謝以及細(xì)胞解毒方面發(fā)揮重要的生物學(xué)作用(Jakobssonet al, 1996, 1999)。鄭佩華等(2020)通過對凡納濱對蝦的GSTs 進(jìn)行基因克隆, 發(fā)現(xiàn)MGST3 在對蝦抗逆境脅迫以及抵御病原菌感染的調(diào)控機(jī)制中發(fā)揮重要作用。Cheng 等(2019)在對深海熱液和冷泉的共有甲殼動(dòng)物柯氏潛鎧蝦進(jìn)行轉(zhuǎn)錄組比較分析時(shí)發(fā)現(xiàn)編碼GSTs 的基因在熱液個(gè)體中顯著上調(diào)表達(dá), 推測其有助于柯氏潛鎧蝦適應(yīng)理化條件更極端的熱液環(huán)境。在勞盆擬刺鎧蝦中, 我們發(fā)現(xiàn)了59 個(gè)編碼GSTs 的isoform, 參與谷胱甘肽代謝過程。此外還檢測到了同樣具有抗氧化作用的谷胱甘肽過氧化物酶以及參與谷胱甘肽合成的γ谷氨酰轉(zhuǎn)肽酶等。系統(tǒng)發(fā)育樹與多重序列比對結(jié)果顯示勞盆擬刺鎧蝦與柯氏潛鎧蝦GSTs 序列相似度高, 可能與兩物種的分類地位較近以及生存環(huán)境相似有關(guān)。不同家族的GSTs 的亞基在序列上高度進(jìn)化, 但都由N 末端和C 末端兩個(gè)結(jié)構(gòu)域組成。與谷胱甘肽結(jié)合的G 位點(diǎn)存在于N 末端結(jié)構(gòu)域中, 與外源性和內(nèi)源性親電子底物結(jié)合的H 位點(diǎn)存在于C 末端結(jié)構(gòu)域中, 這兩者構(gòu)成了GSTs 的催化反應(yīng)活性中心(Armstrong, 1991; Ransonet al, 2005)。進(jìn)一步分析發(fā)現(xiàn)勞盆擬刺鎧蝦的N 末端比C 末端擁有更高的序列相似性, 這種現(xiàn)象在 GTS 家族中也是普遍存在的(Sinninget al, 1993)。這些基因可能在勞盆擬刺鎧蝦適應(yīng)高濃度硫以及重金屬等的深?;墉h(huán)境過程中發(fā)揮重要作用。
鑒于目前對深海極端環(huán)境下特殊生命過程的認(rèn)識不足, 與淺海近緣物種的比較分析是解析深海生物進(jìn)化與環(huán)境適應(yīng)機(jī)制的關(guān)鍵。本研究利用SMRT三代測序技術(shù)對勞盆擬刺鎧蝦進(jìn)行了全長轉(zhuǎn)錄組測序與分析, 不僅豐富了勞盆擬刺鎧蝦的遺傳信息, 同時(shí)為深入揭示深海化能生態(tài)系統(tǒng)大型甲殼動(dòng)物的適應(yīng)性進(jìn)化機(jī)制提供了研究基礎(chǔ)與數(shù)據(jù)支撐。后續(xù)可基于本研究進(jìn)一步開展擬刺鎧蝦科物種與其淺海近緣生物的比較轉(zhuǎn)錄組分析, 從而加深十足目甲殼動(dòng)物對深?;軜O端環(huán)境適應(yīng)機(jī)制的理解。