聶鴻濤, 姜力文, 鄭夢(mèng)鴿, 李東東, 閆喜武
大竹蟶高通量轉(zhuǎn)錄組測(cè)序數(shù)據(jù)組裝和分析
聶鴻濤1,2, 姜力文1, 鄭夢(mèng)鴿1, 李東東1, 閆喜武1,2
(1.大連海洋大學(xué)水產(chǎn)與生命學(xué)院,遼寧大連116023;2.遼寧省貝類良種繁育工程技術(shù)研究中心,遼寧大連116023)
為進(jìn)一步開(kāi)發(fā)大竹蟶Solen grandis的基因資源,采用2代Illumina Hi-seq測(cè)序技術(shù)對(duì)大竹蟶的鰓組織進(jìn)行了轉(zhuǎn)錄組測(cè)序,構(gòu)建了轉(zhuǎn)錄組數(shù)據(jù)庫(kù),獲得338 483 476條Clean Reads數(shù)據(jù);拼接組裝后獲得190 856條Unigene數(shù)據(jù),平均長(zhǎng)度為1147 bp;與NR、NT、KO、SwissProt、PFAM、GO、KOG等數(shù)據(jù)庫(kù)進(jìn)行Blast信息比對(duì) (E-value為10-5),共獲得63 337個(gè)注釋基因;與NR數(shù)據(jù)庫(kù)比對(duì)發(fā)現(xiàn),大竹蟶轉(zhuǎn)錄組基因序列與長(zhǎng)牡蠣Crassostrea gigas具有較高的同源性,為53.3%;將大竹蟶轉(zhuǎn)錄組的Unigene的功能通過(guò)與KOG數(shù)據(jù)庫(kù)進(jìn)行注釋比對(duì)劃分為25類;GO數(shù)據(jù)庫(kù)注釋可分為三類,即細(xì)胞組分、生物過(guò)程和分子功能,共包括65個(gè)分支;KEGG分析發(fā)現(xiàn),大竹蟶轉(zhuǎn)錄組數(shù)據(jù)中按照代謝通路可分為92類,利用Blast蛋白庫(kù)比對(duì)和Estscan軟件進(jìn)行ORF預(yù)測(cè),獲得長(zhǎng)度大于300 nt的ORF共50 681個(gè);通過(guò)SSR分析,共獲得73 089個(gè)SSR標(biāo)記。本研究中獲得的轉(zhuǎn)錄組信息可為今后進(jìn)行大竹蟶分子標(biāo)記的開(kāi)發(fā)和關(guān)鍵基因的克隆及功能分析等研究提供基礎(chǔ)數(shù)據(jù)。
大竹蟶;轉(zhuǎn)錄組;高通量測(cè)序;生物信息學(xué)分析
大竹蟶Solen grandis在分類上隸屬于軟體動(dòng)物門、雙殼綱、真瓣鰓目、竹蟶科、竹蟶屬,分布較為廣泛,是中國(guó)重要的經(jīng)濟(jì)貝類[1]。大竹蟶市場(chǎng)前景較好,經(jīng)濟(jì)價(jià)值高,因其肉味鮮美,深受消費(fèi)者喜愛(ài)。大竹蟶的出肉率為45%,蛋白質(zhì)含量高達(dá)82.7%[2],必需氨基酸種類齊全,具有較高的營(yíng)養(yǎng)價(jià)值[3]。目前,有關(guān)大竹蟶的研究主要集中在人工育苗技術(shù)[4-8]、 繁殖生物學(xué)[9-11]、 養(yǎng)殖生態(tài)學(xué)[12-14]和分子生物學(xué)[15-17]等方面, 而關(guān)于大竹蟶組學(xué)方面的研究較少。近年來(lái),高通量轉(zhuǎn)錄組測(cè)序技術(shù)的廣泛應(yīng)用[18],為開(kāi)展大竹蟶重要經(jīng)濟(jì)性狀的分子基礎(chǔ)研究提供了重要的基因資源。
轉(zhuǎn)錄組測(cè)序能夠在沒(méi)有基因資源的情況下,通過(guò)對(duì)某物種的RNA測(cè)序分析其生長(zhǎng)與代謝規(guī)律,揭示基因與生物學(xué)特性之間的關(guān)系,同時(shí)能夠有效地開(kāi)發(fā)大量基因資源[18]。該法特別適合基因信息匱乏的物種,并已在長(zhǎng)牡蠣、扇貝、菲律賓蛤仔等多個(gè)海洋貝類中得到廣泛應(yīng)用。但關(guān)于大竹蟶轉(zhuǎn)錄組測(cè)序的研究還鮮有報(bào)道。為了進(jìn)一步開(kāi)發(fā)大竹蟶的基因資源,本研究中以大竹蟶野生群體為材料,利用Illumina HiSeq 2500技術(shù)對(duì)大竹蟶進(jìn)行轉(zhuǎn)錄組測(cè)序和分析,獲得了大竹蟶轉(zhuǎn)錄組數(shù)據(jù)庫(kù),得到了與大竹蟶生長(zhǎng)、繁殖、代謝、免疫等相關(guān)基因資源,并發(fā)現(xiàn)了大量的微衛(wèi)星分子標(biāo)記 (SSR),旨在為大竹蟶分子標(biāo)記開(kāi)發(fā)、基因克隆和組學(xué)研究提供基礎(chǔ)數(shù)據(jù),同時(shí)也為今后大竹蟶功能基因的研究奠定基礎(chǔ)。
試驗(yàn)用大竹蟶購(gòu)于大連市新長(zhǎng)興市場(chǎng),大竹蟶個(gè)體健康、活動(dòng)性強(qiáng),殼長(zhǎng)為 (9.4±0.39)cm,殼寬為 (1.58±0.45)cm,殼高為 (1.61±0.56)cm,濕質(zhì)量為 (43.68±0.73)g。試驗(yàn)用海水為黑石礁海區(qū)經(jīng)沉淀、沙濾后的海水,儲(chǔ)存?zhèn)溆?。試?yàn)開(kāi)始前,先將大竹蟶暫養(yǎng)3 d,暫養(yǎng)期間不投喂,水溫為 (12.0±0.3)℃,每天換水1次。用水質(zhì)分析儀測(cè)定海水的鹽度和pH,海水pH值為8.0±0.1, 鹽度為 32.0±0.2。
1.2.1 大竹蟶總RNA的提取 采用TRIzol方法提取大竹蟶鰓組織的總RNA,測(cè)定RNA濃度和質(zhì)量。如果OD260nm/OD280nm的范圍為1.8~2.2,28S/18S>2, OD260nm/OD230nm>1.8, RNA 完 整 值(RIN)>8.5,則認(rèn)為提取的RNA合格,符合建庫(kù)測(cè)序標(biāo)注。
1.2.2 大竹蟶建庫(kù)測(cè)序和拼接組裝 大竹蟶轉(zhuǎn)錄組的建庫(kù)測(cè)序和拼接組裝委托北京諾禾致源生物信息科技有限公司完成,利用Trinity軟件[19]進(jìn)行拼接組裝。
1.2.3 基因功能注釋 進(jìn)行基因功能注釋的數(shù)據(jù)庫(kù)包括 NR、 NT、 PFAM、 KOG/COG、 SwissProt、GO、KEGG[20]。拼接得到的Unigene通過(guò)Blastx與基因和蛋白數(shù)據(jù)庫(kù)進(jìn)行比對(duì),得到注釋信息,利用WEGO和BlastGO進(jìn)行GO注釋和功能分類統(tǒng)計(jì),分別用COG和KEGG數(shù)據(jù)庫(kù)進(jìn)行Unigene的功能注釋和代謝通路的定位。
1.2.4 ORF預(yù)測(cè)與SSR位點(diǎn)搜索 利用Blast比對(duì)到NR和SwissProt蛋白庫(kù)提取ORF序列,沒(méi)比對(duì)到的用Estscan軟件預(yù)測(cè)已注釋Unigene的ORF(Open Reading Frame)。微衛(wèi)星標(biāo)記的搜索使用MISA軟件,對(duì)Unigenes進(jìn)行SSR重復(fù)序列搜索(http://pgrc.ipk-gatersleben.de/misa/misa.htmh/)。
經(jīng)HiSeq2500高通量測(cè)序獲得338 483 476條讀序 (clean data),數(shù)據(jù)量為50.77 G,測(cè)序數(shù)據(jù)已上傳至SRA數(shù)據(jù)庫(kù) (PRJNA385244),GC含量為39.60%,Q30值為91.89%。利用Trinity軟件對(duì)上述獲得的clean reads進(jìn)行組裝,得到305 485條transcripts,平均長(zhǎng)823 bp,N50為1536 bp;進(jìn)一步去冗組裝獲得190 856條Unigenes,平均長(zhǎng)度為1147 bp,N50為1875 bp。拼接得到的Unigene的N50為1875 bp。Unigene長(zhǎng)度分布見(jiàn)圖1。
將組裝得到的190 856條Unigene與已知的NR、NT、 KO、 SwissProt、 PFAM、 GO、 KOG 這 7個(gè)數(shù)據(jù)庫(kù)進(jìn)行功能注釋。如表1所示,全部Unigene在7個(gè)不同數(shù)據(jù)庫(kù)中的同源比對(duì)數(shù)目不同,分別為 46 657、 7857、 19 044、 34 627、 50 377、50 481和25 168條。至少在一個(gè)數(shù)據(jù)庫(kù)中獲得注釋信息的Unigene數(shù)量為63 337條,占總Unigene的33.18%;在7個(gè)數(shù)據(jù)庫(kù)中都得到注釋的基因數(shù)量為4744條 (表1)。

圖1 大竹蟶Unigene長(zhǎng)度分布Fig.1 Sequence length distribution of unigenes assembled from Illumina reads of the gill transcriptome in grand jacknife clam Solen grandis

表1 大竹蟶基因注釋成功率統(tǒng)計(jì)Tab.1 Number of genes annotated in different database in grand jacknife clam Solen grandis
從圖2-A可以看出,比對(duì)到NR數(shù)據(jù)庫(kù)中的46 657條 Unigenes,有 16.4%的 E值分布在 le-15~1e-5, 14.4%分布在 le-30~1e-15, 9.7%分布在 le-45~1e-30, 7.9%分布在 le-60~1e-45,15.4%分布在 le-100~1e-60, 17.8%分布在0~1e-100。從圖2-B可以看出,從匹配的物種來(lái)源分析,大竹蟶Unigene注釋到長(zhǎng)牡蠣Crassostrea gigas的占 53.3%,注釋到帽貝Lottia gigantea的占11.7%,注釋到加州海兔Aplysia californica的占8.0%,在紫海膽Strongylocentrotus purpura和文昌魚(yú)Branchiostoma floridae中注釋到的Unigene均占1.9%,其余23.2%注釋到其他物種。

圖2 NR注釋的E-value分布和物種分布Fig.2 E-value distribution and species classification of sequences matched to the NR database
在基因的GO注釋中,有50 481條Unigene(26.44%)獲得GO數(shù)據(jù)庫(kù)注釋 (圖3)。注釋到的3大類包括:細(xì)胞組分分為20個(gè)亞類,生物過(guò)程分為25個(gè)亞類,分子功能分為10個(gè)亞類。從圖3可見(jiàn):生物過(guò)程獲得的注釋信息最多,為146 264條Unigene,占全部注釋信息的76.64%,生物過(guò)程里涉及代謝過(guò)程、細(xì)胞過(guò)程和對(duì)刺激的應(yīng)激效應(yīng)的Unigene比較多,分別有23 801、29 427、9526條;其次是細(xì)胞組分,分為20個(gè)亞類,共有87 560條Unigene,占全部注釋信息的45.88%,涉及到細(xì)胞部分、膜、細(xì)胞和細(xì)胞器的Unigene比較多,分別為15 763、11 013、15 763和10 280條;注釋信息相對(duì)最少的是分子功能,共有58 699條Unigene(30.76%),排在前 2位的是結(jié)合與催化活性,Unigene數(shù)量分別為 27 847、19 094條。另外,KOG數(shù)據(jù)庫(kù)功能注釋結(jié)果顯示,KOG分類中得到25種,包括25 168條Unigene,其中,信號(hào)轉(zhuǎn)導(dǎo)機(jī)制包含Unigene最多 (5884條),其次是一般功能預(yù)測(cè) (5569條),轉(zhuǎn)錄后修飾、蛋白折疊和分子伴侶 (2502條),胞內(nèi)運(yùn)輸、分泌和囊泡運(yùn)輸 (1252條),轉(zhuǎn)錄 (1232條),細(xì)胞骨架 (1232條)。
在KEGG數(shù)據(jù)庫(kù)中分析了190 856條Unigene,得到注釋的Unigene有30 914條 (16.2%),KEGG代謝途徑有230種。其中,細(xì)胞黏附的Unigene數(shù)量最多 (568條),其次是 Rap1信號(hào)通路 (512條)、涉及內(nèi)吞作用 (482條)、PI3K-Akt信號(hào)通路 (472條)、催產(chǎn)素信號(hào)通路 (417條)、Ras信號(hào)通路 (403條)、cAMP信號(hào)通路 (402條)、嘌呤代謝 (293條)等代謝通路。

圖3 大竹蟶轉(zhuǎn)錄組Unigene GO功能分類Fig.3 GO(Gene Ontology)categorization(biological process, cellular component and molecular function)of the unigenes in the gill transcriptome of grand jacknife clam Solen grandis
利用Blast比對(duì)到NR和SwissProt蛋白庫(kù)提取ORF序列,沒(méi)比對(duì)到的用Estscan預(yù)測(cè)Unigene,得到ORF共86 152個(gè),其中,長(zhǎng)度在300 nt以上的Unigene數(shù)量為50 681條,占58.83%(圖4)。同時(shí),利用MISA軟件搜索到微衛(wèi)星標(biāo)記73 089個(gè),其中單堿基微衛(wèi)星最多,單堿基型 (50 676個(gè),占69.33%),其他類型依次為二堿基型重復(fù)(15 449個(gè),占21.14%)、三堿基型 (5692個(gè),占7.79%)、四堿基型 (1250個(gè),占1.71%),五堿基型和六堿基型最少,分別為20、2個(gè),各占0.027%和0.003%(表2)。對(duì)大竹蟶微衛(wèi)星位點(diǎn)的分析,可為大竹蟶分子標(biāo)記的開(kāi)發(fā)與應(yīng)用研究提供重要資源。

圖4 大竹蟶ORF長(zhǎng)度分布Fig.4 ORF length distribution in the gill transcriptome of grand jacknife clam Solen grandis

表2 大竹蟶SSR分析統(tǒng)計(jì)結(jié)果Tab.2 Number of SSR marker in the gill transcriptome of grand jacknife clam Solen grandis
近年來(lái),高通量測(cè)序技術(shù)已在許多水產(chǎn)動(dòng)物的轉(zhuǎn)錄組研究中得到廣泛應(yīng)用,包括魚(yú)類[21-23]、貝類[24-26]和蝦蟹類等[27-29]。 本研究中, 采用高通量測(cè)序技術(shù)對(duì)大竹蟶的鰓組織進(jìn)行轉(zhuǎn)錄組測(cè)序,拼接組裝后獲得190 856條Unigene,平均長(zhǎng)度為1147 bp,其中有65 683條Unigenes的長(zhǎng)度在1 kb以上。所有的Unigene有63 337條 (33.18%)成功獲得功能注釋。但仍有127 519條 (66.82%)序列定位不清楚,原因可能是基因數(shù)據(jù)庫(kù)中大竹蟶基因資源少,導(dǎo)致得到功能注釋基因偏少。對(duì)拼接組裝獲得的190 856條Unigenes進(jìn)行了代謝途徑分析和功能分類。KOG功能注釋包括25 168條Unigenes,分為25個(gè)KOG亞類。本文中獲得了大竹蟶轉(zhuǎn)錄組數(shù)據(jù)庫(kù),得到了與大竹蟶生長(zhǎng)繁殖、合成代謝與免疫抗逆等相關(guān)基因資源,完善了大竹蟶的基因數(shù)據(jù)庫(kù)信息,為今后大竹蟶功能基因的研究奠定了基礎(chǔ)。
近年來(lái),有越來(lái)越多的水產(chǎn)經(jīng)濟(jì)動(dòng)物轉(zhuǎn)錄組和基因組測(cè)序結(jié)果的發(fā)表,基因數(shù)據(jù)庫(kù)中的資源得到不斷地豐富和完善。在基因資源非常充足的情況下,很多未知功能的基因?qū)⒈蛔⑨尩骄唧w的功能,因此,可以利用這個(gè)途徑來(lái)挖掘一些新的功能基因。鰓是貝類重要的呼吸和濾食器官,研究表明,鰓在貝類的免疫方面也發(fā)揮重要作用[30-31]。轉(zhuǎn)錄組研究可以進(jìn)行不同組織測(cè)序數(shù)據(jù)的比較分析,但本研究中選取了大竹蟶的鰓組織進(jìn)行建庫(kù)測(cè)序,通過(guò)基因功能注釋發(fā)現(xiàn)了一些重要的免疫基因,如凋亡抑制因子 (Inhibitors of apoptosis,IAP)、腫瘤壞死因子 (Tumor necrosis factors,TNF)和補(bǔ)體 C3(complement component C3)等。本研究結(jié)果不僅為今后的基因克隆和功能研究提供了重要的基礎(chǔ)數(shù)據(jù),同時(shí)為研究大竹蟶生長(zhǎng)、免疫、繁殖、代謝等途徑中功能基因的分子機(jī)制奠定基礎(chǔ)。
與傳統(tǒng)測(cè)序方法相比,高通量測(cè)序技術(shù)具有操作簡(jiǎn)單、通量大、效率高等優(yōu)點(diǎn)。能夠快速地獲得成千上萬(wàn)條基因序列,并開(kāi)發(fā)出大量的微衛(wèi)星分子標(biāo)記資源[32]。
本研究中,利用MISA微衛(wèi)星搜索軟件對(duì)大竹蟶轉(zhuǎn)錄組基因序列進(jìn)行搜索,共發(fā)現(xiàn)微衛(wèi)星分子標(biāo)記73 089個(gè)。在得到的6種微衛(wèi)星重復(fù)類型中,單堿基型重復(fù)數(shù)量最多,為50 676個(gè),占所有微衛(wèi)星標(biāo)記的69.33%,這與對(duì)櫛孔扇貝的研究結(jié)果類似[33]。目前,關(guān)于大竹蟶微衛(wèi)星標(biāo)記開(kāi)發(fā)的報(bào)道較少,在大竹蟶中僅有少量的微衛(wèi)星標(biāo)記可以利用。因此,有必要進(jìn)一步豐富大竹蟶的微衛(wèi)星標(biāo)記資源。
本研究中進(jìn)行了大竹蟶轉(zhuǎn)錄組的初步探究,大竹蟶的基因數(shù)據(jù)庫(kù)資源得到了補(bǔ)充和完善,為今后開(kāi)展大竹蟶分子遺傳學(xué)和組學(xué)方面的相關(guān)研究奠定了重要基礎(chǔ)。本研究中獲得了大量的大竹蟶微衛(wèi)星候選標(biāo)記,可為今后大竹蟶微衛(wèi)星分子標(biāo)記開(kāi)發(fā)、遺傳連鎖圖譜構(gòu)建、家系分析和系譜鑒定、物種鑒定以及群體遺傳學(xué)等研究提供重要資源。
[1] 齊鐘彥.中國(guó)經(jīng)濟(jì)軟體動(dòng)物[M].北京:中國(guó)農(nóng)業(yè)出版社,1998:233-234.
[2] 戴聰杰.大竹蟶軟體部分營(yíng)養(yǎng)成分分析及其評(píng)價(jià)[J].集美大學(xué)學(xué)報(bào):自然科學(xué)版,2002,7(4):304-308.
[3] 戴聰杰.大竹蟶軟體部分的氨基酸組成分析[J].莆田學(xué)院學(xué)報(bào),2002,9(3):32-35.
[4] 陳愛(ài)華,姚國(guó)興,張志偉.大竹蟶生產(chǎn)性人工繁育試驗(yàn)[J].海洋漁業(yè),2009,31(1):66-72.
[5] 宋賢亭,于瑞海,馬培振,等.大竹蟶室內(nèi)人工育苗技術(shù)研究[J].海洋湖沼通報(bào),2015(4):56-60.
[6] 王雪梅,路宜華,豐愛(ài)秀,等.大竹蟶健康苗種培育新模式的研究[J].水產(chǎn)養(yǎng)殖,2012,33(8):14-16.
[7] 侯和要,牟乃海,宋全山,等.大竹蟶人工繁殖技術(shù)研究[J].齊魯漁業(yè),2004,21(6):32-35.
[8] 楊輝.大竹蟶人工育苗技術(shù)研究[J].河北漁業(yè),2015(5):41-69.
[9] 肖國(guó)強(qiáng),柴雪良,邵艷卿,等.大竹蟶的繁殖生物學(xué)[J].海洋科學(xué),2009,33(10):21-25.
[10] 吳楊平,陳愛(ài)華,姚國(guó)興,等.大竹蟶胚胎發(fā)生及稚貝發(fā)育基本特征[J].動(dòng)物學(xué)雜志,2012,47(4):74-81.
[11] 李碧全,陳東輝,鄭杰民,等.大竹蟶性腺觀測(cè)與人工催產(chǎn)技術(shù)的研究[J].集美大學(xué)學(xué)報(bào):自然科學(xué)版,2011,16(2):97-102.
[12] 侯和要,王君霞,彭作波,等.不同鹽度對(duì)大竹蟶存活的影響[J].齊魯漁業(yè),2004,21(5):5-6,4.
[13] 陳愛(ài)華,姚國(guó)興,張志偉,等.溫度、鹽度和底質(zhì)對(duì)大竹蟶稚貝生長(zhǎng)及存活的影響[J].熱帶海洋學(xué)報(bào),2010,29(5):94-97.
[14] 陳愛(ài)華,吳楊平,姚國(guó)興,等.底質(zhì)和溫度對(duì)大竹蟶苗種生長(zhǎng)存活的復(fù)合影響[J].江蘇農(nóng)業(yè)科學(xué),2012,40(5):208-210.
[15] 張?zhí)?,劉相全,孫國(guó)華,等.大竹蟶AFLP分子標(biāo)記反應(yīng)體系的建立與優(yōu)化[J].安徽農(nóng)業(yè)科學(xué),2011,39(29):17923-17926.
[16] 楊頂瓏,韋秀梅,楊建敏,等.大竹蟶(Solen grandis)鐵蛋白基因的克隆及其在轉(zhuǎn)錄水平上對(duì)微生物多糖的應(yīng)答[J].海洋與湖沼,2013,44(3):664-669.
[17] Yuan Y,Li Q,Kong L F,et al.The complete mitochondrial genome of the grand jackknife clam,Solen grandis(Bivalvia:Solenidae):a novel gene order and unusual non-coding region[J].Molecular Biology Report,2012,39(2):1287-1292.
[18] Sánchez C C,Weber G M,Gao G T,et al.Generation of a reference transcriptome for evaluating rainbow trout responses to various stressors[J].BMC Genomics,2011,12:626.
[19] Grabherr M G,Haas B J,Yassour M,et al.Full-length transcriptome assembly from RNA-Seq data without a reference genome[J].Nature Biotechnology,2011,29(7):644-652.
[20] Kanehisa M,Goto S.KEGG:Kyoto encyclopedia of genes and genomes[J].Nucleic Acids Research,2000,28(1):27-30.
[21] Ju Z,Dunham R A,Liu Z.Differential gene expression in the brain of channel catfish(Ictalurus punctatus)in response to cold acclimation[J].Molecular Genetics and Genomics, 2002, 268(1):87-95.
[22] Long Y,Li L C,Li Q,et al.Transcriptomic characterization of temperature stress responses in larval zebrafish[J].PLoS One,2012,7(5):e37209.
[23] Mininni A N,Milan M,F(xiàn)erraresso S,et al.Liver transcriptome a-nalysis in gilthead sea bream upon exposure to low temperature[J].BMC Genomics,2014,15:765.
[24] Zhang L L,Li L,Zhu Y B,et al.Transcriptome analysis reveals a rich gene set related to innate immunity in the eastern oyster(Crassostrea virginica)[J].Marine Biotechnology,2014,16(1):17-33.
[25] Milan M,Coppe A,Reinhardt R,et al.Transcriptome sequencing and microarray development for the Manila clam,Ruditapes philippinarum:genomic tools for environmental monitoring[J].BMC Genomics,2011,12:234.
[26] Shi M J,Lin Y,Xu G R,et al.Characterization of the Zhikong scallop(Chlamys farreri)mantle transcriptome and identification of biomineralization- related genes[J].Marine Biotechnology,2013,15(6):706-715.
[27] Zhao Q,Pan L Q,Ren Q,et al.Identification of genes differentially expressed in swimming crab Portunus trituberculatus response to low temperature[J].Aquaculture,2015,442:21-28.
[28] Shekhar M S,Kiruthika J,Ponniah A G.Identification and expression analysis of differentially expressed genes from shrimp(Penaeus monodon)in response to low salinity stress[J].Fish&Shellfish Immunology,2013,35(6):1957-1968.
[29] Chen K,Li E C,Xu T Y,et al.Transcriptome and molecular pathway analysis of the hepatopancreas in the Pacific white shrimp Litopenaeus vannamei under chronic low-salinity stress[J].PLoS One,2015,10(7):e0131503.
[30] Wei X M,Yang J M,Liu X Q,et al.Identification and transcriptional analysis of two types of lectins(SgCTL-1 and SgGal-1)from mollusk Solen grandis[J].Fish & Shellfish Immunology,2012,33(2):204-212.
[31] Nie H T,Liu L H,Huo Z M,et al.The HSP70 gene expression responses to thermal and salinity stress in wild and cultivated Manila clam Ruditapes philippinarum[J].Aquaculture,2017,470:149-156.
[32] Li H J,Liu M,Ye S,et al.De novo assembly,gene annotation,and molecular marker development using Illumina paired-end transcriptome sequencing in the clam Saxidomus purpuratus[J].Genes & Genomics,2017,39(6):675-685.
[33] 趙柏淞.櫛孔扇貝(Chlamys farreri)BAC文庫(kù)的構(gòu)建及其基因組特征分析[D].青島:中國(guó)海洋大學(xué),2013.
Transcriptome data assembly and analysis of grand jackknife clam Solen grandis through high-throughput sequencing
NIE Hong-tao1,2, JIANG Li-wen1, ZHENG Meng-ge1, LI Dong-dong1, YAN Xi-wu1,2
(1.College of Fisheries and Life Science, Dalian Ocean University, Dalian 116023, China; 2.Engineering Research Center of Shellfish Culture and Breeding in Liaoning Province, Dalian 116023, China)
The Illumina Hi-seq sequencing technology was used to sequence the transcriptome in gills of grand jackknife clam Solen grandis and the data were analyzed by bioinformatics method to study the transcriptome of the grand jackknife clam.The transcriptome library of grand jackknife clam was found to contain 338 483 476 reads,and 190 856 Unigenes were obtained by assembling the Scaffolds in the transcriptome library,with an average length of 1147 bp.A total of 63 337 annotated genes were obtained compared with NR, KO, SwissProt, PFAM,GO, KOG and other databases for Blast(E-value 10-5).Comparing with the NR database, we found that the gene sequence in grand jackknife clam had a high homology(53.3%)with the Pacific oyster(Crassostrea gigas).Unigenes in the transcriptome of grand jackknife clam was divided into 25 classes according to the function by comparing Unigene with the KOG database.GO annotations was divided into 3 major categories:biological processes,cellular components and molecular functions including a total of 65 branches.The KEGG database revealed that the transcriptome data of grand jackknife clam was divided into 92 types according to the metabolic pathway.The ORF were predicted by Blast with protein database and estscan, 50 681 ORF with the length of more than 300 nt, and total of 73 089 SSR markers was found through repeat sequence motifs search and analysis.The transcriptome information in this study can provide the gene resources for cloning and functional analysis and molecular markers development of grand jackknife clam in the future.
Solen grandis; transcriptome; high-throughput sequencing; bioinformatics analysis
Q142;S968.3
A
10.16535/j.cnki.dlhyxb.2017.06.004
2095-1388(2017)06-0658-06
2017-03-30
現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)技術(shù)體系建設(shè)專項(xiàng) (CARS-48);遼寧省農(nóng)業(yè)領(lǐng)域青年科技創(chuàng)新人才項(xiàng)目 (2014004);大連市科技計(jì)劃項(xiàng)目(2014B11NC092,2016RQ065)
聶鴻濤 (1984—),男,博士,副研究員。E-mail:htnie@dlou.edu.cn
閆喜武 (1962—),男,博士,教授。E-mail:yanxiwu@dlou.edu.cn