郭春梅,孫明忠,鄭體花,任一鑫,劉淑清*
1大連醫(yī)科大學生物技術系;2大連醫(yī)科大學生物化學與分子生物學教研室;3大連醫(yī)科大學寄生蟲教研室,大連116044
蛇毒(snake venom,SV)具有抗凝止血、鎮(zhèn)痛、影響血小板聚集、誘導出血或溶血、誘導細胞凋亡、刺激水腫形成、抗病毒、抗腫瘤、抗菌消炎、抗HIV 等多種生物學活性[1-10],具有很好的臨床應用前景和開發(fā)價值。蛇毒中主要的活性及毒性成分是蛋白(酶),獲得蛇毒蛋白進行功能研究尤為重要。
中國蛇島蝮蛇(Gloydius shedaoensis shedaoensis,GSS)是我國獨有珍稀蛇種,為國家二級保護物種。蛇毒價格昂貴且來源稀少,而且過度采集蛇毒會嚴重影響GSS 的生存;蛇毒中的大多活性蛋白(酶)含量都很低,采用傳統(tǒng)純化方法很難得到足夠量的目的活性蛋白(酶)[3,4,11],阻礙了GSS 蛇毒活性蛋白(酶)的開發(fā)利用。從相應cDNA 文庫中篩選cDNA克隆進行表達序列標簽(EST)分析,采用基因工程手段大量表達和獲得蛇毒目的活性蛋白(酶)進行深入研究是一種可行的方法。
EST 是通過隨機選取cDNA 克隆進行單向測序獲取的特定組織在特定時期表達基因的一段序列。EST 是基因的“窗口”,可特異性地代表生物體某組織某一時間的一個表達基因,故被稱為基因表達序列標簽。對生物進行大規(guī)模cDNA 測序不僅可以獲得已知的有重要價值的基因,還可以發(fā)現(xiàn)許多新的未知基因。EST 分析可以用于尋找功能基因、分離與鑒定新基因、基因表達譜研究、構建遺傳圖譜、物理圖譜等[12-18]。
本研究在我們前期成功構建的GSSG-cDNA 文庫基礎上,對211 個ESTs 進行了測序和功能分析,發(fā)現(xiàn)84 個克隆為已知功能基因,29 個克隆為未知功能基因,98 個克隆為新基因,從而為進一步對GSS 活性蛋白基因的克隆、表達和功能研究奠定了一定實驗基礎。
GSSG-cDNA 文庫由本實驗室制備并保存;DNA Marker、Rnase A 酶為寶生物工程(大連)有限公司產品;胰蛋白胨、酵母提取物為OXOID 公司產品;三羥甲基氨基甲烷(Tris)購于GE Health Care 公司;十二烷基磺酸鈉(SDS)、EB、苯酚、瓊脂糖購于Sigma公司;其他試劑均為國產分析純。
由本研究組采用SMART 技術構建中國蛇島蝮蛇毒腺的cDNA 文庫[19]。
1.3.1 cDNA 文庫菌液的擴增
cDNA 文庫進行梯度實驗,選出最佳稀釋濃度后,在LB 固體培養(yǎng)基(34 μg/mL 氯霉素)上涂板,每個平板的理論細菌個數(shù)為960,37 ℃倒置培養(yǎng)16 h;然后挑取單個菌落至3 mL LB 液體培養(yǎng)基中(34 μg/mL 氯霉素),37 ℃震蕩培養(yǎng)16 h;然后在10000 rpm 離心1 min,棄上清,細胞沉淀盡可能干燥,–20℃保存。
1.3.2 cDNA 文庫質粒的提取
采用堿裂解法提取質粒:(1)將細菌沉淀懸浮于200 μL 預冷至4 ℃的溶液Ⅰ中(1M Tris-HCl,0.5 M EDTA,20% glucose,pH 8.0),劇烈震蕩,室溫放置5 min;(2)加入400 μL 溶液Ⅱ(0.4 M NaOH,2%SDS),快速輕顛倒5 次混勻,室溫靜置5 min;(3)加入300 μL 溶液Ⅲ(29% KAC,11% CH3COOH,pH 4.8),輕顛倒數(shù)次混勻,冰上放置5 min 后在4 ℃、1000 rpm 下離心5 min;(4)小心吸出上清,加入與上清液等體積的苯酚-氯仿混合液抽提,顛倒混勻,冰上放置5 min 后在4 ℃、10000 rpm 下離心2 min;(5)小心吸出上層水相,加入2 倍體積無水乙醇,混勻,室溫放置5 min 后離心(5 min,4 ℃,10000 rpm);(6)棄上清,傾去液體,加入1 mL 0 ℃70%乙醇洗滌沉淀,吹打后離心(2 min,4 ℃,10000 rpm);(7)棄上清,乙醇揮發(fā)干凈后,每個質粒加入30 μL TE(1M Tris-HCl,0.5 M EDTA,20 μg/mL RNase,pH 8.0)緩沖液溶解,-20 ℃保存。取0.5 μL 樣品,采用1%瓊脂糖凝膠電泳鑒定質粒提取結果。
1.3.3 cDNA 克隆的序列測定
隨機挑選216 個cDNA 單克隆進行測序。設計通用引物M13F 序列5'-GTAAAACGACGGCCAGT-3',對單克隆進行5'端單向測序。反應體系總體積為20 μL:8 μL DYEnamic ET Dye Terminator reagent premix (Amersham Pharmacia,USA),1 μL 5 μmol/L M13 F,質粒模板0.2~2 μg。PCR 測序反應條件為:95 ℃20 s,50 ℃15 s,60 ℃1 min,進行30 個循環(huán),測序用MegaBACETM1000 DNA 測序儀(Amersham Pharmacia,USA)完成。
1.3.4 ESTs 序列分析
獲得的cDNA 質粒序列用Chromas 剔除pDNRLIB 載體序列以及包含的接頭序列,并去除冗余序列,得到每個克隆的EST 序列信息;然后通過Stackpack 軟件將獲得的序列進行拼接,獲得unigenes,由重疊群(contigs)及單一序列(singlets)組成,通過NCBInr 數(shù)據(jù)庫進行Blast X 檢索和序列比對及功能分析,根據(jù)蛋白相似性推測基因功能并分類。
我們前期以pDNR-LIB 為載體,構建了我國第一個GSSG-cDNA 文庫,其原始文庫庫容量為8 ×107cfu/mL。隨機從文庫中挑選單菌落進行菌液PCR 鑒定結果表明:大多數(shù)插入片段均大于1000 bp,表明所構建的GSSG-cDNA 文庫質量很高[19]。
用堿裂解法提取文庫質粒,經1%瓊脂糖凝膠電泳檢測,圖1 顯示了部分cDNAs 的質粒提取電泳圖。cDNA 文庫質量直接影響其使用價值。評價一個cDNA 文庫質量,主要是看該cDNA 文庫的庫容量和重組cDNA 片段的序列完整性[20]。電泳結果顯示大多數(shù)重組質粒分子量大于3000 bp,進一步表明我們構建的GSSG-cDNA 文庫是完整高質量的,獲得全長序列的可能性大,可滿足EST 研究要求。為今后利用該文庫進行大規(guī)?;蚝Y選、獲得有價值的功能基因奠定了基礎。電泳圖上發(fā)現(xiàn)提取的質粒伴有不同程度開環(huán)現(xiàn)象,但并不影響后續(xù)的序列分析。
圖1 GSSG-cDNA 文庫質粒瓊脂糖凝膠電泳(1%)Fig.1 Agarose gel electrophoresis (1%)of GSSG-cDNAs
隨機選取GSSG-cDNA 文庫中的216 個單克隆進行5'單向測序,獲得有效序列211 條,即211 個ESTs,測序成功率為97.7%。
EST 包含了完整基因上能夠特異性標記基因的部分序列,通常包含了基因足夠的信息區(qū),從而可與其它基因相區(qū)分。將ESTs 序列與數(shù)據(jù)庫中存儲的基因/蛋白序列進行比對和相似性分析,可確定出哪些EST 為已知基因,哪些EST 為未知基因[21,22]。211 條高質量GSSG-ESTs 經Blast X 檢索NCBInr 數(shù)據(jù)庫比對、查詢和注釋(E≤10-6)表明:(1)84 條ESTs 與數(shù)據(jù)庫中有序列注釋的已知功能蛋白具有一定同源性,為已知功能基因,占39.8%;(2)29 條ESTs 與有序列注釋的未知功能蛋白具有同源性,為未知功能基因,占13.7%;(3)98 條ESTs 是數(shù)據(jù)庫中無注釋信息的序列、僅有很低同源性或在數(shù)據(jù)庫中未搜索到序列,即新基因,占46.5%,說明蛇島蝮蛇具有自己的特異基因(圖2,表1)。
圖2 GSSG-cDNA 文庫ESTs 比對結果Fig.2 The blasting results of ESTs of GSSG-cDNA library
組織中一定數(shù)量的ESTs 可代表該組織中基因表達情況,隨機測序所獲得的同一基因的EST 數(shù)目在一定程度上代表該基因在該組織中的表達豐度。一個基因的表達次數(shù)越多,能夠測到的相應EST 也越多,因此通過EST 分析可以了解基因表達情況和表達豐度[16]。一般把表達頻率<2 的基因視為低表達豐度基因;表達頻率≥2 且<5 的基因視為中表達豐度基因;表達頻率≥5 的基因視為高表達豐度基因[16,21,22]。GSSG 的211 個ESTs 代表130 個unigenes,包括16 個singlets 和114 個contigs。文庫平均冗余率12.3%,其中高表達豐度基因7 個,占全部unigenes 的5. 4%;中表達豐度基因9 個,占6.9%;低表達豐度基因114 個,占87.7% (圖3,表1),GSSG-cDNA 文庫大多數(shù)基因呈低豐度表達,這樣可避免重復測序,獲得單一基因的幾率大大增加,避免人力物力的浪費。
圖3 GSSG-cDNAs 基因表達豐度分布Fig.3 The gene expression abundances of GSSG-cDNA
表1 GSSG-cDNA 文庫部分cDNA Blast 檢索結果Table 1 Blasting results of GSSG-cDNAs
elongation factor-1 alpha Pelodiscus sinensis 86% 2 7 Splicing factor SLU7 Monodelphis domestica 82% 1 8 ribosomal protein L23a Salmo salar 75% 1 9 calnexin Gallus gallus 83% 1 10 phosphatase 2 Taeniopygia guttata 90% 1 11 zinc finger Sus scrofa 73% 1 12 adenylosuccinate synthetase Gallus gallus 85% 1 13 Bax inhibitor-1 Canis familiaris 76% 1 14 cyclin C Gallus gallus 89% 1 15 ribosomal protein L5 Gallus gallus 83% 1 16 GTP-binding protein SAR1b-like Callithrix jacchus 86% 1 17 Adapter-related protein complex 3 delta 1 Taeniopygia guttata 85% 1 18 lysosomal acid lipase Macaca mulatta 60% 1 18 PSEN2 gene for presenilin 2 Homo sapiens 78% 1 20 transketolase Gallus gallus 83% 1 21 NNU 95048 12S ribosomal RNA gene Gloydius intermedius shedaoensis 94% 1 22 membrane protein 1 Monodelphis domestica 80% 1 23 cell division cycle and apoptosis regulator 1 Ailuropoda melanoleuca 86% 1 24 alpha actin Atractaspis microlepidota microlepidota 97% 1 25 dehydrogenase Ornithorhynchus anatinus 82% 1 26 Rho GTPase activating protein 5 Taeniopygia guttata 85% 1 27 member RAS oncogene family Gallus gallus 78% 1 28 arginine-rich Monodelphis domestica 62% 1 28 cellular nucleic acid binding protein Gallus gallus 78% 1 30 cysteine dioxygenase Gallus gallus 78% 1 31 ubiquitin-fold modifier 1 Gallus gallus 86% 1 32 Ribosomal protein S6 kinase Gallus gallus 86% 1 33 tetraspan NET-6 Monodelphis domestica 75% 1 34 gamma-actin mRNA Trichosurus vulpecula 84% 1 35 programmed cell death 4 Ailuropoda melanoleuca 80% 1 36 ribonuclease UK114-like Ailuropoda melanoleuca 80% 1 37 tRNA selenocysteine-associated protein 1 Taeniopygia guttata 81% 1 38 Ubiquitin-conjugating enzyme E2 G2 Rana catesbeiana 83% 1 39 serine palmitoyltransferase Gallus gallus 71% 1 40 eukaryotic translation initiation factor 1A Taeniopygia guttata 88% 1 41 constitutive photomorphogenic protein Gallus gallus 90% 1 42 predicted protein Postia placenta Mad-698-R 90% 1 43 KIAA0987 protein (LOC100015377) Monodelphis domestica 70% 1 44 RP23-157G2 from chromosome 5 Mus musculus BAC 85% 1 45 hypothetical protein LOC100227078 Taeniopygia guttata 84% 1 46 E33DIFJ02GS9NC microsatellite sequence Agkistrodon contortrix 84% 1 47 E33DIFJ02F7Q1J microsatellite sequence Agkistrodon contortrix 80% 1 6
1-41:已知功能基因;42-55:未知功能基因;56-61:新基因,其余92 條ESTs 在數(shù)據(jù)庫中未能搜索到同源蛋白,沒有列出。1-41:genes with known function;42-55:genes with unknown function;56-61:new genes,the rest 92 ESTs were not listed due to had no significant matches to any protein sequences in the public database
在Blast X 分析中,我們獲得了一部分已知功能基因,這些基因具有重要的生物學功能;因此,可以根據(jù)獲得的序列來設計引物,克隆、表達目的活性蛋白組分,進一步研究其生物學活性。例如我們得到一個GSSG 基因,其EST 序列為648 bp(圖4 A),編碼216 個氨基酸(圖4 B),氨基酸序列比對發(fā)現(xiàn)其與非洲家蛇和水游蛇的轉鐵蛋白同源性高達84%(圖4 C)。但轉鐵蛋白在蛇毒中扮演的角色以及具體生物學活性,目前尚不清楚。
圖4 蛇島蝮蛇轉鐵蛋白序列分析Fig.4 The sequence analysis of GSS-transferrin
此外有近60%的GSSG 基因為新基因或未知功能基因,說明在GSS 中存在自身含有的特異基因/蛋白,提示我們去搞清楚:1)它們是什么基因/蛋白,2)它們在GSS 中起什么作用,3)它們有什么具體應用和生物功能,亟須進一步研究去揭示,是今后研究的重點。例如,本研究發(fā)現(xiàn)一個GSSG 基因,其全長序列為384 bp:
ATGGGGCAGGATGAAATTAGCAACTTCACTGA CTTAGCCTTGCAATATTATAACCAGCAGGAAGAG TCCCTGTTTATACCTTTGAAGAACACAACCGTGA CGGTCAAGAAAGCCATTGGATCCATATTGGGC CTGCCGATGATTGTGGAAAGGACCAACTGCACC AAAAAAGATGTGAAACGACATTTTAGGAGTC CCTTTGATTCTGAAGAAGAACCCCGGAAATATTG TATGCCGCTTCCGGACCCTGAGCAACTGAACT GCAAATTTCACATTTTTAAAGATGAAAGGACTT ACAGCGAAGCTATACTGGGCCATGAATGCGA GCCAATTAAAATAATCGATAAGGAGATTCTT AATGTTGAAGATACAAAATCACCATAT,編碼128 個氨基酸。序列比對發(fā)現(xiàn)其與抗輻射不動桿菌的一個假設蛋白有8%序列同源性,但這個GSSG 基因具體是什么基因,有什么樣的生物學功能,在GSS 中起什么作用,需要和值得進一步研究。
近年來,隨著激光顯微切割、cDNA 文庫標準化、DNA 自動測序技術和cDNA 芯片技術的快速發(fā)展,使得隨機挑取cDNA 單克隆進行大規(guī)模測序得以順利進行,并為克隆新基因、尋找組織特異性基因等提供了快速有效的方法[21,22]。用EST 代替基因組測序,可使研究費用大大降低,同時效率大大提高,因為EST 能大大縮小基因篩選范圍,提高分離基因的效率。在生物體內表達基因只占整個基因組的3%~5%,而EST 反映的是表達基因的編碼部分,故通過EST 可直接獲得基因表達信息。一旦發(fā)現(xiàn)有價值的EST,可通過PCR 技術獲得全長cDNA序列,并克隆、表達目的基因。由于EST 在分析研究功能基因組方面具有的明顯優(yōu)越性,已被廣泛用于新基因的克隆、基因表達譜分析、基因差異表達以及基因組序列的功能注釋等諸多研究領域。
總之,本實驗在我們成功構建中國蛇島蝮蛇毒腺全長cDNA 文庫基礎上,獲得了211 條ESTs 序列,其中84 個為已知功能基因,29 個為未知功能基因,98 個為新基因。盡管本次所測ESTs 序列不太多,但已經提示所得結果可能代表整個蛇毒基因的表達情況,其中低豐度表達基因占總GSSG 基因的近90%,說明采用我們所構建的GSSG-cDNA 文庫,將來進行GSS 基因大規(guī)模篩選和鑒定時,可避免重復測序,獲得單一基因的幾率很大,便于發(fā)現(xiàn)更多的、有價值的功能基因以開展后續(xù)研究,可有效避免人力物力的浪費。
1 Liu SQ(劉淑清),Guo CM(郭春梅),Xu YF(徐躍飛),et al.Effect of metal ions on the biological activity and structural information of snake venom proteins. Chem J Chin Univ(高等學?;瘜W學報),2009,30:1773-1778.
2 Liu S,Sun MZ,Sun C,et al.A novel serine protease from the snake venom of Agkistrodon blomhoffii ussurensis. Toxicon,2008,52:760-768.
3 Liu S,Sun MZ,Greenaway FT.A novel plasminogen activator from Agkistrodon blomhoffii Ussurensis venom(ABUSV-PA):Purification and characterization. Biochem Biophys Res Commun,2006,348:1279-1287.
4 Sun MZ,Liu S,Greenaway FT.Characterization of a fibrinolytic enzyme(ussurenase)from Agkistrodon blomhoffii ussurensis snake venom:Insights into the effects of Ca2+on function and structure.Biochim Biophys Acta,2006,1764:1340-1348.
5 Sun MZ,Liu S,Yang F,et al.A novel phospholipase A2from Agkistrodon blomhoffii ussurensis venom:purification,proteomic,functional and structural characterizations.Biochimie,2009,91:558-567.
6 Liu S,Zhang C,Xu Y,et al. Electrospray ionization mass spectrometry as a critical tool for revealing new properties of snake venom phospholipase A2. Rapid Commun Mass Spectrom,2009,23:1158-1166.
7 Ma C(馬馳),Liu SQ(劉淑清),Zong JW(宗軍衛(wèi)),et al.Proteomic analysis of Gloydius shedaoensis shedaoensis venom by two-dimensional electrophoresis combined to high performance liquid chromatography-electro-spray ionization tandem mass spectrometry:a preliminary study.Chin J Zool(動物學雜志),2009,44:70-77.
8 Rodrigues RS,da Silva JF,Boldrini Franca J,et al.Structural and functional properties of Bp-LAAO,a new L-amino acid oxidase isolated from Bothrops pauloensis snake venom. Biochimie,2009,91:490-501.
9 Doley R,Kini RM. Protein complexes in snake venom. Cell Mol Life Sci,2009,66:2851-2871.
10 Lomonte B,Escolano J,F(xiàn)ernandez J,et al. Snake venomics and antivenomics of the arboreal neotropical pitvipers Bothriechis lateralis and Bothriechis schlegelii. J Proteome Res,2008,7:2445-2457.
11 Yu RM(余瑞銘),Xu YL(許云祿).The research progress of snake venom plasminogen activator.Strait Pharm J(海峽藥學),2008,20:6-8.
12 Chen L,Zhao LP,Gao QK. Generation and analysis of expressed sequence tags from the tender shoots Cdna library of tea plant(Camellia sinensis).Plant Sci,2005,168:359-363.
13 Wang YC,Yang CP,Liu GF,et al.Generation and analysis of expressed sequence tags from a cDNA Library of Tamarix androssowii.Plant Sci,2006,170:28-36.
14 Jae SK,Hyoungseok L,Sung M,et al.Construction and characterization of subtractive stage-specific expressed sequence tag(EST)libraries of the pinewood nematode Bursaphelenchus xylophilus.Genomics,2009,94:70-77.
15 Bausher M,Shatters R,Chaparro J,et al. An expressed sequence tag(EST)set from Citrus sinensis L. Osbeck whole seedling and the implications of further perennial source investigations.Plant Sci,2003,165:415-422.
16 White JA,Todd J,Newman T,et al.A new set of arabidopsis expressed sequence rags from developing seeds,the metabolic pathway from to seed oil. Plant Physiol,2000,124:1582-1594.
17 Jaroslav M,Stephan G,Won KC,et al.Construction,database integration,and application of an Oenothera EST library.Genomics,2006,88:372-380.
18 Zhang JP,Liu TS,F(xiàn)u JJ,et al.Construction and application of EST library from Setaria italica in response to dehydration stress.Genomics,2007,90:121-131.
19 Liu SQ(劉淑清),Guo CM(郭春梅),Hou ZJ(侯志杰),et al. Construction of a cDNA Library for Chinese Gloydius shedaoensis shedaoensis venom Gland. Chin J Zool(動物學雜志),2010,45:136-140.
20 Meng YP(孟玉平),Cao QF(曹秋芬),Sun HF(孫海峰),et al. Construction and partial ESTs analysis of a cDNA library for fruit-bearing shoot in Ziziphue jujuba.Acta Agric Boreali-Sin(華北農學報),2009,24:102-106.
21 Yu FC(于風池). The technology of EST(Expressed sequence tag)and its applications. Chin Agric Sci Bull(中國農學通報),2005,21:54-58。
22 Wan HW(萬海偉),Du LX(杜立新).Application of EST in the study of genomics. Biotechnol Bull(生物技術通報),2004,1:34-38.