亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于全基因組重測序技術(shù)分析甜菜InDel標記

        2020-07-16 04:36:42黃平仙高永明劉乃新付暢吳玉梅
        中國糖料 2020年3期
        關(guān)鍵詞:甜菜基因組位點

        黃平仙,高永明,劉乃新,付暢,吳玉梅

        (1.黑龍江大學(xué)現(xiàn)代農(nóng)業(yè)與生態(tài)環(huán)境學(xué)院,哈爾濱 150080;2.哈爾濱師范大學(xué)生命科學(xué)與技術(shù)學(xué)院,哈爾濱 150025)

        0 引言

        甜菜屬于石竹目、藜科、甜菜屬,甜菜最初生長于歐洲西南部地區(qū),是甘蔗以外的第二大糖料來源。甜菜產(chǎn)業(yè)在我國北方占有重要地位,甜菜糖業(yè)在西北、東北穩(wěn)定發(fā)展,在華北呈不斷提升發(fā)展態(tài)勢[1]。分子標記、基因工程、組學(xué)技術(shù)等為甜菜的深入研究提供了重要技術(shù)手段[2]。在遺傳育種研究中能夠快速、高效且準確地識別甜菜品種十分重要。目前應(yīng)用于物種鑒定試驗中的分子標記技術(shù)主要有SCoT[3]、SSR[4]和SRAP[5]等,主要用于甜菜物種鑒定的技術(shù)有SSR[6]、SRAP[7]和ISSR[8],每種方法各有長處。

        全基因組重測序技術(shù)是針對人類已經(jīng)掌握全部基因組序列的個體進行基因組測序,并將所取得的結(jié)果與個體、群體的基因組進行差異性分析,將測序后得到的結(jié)果與已經(jīng)掌握的基因組進行比對,可以檢測出全基因組內(nèi)的插入、缺失突變和核苷酸序列改變等多種變異信息,全基因組重測序后得到的數(shù)據(jù)是鑒定經(jīng)濟動、植物遺傳性狀的重要依據(jù),可根據(jù)基因組變化的結(jié)果針對多種突變進行開發(fā)利用,為各種經(jīng)濟作物的品種篩選提供便利[9]。InDel 標記是根據(jù)不同個體基因組同源序列發(fā)生的核苷酸片段插入或缺失而開發(fā)的,InDel位點在基因組內(nèi)分布廣、密度高、變異率高,InDel標記技術(shù)的可重復(fù)性好并且成本不高昂[10-11]。因此利用全基因組重測序技術(shù)開發(fā)InDel 標記,并利用這種方法進行品種鑒定已經(jīng)被廣泛應(yīng)用于水稻[12]、朝天椒[13]和番茄[14]等農(nóng)作物中,諸多研究已經(jīng)證明了InDel標記技術(shù)的可靠性,因此將其應(yīng)用于甜菜品種的篩選是可行的方案。

        2016年,Ries等利用不同表型育種系品種通過深度測序和InDel標記法對甜菜不同基因型樣本進行了快速檢測[15]。但是,目前已知的甜菜InDel標記較少,研究相對落后,將InDel標記應(yīng)用于甜菜品種的篩選可以從多種角度、更加全面地篩選不同品種的甜菜。本研究利用全基因組重測序技術(shù)對5 個甜菜品種的基因組進行了測序,第二代測序技術(shù)能夠高效、快速和準確地獲得5 種甜菜全基因組序列,進而可將其基因組上的插入與缺失位點開發(fā)出一套全新的InDel引物,為甜菜種質(zhì)資源的篩選提供更加多樣化、細致化的選擇基礎(chǔ),對甜菜品種的保護起到重要的作用。

        1 材料和方法

        1.1 試驗材料

        以‘MA3001’、‘KWS1231’、‘ZT000589’、‘ZT000549’、‘ZT000286’五個甜菜種質(zhì)資源為試驗材料,從每個甜菜品種中取出15 粒種子,種植在大小適宜的花盆內(nèi),待植株的莖長到5~6 cm后將莖剪下來,快速地封裝在做好標記的容器中,而后轉(zhuǎn)移到超低溫冰箱中留用。

        1.2 試驗方法

        1.2.1 甜菜基因組DNA的提取

        采用CTAB法提取甜菜基因組的DNA,并用1%瓊脂糖凝膠電泳對DNA樣品進行質(zhì)量檢測[16]。

        1.2.2 文庫構(gòu)建與測序

        使用Covaris破碎機將檢驗后無污染且純度好的DNA 樣品隨機切斷成長度約為350 bp 的DNA 片段,而后使用Klenow exo 對DNA 片段進行前端修復(fù)、加尾和連接測序接頭,最后使用TruSeq Library Construction Kit回收DNA片段,得到甜菜的基因組測序文庫。

        構(gòu)建測序文庫后,用核酸蛋白定量儀Qubit2.0 進行初階定量,將基因組濃度減少到1 ng/μL,然后使用Agilent 2100 針對文庫的插入尺寸進行檢測,符合預(yù)期后對文庫的有效DNA 濃度進行定量(文庫濃度應(yīng)>2 mol/L)。在保證文庫質(zhì)量的基礎(chǔ)上進行illumina HiSeq測序。

        1.2.3 測序質(zhì)量檢查

        按表1中的標準進行測序錯誤率檢測,測序錯誤率用e表示,堿基質(zhì)量值Qphred=-10 log10(e)。

        表1 測序正確率與Phred 分值的對應(yīng)關(guān)系Table 1 The correlation between sequencing accuracy and Phred score

        1.2.4 測序數(shù)據(jù)過濾

        測序后得到的序列是原始數(shù)據(jù),中間摻雜有接頭的低品質(zhì)的數(shù)據(jù)。為確保測定數(shù)據(jù)的品質(zhì),需要對原始數(shù)據(jù)進行過濾,將有接頭的數(shù)據(jù)去掉,將單頭測序中含有N 比例超過10%的數(shù)據(jù)去掉,將單頭測序中低質(zhì)量堿基大于50%的數(shù)據(jù)去掉,得到有效數(shù)據(jù),后續(xù)分析都根據(jù)有效數(shù)據(jù)展開。

        1.2.5 重測序序列與參考基因組的比對及InDel位點的檢測

        對重測序數(shù)據(jù)進行過濾后,使用BWA 軟件[17]將有效數(shù)據(jù)與參考基因組的序列進行比對,尋找一致的基因組數(shù)據(jù),然后使用SAMTOOLs軟件[18]檢測一致基因組數(shù)據(jù)中的插入及缺失位點。

        1.2.6 InDel位點的分布分析

        使用ANNOVAR軟件[19]分析5個甜菜種質(zhì)資源基因組中InDel位點的分布位置,以及不同長度的InDel位點在基因組上的分布情況。根據(jù)分析得出的結(jié)果確定可以開發(fā)InDel引物的合適位點。

        2 結(jié)果與分析

        2.1 甜菜品種的全基因組重測序分析

        對5個甜菜種質(zhì)資源進行全基因組重測序,測序后對測序質(zhì)量進行分析,檢查全基因組重測序結(jié)果是否符合規(guī)范,是否可以進行后續(xù)InDel位點檢測與引物開發(fā)。分析結(jié)果表明測序錯誤率比較低(表2)。測序的錯誤率受到堿基質(zhì)量、測量儀器、材料和原料等諸多因素的影響,產(chǎn)生誤差的原因主要有以下幾點:⑴測序儀器初期不穩(wěn)定;⑵藥劑的逐漸減少導(dǎo)致文庫的測量質(zhì)量降低;⑶DNA 被照射次數(shù)增多導(dǎo)致?lián)p傷增多。一般序列的前端和末端的錯誤率會偏高。

        表2 測序數(shù)據(jù)的質(zhì)量分析Table 2 Quality analysis of sequencing data

        通過對5 個甜菜種質(zhì)資源的全基因組重測序,共獲得42.908 GB 的原始數(shù)據(jù),經(jīng)過過濾處理后得到42.849 GB 的有效數(shù)據(jù)。每個甜菜品種的原始數(shù)據(jù)在7 351.715~9 487.149 Mbp 的范圍之內(nèi),Q20≥95.36%、Q30≥88.80%(表2)(高質(zhì)量測序保證Q30>85%),G 和C 含量在36.79%~37.95%之間(表2)。結(jié)果表明,基因組測序數(shù)據(jù)量足夠,C和G的分布在正常范圍之內(nèi),測序質(zhì)量良好,能夠支持后續(xù)分析。

        2.2 甜菜品種的基因組序列與參考基因組的比對分析

        利用BWA軟件(參數(shù):mem-t 4-k 32-M)將5個甜菜品種的有效基因組數(shù)據(jù)與參考基因組比對,再利用SAMTOOLS 軟件去除多余的重復(fù)序列。參考基因組的大小為566.550 Mbp(表3),由表4 可知,5 個甜菜品種的基因組平均測序深度最大為16.41%,最小為12.87%;單堿基覆蓋度占比最大為95.79%,最小為94.62%;四堿基覆蓋度占比最大為88.83%,最小為85.15%。比對后5 個甜菜品種與參考基因組一致的有效序列(去除重復(fù)序列)數(shù)據(jù)量為42.84 GB,有效序列的數(shù)量為2.71×109條,占參考基因組序列的99.84%。平均每個甜菜品種的有效數(shù)據(jù)量為8.57 GB,有效序列的數(shù)量為5.42×108條。結(jié)果表明,5個甜菜品種的基因組序列可用于后續(xù)的變異檢測及相關(guān)分析。

        表3 參考基因組基本情況分析Table3 Analysisofreferencegenome

        表4 測序深度及覆蓋度分析Table 4 Analysis of sequencing depth and coverage

        2.3 InDel序列長度及分布分析

        利用SAMTOOLs(mpileup-m 2-F 0.002-d 1000)從5 個甜菜品種與參考基因組比對一致的序列中檢測InDel序列(長度小于50 bp的插入與缺失片段),然后用ANNOVAR 軟件對InDel序列的分布位置進行注釋及分析(表5)。

        通過InDel位點的注釋分析,從5 個甜菜品種中分別發(fā)現(xiàn)了343 138、317 057、281 435、312 444和316 595個InDel位點(平均314 134.8),其數(shù)量和分布與參考基因組相似。在這5個甜菜品種中,InDel位點主要分布在基因間區(qū),約占全部位點的55%,其次是基因區(qū)。在基因區(qū)內(nèi),大部分的InDel位點分布在內(nèi)含子中,蛋白質(zhì)編碼區(qū)(Coding sequence,CDS)區(qū)中分布的InDel位點最少。

        表5 InDel 位點的檢測及注釋Table 5 Detection and annotation of InDel locus

        在這5 個甜菜品種全基因組中,InDel 位點的長度分布趨勢也基本一致(圖1)。InDel 位點的數(shù)量隨著InDel 片段長度的增加而減少(基因區(qū)除外)。根據(jù)片段長度,可將InDel位點分為4 種類型,分別是長度為1 bp 的位點、長度為2~4 bp 的位點、長度為5~8 bp 的位點和長度超過9 bp 的位點。其中長度為1 bp 的InDel位點數(shù)量超過110 000 個(約占所有InDel的40%);長度為2~4 bp的InDel位點數(shù)量為20 000~80 000個;長度為5~8 bp的InDel位點數(shù)量約為10 000個;長度超過9 bp的InDel位點數(shù)量不足7 000個(圖2)。

        圖1 基因編碼區(qū)InDel長度分布Fig.1 InDel length distribution of gene coding region

        圖2 全基因組InDel長度分布Fig.2 InDel length distribution in the whole genome

        5個甜菜品種的InDel位點在CDS區(qū)的分布趨勢和數(shù)量也與參考基因組相似,分別有4 828、4 810、4 473、4 975 和4 824 個InDel 位點,這些InDel 位點幾乎都會引起編碼蛋白質(zhì)的顯著變化。其中約有1 500 個InDel位點導(dǎo)致了插入或刪除,這將插入或刪除編碼蛋白質(zhì)的一個或幾個氨基酸。大約有600~800 個InDel 位點導(dǎo)致了堿基移位,低于100個InDel位點導(dǎo)致了終止密碼子的產(chǎn)生和缺失。導(dǎo)致移碼突變或終止密碼子的產(chǎn)生和缺失的InDel位點將大大改變編碼蛋白質(zhì)的序列。

        用InDel位點的長度對不同長度InDel位點占位點總數(shù)的百分比作圖,得到InDel位點在全基因組中的長度分布(圖2),隨著InDel 位點長度的增加,InDel 位點的數(shù)量將會減少。在基因編碼區(qū)內(nèi),當InDel片段的長度為3 bp時,數(shù)量將遠遠超過其他長度的InDel位點(圖1)。

        3 討論

        3.1 甜菜品種基因組中InDel位點的分布

        本研究使用Illumina測序平臺對5個甜菜品種進行了全基因組重測序,并將全基因組序列分別與甜菜的參考基因組進行了比對,約有55%的InDel位點分布在基因間區(qū),與其他物種的InDel位點分布基本一致。在基因區(qū)內(nèi),超過60%的InDel位點分布在內(nèi)含子中,這些變異幾乎不會影響基因表達和基因功能。如果InDel位點分布在CDS 區(qū)中,其編碼蛋白質(zhì)的氨基酸序列會發(fā)生改變,基因功能可能會發(fā)生改變甚至遭到破壞。如果InDel位點分布在啟動子區(qū)域,基因的表達會增加或減少,這最終會改變植物的表型或適應(yīng)性。分布在基因間區(qū)的InDel位點不會使基因表達發(fā)生如此大的變化,所以該區(qū)域中長度大于3 bp 的InDel位點最適合進行InDel 引物開發(fā),其次是內(nèi)含子區(qū)域中長度大于3 bp 的InDel位點,CDS 區(qū)域和啟動子區(qū)域的InDel位點不適合進行引物開發(fā)。

        3.2 甜菜品種基因組中InDel序列長度分布

        InDel序列的長度各有不同,通常插入與缺失位點的數(shù)量會隨著InDel長度的增加而減少(基因區(qū)除外),5 個甜菜品種的InDel 序列無論是在全基因組上的分布還是在CDS 區(qū)域的分布都符合這一情況。這一現(xiàn)象可能是因為植株基因間區(qū)較短,過長的插入或缺失會破壞與植物生存相關(guān)的基因,最終降低植物的存活率。當插入與缺失片段短時,對基因組的損傷較小,植株的存活率較高,因此這種變化保留的概率更高。在基因區(qū)內(nèi)長度為3 bp 或其整數(shù)倍的InDel 位點的數(shù)量最多。最適宜開發(fā)InDel引物的是等于或大于3 bp 的InDel序列。將這5 個甜菜品種的基因組序列與參考基因組比對后發(fā)現(xiàn),這5 個甜菜品種的基因組中分別有135 639、137 011、123 776、145 478 和135 040個InDel位點的長度超過3 bp,平均每MB數(shù)據(jù)中有238.78個長度超過3 bp的InDel位點。這些位點有適合用于開發(fā)高效的InDel引物。

        4 結(jié)論

        進行了5 個甜菜品種的全基因組重測序分析,Q20≥95.36%、Q30≥88.80%,基因組重測序數(shù)據(jù)量足夠,C和G的分布在正常范圍之內(nèi),測序質(zhì)量良好,能夠支持后續(xù)分析。

        將5 個甜菜品種的基因組序列分別與參考基因組比對,經(jīng)處理后得到42.84 GB 的無重復(fù)有效數(shù)據(jù)。通過InDel位點的注釋分析可知,從5個甜菜品種中分別發(fā)現(xiàn)了343 138、317 057、281 435、312 444和316 595個InDel 位點。主要分布在基因間區(qū),約占全部位點的55%,其次是基因區(qū)。在基因區(qū)內(nèi),大部分的InDel位點分布在內(nèi)含子中,蛋白質(zhì)編碼區(qū)(Coding sequence,CDS)中分布的InDel位點最少。

        InDel位點的數(shù)量隨著InDel長度的增加而減少(基因間區(qū)除外),在基因區(qū)內(nèi)大部分InDel位點的長度為3 bp或其整數(shù)倍,在基因間區(qū)內(nèi)大部分InDel位點長度為1 bp。

        5個甜菜品種的InDel位點在CDS區(qū)的分布趨勢和數(shù)量也與參考基因組相似,分別有4 828、4 810、4 473、4 975和4 824個InDel位點,這些InDel位點幾乎都會引起編碼蛋白質(zhì)的顯著變化。

        大于3 bp 的InDel位點適合進行InDel 引物開發(fā)。這些InDel位點的開發(fā)為進行遺傳效應(yīng)分析并鑒定甜菜種質(zhì)資源提供了重要基礎(chǔ)。

        猜你喜歡
        甜菜基因組位點
        鎳基單晶高溫合金多組元置換的第一性原理研究
        上海金屬(2021年6期)2021-12-02 10:47:20
        甜菜應(yīng)答鹽脅迫的RING型E3連接酶基因的鑒定與分析
        牛參考基因組中發(fā)現(xiàn)被忽視基因
        CLOCK基因rs4580704多態(tài)性位點與2型糖尿病和睡眠質(zhì)量的相關(guān)性
        辣椒甜菜,各有所愛
        二項式通項公式在遺傳學(xué)計算中的運用*
        新疆產(chǎn)區(qū)有機甜菜栽培技術(shù)探討
        中國糖料(2016年1期)2016-12-01 06:49:04
        基因組DNA甲基化及組蛋白甲基化
        遺傳(2014年3期)2014-02-28 20:58:49
        二二三團甜菜主要病蟲害發(fā)生特點及防治
        有趣的植物基因組
        自拍视频国产在线观看| 日日噜狠狠噜天天噜av| 久久免费网国产AⅤ| 人妻无码ΑV中文字幕久久琪琪布| 中文字幕精品久久一区二区三区| 国产亚洲精品久久午夜玫瑰园 | 久久国产精品一区av瑜伽| 欧美激情在线播放| 久久婷婷国产剧情内射白浆| 亚洲国产福利成人一区二区 | av影片在线免费观看| 377p日本欧洲亚洲大胆张筱雨 | 久久99久久99精品观看| 永久免费观看的黄网站在线| 中文字幕日韩三级片| 欧美真人性做爰一二区| 久久无码中文字幕东京热| 国产一区二区三区亚洲| 亚洲成a人片在线观看无码3d| 色爱区综合激情五月综合小说| 91久久精品国产性色tv| 97精品人妻一区二区三区在线| 一本久久伊人热热精品中文字幕| 精品国产网红福利在线观看| 日韩国产有码精品一区二在线| av日韩一区二区三区四区| 少妇性饥渴bbbbb搡bbbb| 91短视频在线观看免费| 99久久久69精品一区二区三区| 久久久久亚洲av成人片| 国产精品久久久久久妇女6080| 国产午夜av一区二区三区| 中文字幕免费人成在线网站| 精品无码久久久久久国产| 久久精品中文字幕极品| 国产精品视频一区二区久久| 四虎影视久久久免费观看| 亚洲精品成人片在线观看| 日本一区二区久久精品亚洲中文无 | 欧美最大胆的西西人体44| 中文字幕Aⅴ人妻一区二区苍井空|