賈冰,馬建江,宋吉坤,,裴文鋒,,3,吳嫚,臧新山,張金發(fā),陳全家*,于霽雯,,3*
(1.新疆農業(yè)大學農學院/ 棉花教育部工程研究中心,烏魯木齊830052;2.中國農業(yè)科學院棉花研究所/ 棉花生物學國家重點實驗室,河南 安陽455000;3.中國農業(yè)科學院西部農業(yè)研究中心,新疆 昌吉831100)
棉花作為世界上最重要的經濟作物之一,可以提供大量的天然纖維[1]。 陸地棉因產量高、品質較好在棉花生產中占主導地位[2]。 隨著人們生活水平的不斷提高, 對棉花纖維品質的要求也越來越高。纖維強度是決定棉花纖維經濟價值和紡織質量的關鍵特性之一[3]。 纖維強度是數量性狀,由多基因共同調控,同時又受環(huán)境影響,很難通過傳統的育種技術加以改良[4]。 隨著分子生物學及生物信息技術的快速發(fā)展,分子標記技術極大的推動了數量性狀遺傳基礎的解析及改良。 因此,對棉花纖維強度與分子標記進行關聯分析以及鑒定纖維強度相關的優(yōu)異位點, 將進一步加速棉纖維強度的改良進程, 并為研究纖維強度形成的遺傳基礎提供理論依據。
棉花纖維的產量和質量與棉花纖維發(fā)育進程息息相關[5]。 棉纖維由胚珠表皮單個細胞分化而成,發(fā)育過程分為4 個時期:纖維起始分化、纖維伸長期、次生壁加厚期以及成熟期[6]。纖維次生壁加厚期主要是纖維素的合成及沉淀的過程,纖維強度性狀主要受到該時期眾多基因的調控[7]。近年來,隨著分子生物技術的發(fā)展,特別是棉花全基因組測序的完成,關于棉花纖維強度關鍵位點、基因的挖掘及其功能的相關報道已逐漸增多。Deng 等[8]利用棉花多世代分離群體結合簡單重復序列 (Simple sequence repeat,SSR)標記,鑒定到17 個與纖維強度相關的數量性狀位點 (Quantitative trait locus,QTL)。 Ma 等[9]利用陸地棉重組自交系群體及回交群體,鑒定50 個與纖維強度相關的QTL。Zhang 等[10]利用陸地棉重組自交系群體,構建了全基因組高密度遺傳圖譜, 鑒定到33 個與纖維強度相關的穩(wěn)定的QTL。 Huang 等[11]利用CottonSNP 63K 芯片和503 份陸地棉種質資源構建高密度圖譜,鑒定到10個與纖維強度相關的QTL。 Ma 等[12]利用419 份陸地棉核心種質,通過重測序技術進行全基因組關聯分析, 檢測到533 個與纖維強度相關的顯著SNP位點,并鑒定了1 個與纖維強度相關的基因。 已有的研究獲得了大量的纖維強度相關的QTL 位點,但在多環(huán)境下穩(wěn)定的關鍵位點不多,仍需進一步挖掘控制纖維強度性狀的關鍵位點和基因。
本研究以83 份纖維強度差異顯著的陸地棉為供試材料,利用63K 芯片對群體進行基因型分析,得到15 369 個SNP(Single nuclotide polymorphism,單核苷酸多態(tài)性)位點,對5 個環(huán)境及最佳線性無偏估計值(Best linear unbiased prediction,BLUP)的纖維強度進行全基因組關聯分析,解析棉花纖維強度性狀形成的遺傳基礎。
2014―2016 年分別在河南省安陽市安陽縣(14_Ay、15_Ay、16_Ay)、2016 年 新 疆 維 吾 爾 自 治區(qū)阿拉爾市十團 (16_Ale)、2016 年海南省三亞市吉陽區(qū)(16_Sy)等5 個環(huán)境種植83 份陸地棉材料,材料信息及種植模式參考文獻13、14。
在棉花成熟時, 選擇棉株中部相同部位的20個棉鈴,統一用皮輥軋花機軋花(SY-50)。纖維斷裂比強度由農業(yè)部棉花品質檢驗監(jiān)督檢測中心的HFT9000 儀器檢測完成。
利用SPSS 25.0 對83 份陸地棉材料在不同環(huán)境的纖維強度進行描述性統計分析和相關性分析,使用QTL IciMapping 4.2.0 進行廣義遺傳力分析,使用R 語言計算BLUP 值。
利用課題之前使用CottonSNP 63K 芯片對83份陸地棉材料進行基因型分析得到的15 369 個SNP 位點[13],使用TASSEL 5.0 中的廣義線性模型(General linear model,GLM) 對纖維強度性狀進行全基因組關聯分析。 GWAS 顯著位點的閾值(Bonferroni 法)P為6.51E-05[15-17],即將-lg(P)≥4.19 的位點作為與纖維強度顯著關聯的SNP 位點,使用R 語言繪制曼哈頓圖。 本試驗認為:在3個及以上不同環(huán)境檢測到的同一位置的SNP 是穩(wěn)定的SNP 位點。 根據每條染色體特定的LD(Linkage disequilibrium,連鎖不平衡)的衰減距離[13],將穩(wěn)定的SNP 位點物理位置±LD 值作為QTL 區(qū)間,重疊的區(qū)間合并為1 個QTL 區(qū)間,QTL 命名方式為:q-性狀-染色體-QTL 編號[18]。
將QTL 區(qū)間內的基因作為候選基因庫, 根據海島棉海7124 和陸地棉TM-1 的轉錄組數據庫[19](https://www.ncbi.nlm.nih.gov/bioproject/PRJNA490626/)以及擬南芥同源基因功能注釋,篩選與纖維強度相關基因作為候選基因。
通過對5 個環(huán)境83 份陸地棉材料的纖維斷裂比強度進行統計分析,發(fā)現纖維斷裂比強度性狀具有廣泛的表型變異。 該群體纖維斷裂比強度為22.50~38.50 cN·tex-1,在14_Ay、15_Ay、16_Ay 三個環(huán)境中纖維斷裂比強度的平均值分別為28.94 cN·tex-1、28.70 cN·tex-1和29.58 cN·tex-1, 而在16_Sy 和16_Ale 兩個環(huán)境中纖維斷裂比強度的平均值分別為26.34 cN·tex-1和25.47 cN·tex-1(表1和圖1)。 統計結果表明,在安陽種植的棉花材料的纖維斷裂比強度3 年的分布趨于一致,與16_Sy 和16_Ale 呈現一定的差異。 在5 個環(huán)境中纖維斷裂比強度的變異系數為5.55%~8.44%, 廣義遺傳力高達88.67%, 說明該棉花群體纖維斷裂比強度變異較豐富,遺傳相對穩(wěn)定。 相關性分析(表2)表明,纖維斷裂比強度在5 個環(huán)境中相關系數為0.6~0.76,均呈顯著正相關。 對5 個環(huán)境的纖維斷裂比強度表型數據進行正態(tài)分布檢驗, 發(fā)現除16_Ale外,其他環(huán)境的纖維斷裂比強度性狀基本符合正態(tài)分布,表明該群體適合進行棉花纖維斷裂比強度的全基因組關聯分析。 同時,83 份材料在安陽種植纖維斷裂比強度較大,而在新疆和海南種植則較小,說明纖維斷裂比強度受到環(huán)境的影響, 需要對單個環(huán)境進行全基因組關聯分析。
利用TASSEL 軟件的GLM(Q)模型對14_Ay、15_Ay、16_Ay、16_Sy、16_Ale 5 個環(huán)境的纖維斷裂比強度及BLUP 進行全基因組關聯分析(圖2),分別得到39、134、14、7、16 和55 個顯著相關的SNP位點,共計265 個SNP 位點。 去冗余后得到190 個SNP 位點,分布于除A13 外的其他所有染色體上,
對纖維斷裂比強度的表型解釋為18%~40%,其中121 個顯著SNP 位點位于Dt 亞基因組,69 個顯著SNP 位點位于At 亞基因組。 在3 個及以上環(huán)境中出現的穩(wěn)定的SNP 位點有19 個,結合其染色體的LD 的衰減距離[13],得到9 個QTL 區(qū)間,分別位于A01、A06、D05、D08、D10、D11 和D13 等7 條染色體上 (表3), 其中4 個QTL 區(qū)間與前人定位的QTL 位置重疊,其它5 個QTL 區(qū)間未見報道。
表1 陸地棉群體纖維斷裂比強度表型統計
表2 五個環(huán)境群體纖維斷裂比強度的相關性分析
圖1 五個環(huán)境下群體纖維斷裂比強度的頻率分布直方圖
纖維斷裂比強度主要在纖維次生壁加厚期受纖維素合成的影響, 且海島棉海7124 和陸地棉TM-1 的纖維斷裂比強度存在顯著差異, 所以篩選在20~25 DPA纖維中優(yōu)勢表達, 且在海7124 和TM-1 間差異表達,基因功能注釋與纖維斷裂比強度相關的基因作為候選基因。 9 個穩(wěn)定QTL 區(qū)間包含1 177 個基因,結合海7124 和TM-1 轉錄組數據,鑒定到4 個與細胞壁形成或纖維素合成相關的基因(表4),推測這些基因可能影響纖維斷裂比強度。Gh_D13G2032編碼產物為果膠甲酯酶, 在海7124 開花后25 d 的纖維中表達量最高, 顯著高于其在TM-1 同時期纖維中的表達量。Gh_A01G1734在海7124 開花后20 d 的纖維中表達量最高,顯著高于其在TM-1 中的表達量。Gh_D10G0333編碼纖維素合酶,Gh_D11G1626屬于COBL基因家族,這2 個基因都是在20 DPA 的纖維中表達量最高,且在海7124 的表達量明顯高于TM-1(圖3)。
圖2 陸地棉纖維斷裂比強度全基因組關聯分析
表3 纖維斷裂比強度相關QTL 信息
表3 (續(xù))
表4 纖維斷裂比強度相關候選基因信息
圖3 海7124 和TM-1 纖維發(fā)育不同時期4 個候選基因的表達模式
棉花纖維品質主要看“長”、“強”、“細” ,其中“強”就是纖維斷裂比強度,對棉纖維的加工和產品的質量有直接的影響。 因此,棉花纖維斷裂比強度改良一直是棉花纖維品質遺傳改良的熱點。
本研究中用于全基因組關聯分析的83 份陸地棉材料,具有豐富的表型變異。 通過對5 個環(huán)境的纖維斷裂比強度表型數據及BLUP 值進行全基因組關聯分析,共得到了265 個顯著SNP 位點,非冗余的顯著位點190 個, 其中位于Dt 亞基因組上的SNP 位點是At 亞基因組的顯著SNP 位點的1.7倍。 前人研究表明Dt 亞基因組對纖維品質性狀的遺傳貢獻比At 亞基因組更大, 本研究結果與前人的研究結果一致[19]。 另外,19 個SNP 位點出現在3個及以上環(huán)境中, 合并為9 個QTL 區(qū)間, 其中qFS-A01-1包含Sun 等[21]檢測到的顯著SNP 位點,qFS-D05-1與qFS-D13-2均與Wang 等[22]檢測到的QTL 區(qū)間重疊,qFS-D10-1與Gu 等[23]檢測到的區(qū)間重疊。 此外,本研究還發(fā)現了5 個新的穩(wěn)定QTL區(qū)間,為棉花纖維斷裂比強度及分子標記輔助選擇育種提供參考。
在9 個QTL 區(qū)間內篩選了22 個在纖維發(fā)育次生壁加厚期優(yōu)勢表達、 且在海島棉與陸地棉之間差異表達的基因, 并鑒定到4 個可能影響纖維斷裂比強度的候選基因。 其中Gh_D13G2032的編碼產物為果膠甲酯酶, 催化細胞壁中果膠主鏈發(fā)生脫甲酯化反應, 對于調節(jié)植物中的細胞膨脹非常重要。 在前人研究中,海島棉纖維比陸地棉更細更長可能是受果膠甲酯酶含量差異的影響[24]。Gh_D11G1626作為COBL基因家族成員,編碼植物特異性糖基磷脂酰肌醇錨定蛋白, 該蛋白通過影響微纖絲在細胞壁的正確排列而參與植物纖維素的合成,在纖維發(fā)育過程中影響纖維素的沉淀,進而影響棉花纖維斷裂比強度[25]。Gh_A01G1734的同源基因AT5G06270顯著影響擬南芥的根毛數量, 且與擬南芥的表皮毛發(fā)育密切相關[26]。Gh_D10G0333的功能注釋為纖維素合酶GhCESA8, 在棉花纖維發(fā)育過程中纖維素的快速大量積累起到了增強作用[27]。
本研究對83 份棉花材料在5 個環(huán)境的纖維斷裂比強度及其BLUP 值進行全基因組關聯分析,共檢測到19 個與纖維斷裂比強度有關的穩(wěn)定的SNP位點,得到9 個QTL 區(qū)間,其中5 個是本研究新發(fā)現的。并鑒定到4 個與纖維斷裂比強度有關的候選基因,為進一步挖掘與棉花纖維斷裂比強度性狀相關的基因提供了理論依據。