焦 揚,葛慧玲
(東北農(nóng)業(yè)大學(xué)理學(xué)院,哈爾濱 150030)
我國是李屬植物重要的起源中心,目前南北各省區(qū)均有種植。但目前我國李生產(chǎn)中存在的主要問題是栽植零星,長期沿用實生和分株繁殖,品種較為落后,忽視了地方良種的發(fā)掘、選育推廣與品種更新。為改變現(xiàn)狀,近些年我國從國外引進(jìn)了歐亞系和北美系李子品種,在推廣國外品種的同時,我國又開發(fā)了國內(nèi)的優(yōu)秀李種,如今在黑龍江省范圍內(nèi)主要種植的李種就有三十余種。為了更好的推進(jìn)優(yōu)秀李種的研究,對李雜交品種的譜系進(jìn)行分類是十分必要的。一個雜交產(chǎn)生的新品種,其表現(xiàn)特征是更接近于父本還是母本,這一點,我們可以通過其花粉的特征進(jìn)行判別[1-3]。
傳統(tǒng)的分析方法多為定性分析,對于李品種大量的觀測指標(biāo),要對其實現(xiàn)具體的定量分類是十分困難的,而聚類分析則可以解決這一問題[4-5]。首先通過因子分析來計算各指標(biāo)之間的相關(guān)系數(shù),從而選擇代表性較強(qiáng)的觀測指標(biāo)作為聚類依據(jù)[6],通過特定的算法來計算各因素間的距離,再選擇特定的類的計算方法來計算因素與類、類與類之間的距離,從而將距離最接近的因素歸為一類。使用聚類分析方法,可以簡單的處理大量冗長的數(shù)據(jù),實現(xiàn)精度較高的定量分析[7-9],并且可以明觀察到不同李品種之間的相似程度,對于李品種的譜系研究具有一定的幫助。
本次聚類分析選取的李花粉品種共有31種,均為黑龍江地區(qū)主要栽培的品種,見表1。
根據(jù)李花粉的主要紋飾特征[10],確定主要測量指標(biāo)可分為以下幾類,見表2。
表1 聚類分析選取的李品種Table1 Plum breeds be used
表2 李花粉主要測量指標(biāo)Table2 main physics elements of plum pollen
其中花粉無條脊的品種,其條脊寬賦值為0,花粉無穿孔的品種,其穿孔徑和穿孔頻率賦值為0。
以上31個品種,16項觀測指標(biāo)構(gòu)成的矩陣記為A,其中包含的元素為aij,i=1,2,…,31,j=1,2,…,16。由于矩陣的行、列數(shù)都比較多,為了簡化數(shù)據(jù),降低矩陣的維數(shù),應(yīng)對數(shù)據(jù)進(jìn)行必要的篩選。矩陣的行代表不同的品種,不能夠化簡,數(shù)據(jù)的列代表測量指標(biāo),希望能夠用較少的指標(biāo)盡可能多的包含原始信息,而把代表性不強(qiáng)的指標(biāo)剔除掉,這樣就可以減少矩陣的列數(shù),達(dá)到簡化數(shù)據(jù)的目的。
為了降低觀測樣本的維數(shù),對以上主要觀測指標(biāo)進(jìn)行篩選,采用因子分析法對數(shù)據(jù)進(jìn)行因子分析。首先建立李花粉相似系數(shù)陣Q=(qij):
然后求矩陣Q的特征根λj及單位特征向量uj
采用SPSS軟件(13.0版本,下同)計算所得結(jié)果如表3。由方差貢獻(xiàn)率可知,前5個主成分的方差累計貢獻(xiàn)率已經(jīng)達(dá)到了90.54%,可以認(rèn)為其信息量足以代表原矩陣的信息。對因子載荷陣進(jìn)行方差最大旋轉(zhuǎn),我們得到了下面的正交因子見表4。
由表4可知,第一主成分在花粉赤道軸與極赤比指標(biāo)上有較大載荷,它反映了花粉赤道軸的數(shù)據(jù)特征及極赤比;第二主成分在花粉穿孔頻率指標(biāo)上有較大載荷,它反映了單位面積內(nèi)花粉穿孔數(shù)量的指標(biāo);第三主成分在花粉條脊寬指標(biāo)上有較大載荷,它反映了花粉條脊的寬度;第四主成分在花粉極軸指標(biāo)上有較大載荷,它反映了花粉極軸的數(shù)值;第五主成分在花粉穿孔徑指標(biāo)上有較大載荷,它反映了花粉穿孔的大小。
表3 李花粉紋飾觀測指標(biāo)因子分析Table3 Factor analysis of plum pollen
表4 方差最大旋轉(zhuǎn)后的正交因子Table4 Orthogonal factorization
基于以上的因子分析結(jié)果,與實際情況相結(jié)合,我們選擇極軸平均值X1、赤道軸平均值X4、極赤比X7、條脊寬平均值X8、穿孔徑平均值X11和穿孔頻率平均值X14,一共六個指標(biāo)作為聚類分析的主要指標(biāo)。
以指標(biāo) X1、X4、X7、X8、X11、X14為基礎(chǔ),對 31個李品種進(jìn)行聚類分析,樣本距離的計算采用Minkowski距離法[11],設(shè)樣本之間的距離為dij(q),得到:
聚類方法采用Ward法[12],考慮樣本間的離差平方和最小。設(shè)將31個樣品分為類,記為G1,G2,…,Gk,用 Yi(t)表示 Gi中第 i個樣品,Nt表示 Gt中的樣品個數(shù),Y(t)為Gt重心,則Gt中樣品的離差平方和為:
k個類的類內(nèi)離差平方和為:
以上式計算得到的聚類結(jié)果如下,當(dāng)選擇綜合聚類距離尺度為10時,31個品種整體上看可分為四類:
第一類:吉林黃干核、延吉李、大紫李、海林大紫李、小九三杏梅、長李15號、綏李三號、牡豐李、九臺晚李、長李84號、長李17號、龍園蜜李、躍進(jìn)李、綏棱杏梅;
第二類:龍園秋李、矮甜李;
第三類:密山大紫李、綏陵18號、黃干核矮生、綏陵小黃李、巴彥大紅袍、黃干核實生、離核小黃李、烏蘇里李、牡紅甜李、綏陵紅、吉紅、大九三杏梅、綏陵大黃李、呼蘭大紅杏;
第四類:牛心李。
具體分類結(jié)果見圖1。以上的分類只是以數(shù)據(jù)為基礎(chǔ)的討論,并不一定與真實的李品種之間的親本關(guān)系完全符合。此外,聚類分析的方法多樣,其聚類結(jié)果受方法的影響較大,選擇Minkowski距離法和Ward聚類法是在進(jìn)行大量聚類分析后選擇聚類結(jié)果與實際情況最為接近的一組。觀察以上的聚類結(jié)果,對于一些主要的李品種的親本關(guān)系可以進(jìn)行初步的判定。
觀察以上的聚類結(jié)果不難發(fā)現(xiàn),聚類結(jié)果中的第四類只有牛心李一個品種,牛心李是美洲李品種,從國外引進(jìn),果實呈卵圓形,其花粉與其他李品種的花粉相比,極軸與赤道軸都比較小,花粉表面無穿孔,可以從花粉的性狀上判別出該品種的特殊性,聚類分析將其單獨劃分為一類。
對于聚類分析結(jié)果中第二類,包含龍園秋李和矮甜李兩個品種。其中龍園秋李的親本為九三杏梅和臺灣李,矮甜李的親本為吉林六號和臺灣李,其中都包含臺灣李,這兩個品種被分為一類,說明這兩個品種在性狀上更接近于親本中的臺灣李。而同樣與臺灣李有親本關(guān)系的龍園蜜李被歸為第一類,則說明該品種在性狀上并不接近臺灣李。
對于其他的一些品種,牡紅甜李與巴彥大紅袍存在親本關(guān)系,被歸為第三類,同樣與巴彥大紅袍存在親本關(guān)系的牡豐李沒有與巴彥大紅袍歸為一類,說明其性狀更接近于另一親本七月紅李。牡紅甜李與牡豐李的親本同樣為巴彥大紅袍與七月紅李,但是聚類結(jié)果完全不同,說明這兩個品種是具有相同親本但性狀表現(xiàn)完全不同的。同樣,長李15號與綏李有親本關(guān)系,被歸為第一類。
如果只是單純的觀察各李品種之間的距離,可以對其品種的相似性有一個基本的判斷,比如,長李系列品種的15號、17號和84號,距離比較接近,同時被歸為第一類,說明以上三個品種的性狀是最為接近的;而黃干核矮生和黃干核實生,其距離則較遠(yuǎn),說明這兩種李品種的性狀差異較大。
根據(jù)聚類結(jié)果可以發(fā)現(xiàn),聚類分析對于具有親本關(guān)系的李品種的劃分基本是正確的,其聚類結(jié)果可以認(rèn)為是有效的。與其他研究者的研究結(jié)果類比,發(fā)現(xiàn)其結(jié)論基本一致[13-15]。對于某一品種其性狀是更接近于父本還是更接近于母本,可以從聚類結(jié)果得到基本的判斷。如果要進(jìn)行更進(jìn)一步的聚類,可以對每一小類進(jìn)行單獨的、進(jìn)一步的聚類,以得到更為精確的結(jié)論。對于新產(chǎn)生的李品種,同樣可以在原有聚類結(jié)果的基礎(chǔ)上進(jìn)一步結(jié)合判別分析法進(jìn)行類別的判定。
圖1 聚類分析結(jié)果Fig.1 Results of cluster analysis
本次分析采用了李花粉的有關(guān)數(shù)據(jù)作為聚類分析的標(biāo)準(zhǔn),同時也可以采用李品種果實的數(shù)據(jù)進(jìn)行聚類,例如果型、果重、香味、口感、可溶性固形物含量、總糖、總酸等指標(biāo),但是果實數(shù)據(jù)的各項指標(biāo)大部分屬于低級別變量,即無序變量,無序變量對聚類結(jié)果的干擾較大,如何將其轉(zhuǎn)化為有序變量,實現(xiàn)聚類還有待進(jìn)一步的研究。
[1]張樹軍,黃紹西,張紹鈴,等.李等15個李品種S基因型鑒定及其多態(tài)性分析[J].果樹學(xué)報,2008,25(3):338-342.
[2]梁宏偉,陳發(fā)菊,何正權(quán),等.十二個李品種的花粉形態(tài)的研究[J].北方園藝,2008(12):5-8.
[3]仲崇海.黑龍江省李、杏的生產(chǎn)現(xiàn)狀和發(fā)展趨勢[J].中國林副特產(chǎn),2006,82(3):74-75.
[4]胡國富,詹云,李成雁,等.寒地油豆角花粉電鏡觀察與聚類分析[J].東北農(nóng)業(yè)大學(xué)學(xué)報,2010,41(7):79-83.
[5]張淑珍,徐鵬飛,靳立梅,等.野生大豆對大豆疫霉根腐病抗感反應(yīng)及聚類分析[J].東北農(nóng)業(yè)大學(xué)學(xué)報,2009,40(11):1-6.
[6]殷瑞飛,朱建平.數(shù)據(jù)挖掘中一種新的聚類方法-基于對應(yīng)分析與因子旋轉(zhuǎn)[J].統(tǒng)計研究,2008,25(1):93-97.
[7]李淑華,邢紹凌,楊丹萍,等.聚類分析法在玉米種質(zhì)資源中的應(yīng)用[J].農(nóng)業(yè)與技術(shù),2008,28(5):43-45.
[8]胡興雨,陸平,賀建波,等.黍稷農(nóng)藝性狀的主成分分析與聚類分析[J].植物遺傳學(xué)報,2008,9(4):492-496.
[9]夏富才,張春雨,趙秀海,等.早春草本植物群落結(jié)構(gòu)及其聚類分析[J].東北師大學(xué)報:自然科學(xué)版,2008,40(4):109-114.
[10]劉海榮.黑龍江省抗寒李資源性狀描述及評價[J].黑龍江農(nóng)業(yè)科學(xué),2005(6):28-31.
[11]楊志奇,楊春剛,湯翠鳳,等.中國粳稻地方品種孕穗期耐冷性評價及聚類分析[J].植物遺傳資源學(xué)報,2008,9(4):485-491.
[12]孫海燕,王國強(qiáng),蔡一林,等.西南地區(qū)常用玉米自交系的配合力及聚類分析[J].玉米科學(xué),2008,16(1):29-32.
[13]劉威生.李種質(zhì)資源遺傳多樣性及主要種間親緣關(guān)系的研究[D].北京:中國農(nóng)業(yè)大學(xué),2005:34-36.
[14]馮晨靜.李種質(zhì)資源RAPD、SSR、ISSR親緣關(guān)系鑒定及遺傳多樣性研究[D].保定:河北農(nóng)業(yè)大學(xué),2005:31-32.
[15]楊紅華.李、杏屬間遠(yuǎn)緣雜交及種質(zhì)創(chuàng)新的研究[D].泰安:山東農(nóng)業(yè)大學(xué),2004:66-67.