沈樹豪 伍向陽
中通服節(jié)能技術(shù)服務(wù)有限公司
現(xiàn)有關(guān)于優(yōu)生區(qū)的劃分主要是針對(duì)種植規(guī)模和產(chǎn)量進(jìn)行研究的,劃分標(biāo)準(zhǔn)主要是氣象指標(biāo)。若想達(dá)到“提質(zhì)增效”的目標(biāo),優(yōu)生區(qū)劃分應(yīng)更多考慮對(duì)所在片區(qū)種植物品質(zhì)的需求。現(xiàn)有甜橘內(nèi)部品質(zhì)主要包括:果重、果形指數(shù)、出汁率、囊瓣數(shù)、化渣度、可溶性糖、可滴定酸、維生素C、可溶性固化物等。本項(xiàng)目擬綜合考慮甜橘的內(nèi)部品質(zhì)指標(biāo),對(duì)某地區(qū)多個(gè)采樣點(diǎn)所采集的某類甜橘品質(zhì)數(shù)據(jù)進(jìn)行主成分分析,提取品質(zhì)指標(biāo)中的主要成分,并據(jù)此設(shè)計(jì)某類甜橘的品質(zhì)綜合評(píng)價(jià)指標(biāo)。在此基礎(chǔ)上,本項(xiàng)目擬基于甜橘品質(zhì)綜合評(píng)價(jià)指標(biāo),結(jié)合地理信息系統(tǒng)(GIS)技術(shù)對(duì)該地種植區(qū)進(jìn)行優(yōu)生區(qū)劃分,從而優(yōu)化該類甜橘的種植布局。
項(xiàng)目擬收集某地區(qū)多個(gè)采樣點(diǎn)的成熟期甜橘作為研究對(duì)象。
1.2.1 品質(zhì)的測(cè)定
項(xiàng)目擬對(duì)甜橘的內(nèi)部品質(zhì)進(jìn)行檢測(cè)。甜橘內(nèi)部品質(zhì)包括:果重、果形指數(shù)、出汁率、囊瓣數(shù)、化渣度、可溶性糖、可滴定酸、維生素C、可溶性固化物。
1.2.2 甜橘樣本品質(zhì)主成分分析
項(xiàng)目擬在甜橘樣本品質(zhì)數(shù)據(jù)的基礎(chǔ)上,對(duì)其內(nèi)部品質(zhì)指標(biāo)進(jìn)行主成分分析,提取其中貢獻(xiàn)率較大的作為主要的品質(zhì)評(píng)價(jià)指標(biāo),并在此基礎(chǔ)上提出甜橘的品質(zhì)綜合評(píng)價(jià)指標(biāo)。
1.2.3 甜橘樣本品質(zhì)聚類分析
本文在進(jìn)行果品主成分分析后,選定對(duì)果品質(zhì)量有較大貢獻(xiàn)率的影響因子,將其所代表的特征向量進(jìn)行聚類處理,完成大影響因子的分類,從而進(jìn)行更好的分析。
利用主成分分析(PCA)算法,確定這一類甜橘的果實(shí)品質(zhì)評(píng)價(jià)的指標(biāo)類別個(gè)數(shù)。
影響甜橘的品質(zhì)指標(biāo)有很多,本文中甜橘品質(zhì)包括:果重、果形指數(shù)、出汁率、囊瓣數(shù)、化渣度、可溶性糖、可滴定酸、維生素C、可溶性固化物。但是很多指標(biāo)的貢獻(xiàn)率很小,造成數(shù)據(jù)冗余,通過少數(shù)幾個(gè)主成分來揭示多個(gè)變量間的內(nèi)部結(jié)構(gòu),即從原始變量中導(dǎo)出少數(shù)幾個(gè)主成分,使它們盡可能多地保留原始變量的信息,且彼此間互不相關(guān)。同時(shí),本項(xiàng)目將所測(cè)定的甜橘品質(zhì)數(shù)據(jù)進(jìn)行數(shù)據(jù)處理時(shí),將采用線性化方法代替?zhèn)鹘y(tǒng)主成分分析法的0均值化數(shù)據(jù)標(biāo)準(zhǔn),加強(qiáng)各項(xiàng)數(shù)據(jù)之間的線性化關(guān)聯(lián),還能包括原始數(shù)據(jù)的全部信息。在構(gòu)造品質(zhì)指標(biāo)相關(guān)矩陣時(shí),將進(jìn)一步對(duì)數(shù)據(jù)進(jìn)行降維變換,加強(qiáng)變量間的相關(guān)性表達(dá)。
聚類分析是將數(shù)據(jù)分類到不同的類或者簇這樣的一個(gè)過程,所以同一個(gè)簇中的對(duì)象有很大的相似性,而不同簇間的對(duì)象有很大的相異性??梢詫⒅鞒煞诌M(jìn)行聚類得分矩陣分析,得到對(duì)樣品的聚類分析結(jié)果,接著計(jì)算各類樣品中第一主成分得分的平均值以確定類間排序,然后根據(jù)類中樣品第一主成分的平均得分,確定每類中樣品的排序,最后得到綜合評(píng)價(jià)。
通過原始的主成分分析算法可得到圖1與表1,可以看出樣本9個(gè)主成分的貢獻(xiàn)率及累計(jì)貢獻(xiàn)率,圖1代表的是分析后的主成分二維模型,該模型雜亂無章,并不符合實(shí)際的分析需求(藍(lán)色部分代表降維后的樣本數(shù)據(jù),紅色代表數(shù)據(jù)的二維特征)。
圖1 原始主成分分析法二維結(jié)果圖
從表1可以看出,原始主成分算法所分析的9個(gè)主成分中,第一個(gè)主成分的貢獻(xiàn)率高達(dá)98.23%,另外8個(gè)主成分貢獻(xiàn)率統(tǒng)計(jì)只有1.77%。由此可見,9個(gè)主成分中,能夠反映果品優(yōu)良品質(zhì)的只需要第一個(gè)主成分,即單果重量,這不符合分析的需求,需要對(duì)該算法進(jìn)行優(yōu)化。
表1 原始PCA法貢獻(xiàn)率、累計(jì)貢獻(xiàn)率分析表
由圖1與表1可以得出,現(xiàn)有樣本的主成分之間存在相關(guān)性不夠強(qiáng)的情況。因此,本文將主成分分析法進(jìn)行了改進(jìn)與優(yōu)化,采用了線性化主成分分析法。利用“線性”方法,進(jìn)行樣本矩陣的對(duì)數(shù)變換與對(duì)數(shù)中心化變換,將樣本矩陣所代表的主成分?jǐn)?shù)據(jù)進(jìn)行降維分析。表2列出了本次計(jì)算后樣本的特征向量、貢獻(xiàn)率、累計(jì)貢獻(xiàn)率。通過觀察表2,可以看到,前五個(gè)主成分貢獻(xiàn)率增長(zhǎng)情況符合主成分分析法所期望的增長(zhǎng)預(yù)期。因此,決定甜橘優(yōu)良品質(zhì)的影響因子主要由前五個(gè)主成分決定,即:?jiǎn)喂|(zhì)量、果形指數(shù)、出汁率、囊瓣數(shù)、化渣度。其累計(jì)貢獻(xiàn)率為93.78%。其中,單果質(zhì)量決定第一主成分,果形指數(shù)決定第二主成分、出汁率決定第三主成分、囊瓣數(shù)決定第四主成分、化渣度決定第五主成分。
表2 線性化PCA法特征向量、貢獻(xiàn)率、累計(jì)貢獻(xiàn)率分析表
?
圖2代表的是線性化主成分分析法的二維結(jié)果圖,該圖清晰地反映了本次分析后的降維集散效果(藍(lán)色部分代表降維后的樣本數(shù)據(jù),紅色代表數(shù)據(jù)的二維特征)。
圖2 線性化主成分分析法二維結(jié)果圖
由于單純的主成分分析法并不能很好地消除智慧農(nóng)業(yè)中種植產(chǎn)物影響因子的數(shù)量,因此,本文將表2前5個(gè)主成分所代表的特征向量進(jìn)行了矩陣化后的聚類分析。
經(jīng)過聚類分析下的多次迭代,發(fā)現(xiàn)劃分為3個(gè)類別效果最好。通過迭代次數(shù)與迭代形成的新中心點(diǎn)可判斷,第一次迭代前五個(gè)主成分當(dāng)作1類尋找第一個(gè)中心點(diǎn),第二次迭代剔除了果形指數(shù)與出汁率,此時(shí)果形指數(shù)、出汁率為一類,留下單果質(zhì)量、化渣度、囊瓣數(shù)3個(gè)主成分為一類,開始進(jìn)行第三次迭代,從圖3、圖4、圖5可看出,第三次迭代后,將單果質(zhì)量分為一類,化渣度、囊瓣數(shù)分為一類。至此,該類甜橘樣本的9個(gè)決定果實(shí)優(yōu)質(zhì)品質(zhì)的決定因子,可簡(jiǎn)化為3個(gè)因子。分別為:?jiǎn)喂|(zhì)量為一類、果形指數(shù)與出汁率為一類、化渣度、可溶性糖為一類。此3類作為新的決定因子可最大程度決定甜橘的品質(zhì)。
圖3 聚類分析迭代結(jié)果圖
圖4 聚類分析二維結(jié)果圖
圖5 聚類分析三維結(jié)果圖
通過改良后的主成分分析算法結(jié)合聚類分析算法,可以得出針對(duì)于智慧農(nóng)業(yè)中所種植產(chǎn)物的影響因子的優(yōu)化與分類。但這只能解決部分智慧農(nóng)業(yè)中關(guān)于優(yōu)生區(qū)的劃分問題。因此仍需借助地理信息系統(tǒng)技術(shù)(GIS),利用其描繪出的地理模型圖與各項(xiàng)地理指標(biāo),與所種植產(chǎn)物經(jīng)過主成分分析算法結(jié)合聚類分析算法后的結(jié)果,再進(jìn)行二次結(jié)合,從而最終確定“何地種何物”,以達(dá)到“增產(chǎn)增質(zhì)”的最終目標(biāo)。
本文在當(dāng)代智慧農(nóng)業(yè)需求新型優(yōu)化種植區(qū)域方案的背景下,脫離原本智慧農(nóng)業(yè)基于氣象條件的優(yōu)生區(qū)規(guī)劃方案,從另一角度研究了地區(qū)內(nèi)可種植產(chǎn)物的主成分影響因子,并對(duì)其進(jìn)行了線性化主成分分析與聚類分析,最終獲得了影響種植產(chǎn)物的主要影響因素,從而確定了該類種植產(chǎn)物最應(yīng)注重的影響條件。最后結(jié)合地理信息系統(tǒng)(GIS)技術(shù),結(jié)合所計(jì)算出的影響矩陣,進(jìn)行二次分析,隨著時(shí)間的增長(zhǎng),儀器的測(cè)算精度將會(huì)不斷提高,最終可實(shí)現(xiàn)精準(zhǔn)定區(qū)定點(diǎn)下的智慧農(nóng)業(yè)優(yōu)生區(qū)劃分與各類種植產(chǎn)物的增產(chǎn)增質(zhì)。