陳 康 韓俊英
(甘肅農(nóng)業(yè)大學(xué)信息科學(xué)技術(shù)學(xué)院 甘肅蘭州 730070)
通信與信息技術(shù)地發(fā)展對(duì)各行各業(yè)都有巨大的影響,對(duì)現(xiàn)代農(nóng)業(yè)同樣具有深遠(yuǎn)的影響,難以量化是農(nóng)業(yè)信息化行業(yè)發(fā)展進(jìn)程一直面臨的難題,因此,深入研究并建立農(nóng)業(yè)信息化發(fā)展水平的評(píng)價(jià)方法與體系指標(biāo),有利于深入挖掘農(nóng)業(yè)發(fā)展?jié)撛谝?guī)律,深入理解跨越式發(fā)展思路,制定切實(shí)可行的發(fā)展戰(zhàn)略[1]。本研究是以陜西省農(nóng)業(yè)信息化水平為核心對(duì)象,運(yùn)用基于主成分分析法(PCA)對(duì)其農(nóng)業(yè)信息化程度進(jìn)行評(píng)價(jià)研究。PCA是統(tǒng)計(jì)機(jī)器學(xué)習(xí)中的一種重要方法,是通過(guò)篩選、簡(jiǎn)化特征指標(biāo)體系,降低數(shù)據(jù)維度以利于存儲(chǔ),并通過(guò)直觀觀察數(shù)據(jù)變化得出目標(biāo)結(jié)果影響程度的一種方法[2]。本研究最后將通過(guò)主成分分析得出結(jié)果,即主成分進(jìn)行可視化分析,直觀且有效地得出陜西省農(nóng)業(yè)信息化的發(fā)展趨勢(shì)。
分析總結(jié)農(nóng)業(yè)信息化水平評(píng)價(jià)研究指標(biāo)體系的建設(shè)應(yīng)遵循全面性、可操作性、導(dǎo)向性、科學(xué)性、實(shí)用性原則 。農(nóng)業(yè)信息化的研究是一項(xiàng)惠民政策,指標(biāo)的選擇應(yīng)方便各級(jí)執(zhí)行部門執(zhí)行[3]。
農(nóng)業(yè)信息化水平指標(biāo)的篩選過(guò)程主要由3個(gè)因素構(gòu)成:①指標(biāo)海選:該篩選過(guò)程主要是結(jié)合信息化水平的導(dǎo)向性、科學(xué)性、典型性以及可操作性等評(píng)判標(biāo)準(zhǔn)進(jìn)行指標(biāo)海選,最終給出農(nóng)業(yè)信息化水平評(píng)價(jià)體系的參考范圍[4];②指標(biāo)初選,考慮指數(shù)較多,使用不夠方便,在海選得到的42個(gè)指標(biāo)的基礎(chǔ)上進(jìn)行初篩;③指標(biāo)定量篩選,主要是構(gòu)建關(guān)系矩陣與入選標(biāo)準(zhǔn)度矩陣,實(shí)現(xiàn)篩選模型的目標(biāo)函數(shù)。農(nóng)業(yè)信息化水平評(píng)價(jià)體系可被劃分為農(nóng)業(yè)信息化的基礎(chǔ)、農(nóng)業(yè)信息化的應(yīng)用以及農(nóng)業(yè)信息化的效益等3個(gè)層次,在此將其設(shè)置為一級(jí)指標(biāo),按每一層的任務(wù)分也可分為目標(biāo)層、準(zhǔn)備層以及方案層等,層次劃分即各層要素見圖1。
根據(jù)上述引用的農(nóng)業(yè)信息化水平評(píng)價(jià)體系,收集了2013~2017年的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行整理,以此為基礎(chǔ)分析農(nóng)業(yè)信息化水平中的11個(gè)具體指標(biāo),見表1。
2.1.1 主成分分析法原理
主成分分析(Principal Component Analysis),是應(yīng)用非常廣泛的降維方法之一。其數(shù)學(xué)模型為:
式(1) 中:a1i,a2i, … ,ani(i= 1,2,… ,m)為X的協(xié)方差陣∑的相應(yīng)特征值對(duì)應(yīng)的特征向量,對(duì)實(shí)際變量進(jìn)行標(biāo)準(zhǔn)化處理進(jìn)而計(jì)算得出ZX1,ZX2,…ZXP,本操作的主要目的是為了消除各個(gè)指標(biāo)在實(shí)際應(yīng)用中的指標(biāo)的量綱問(wèn)題。
表1 2013~2017年陜西省農(nóng)業(yè)信息化水平評(píng)價(jià)指標(biāo)原始數(shù)據(jù)
2.1.2 原始數(shù)據(jù)及對(duì)其標(biāo)準(zhǔn)化
數(shù)據(jù)標(biāo)準(zhǔn)化是研究農(nóng)業(yè)信息化程度的重要步驟。對(duì)實(shí)際收集到的原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化分析,對(duì)整個(gè)數(shù)據(jù)分析至關(guān)重要。本研究以陜西省2013~2017年農(nóng)業(yè)信息化水平為研究對(duì)象,分析采集得到的農(nóng)業(yè)信息化的各項(xiàng)基礎(chǔ)數(shù)據(jù),對(duì)農(nóng)業(yè)信息化水平進(jìn)行評(píng)價(jià)可視化分析。
上述矩陣為按照年份劃分的樣本,對(duì)于上述數(shù)據(jù)的要求是行數(shù)為觀測(cè)樣本,列數(shù)為需要計(jì)算的不同的主成分。對(duì)上述歸一化的數(shù)據(jù)計(jì)算其主成分中的coefficient的值,見表3。
對(duì)上述數(shù)據(jù)進(jìn)行矩陣表示,對(duì)其進(jìn)行PCA分析,得到4組評(píng)價(jià)數(shù)據(jù),見表4。從計(jì)算得出的特征值與貢獻(xiàn)率可知,前4個(gè)特征值涵蓋了所有信息,數(shù)據(jù)標(biāo)準(zhǔn)化:
表2 陜西省農(nóng)業(yè)信息現(xiàn)代化指標(biāo)歸一化數(shù)據(jù)(無(wú)量綱)
表3 各樣本的coefficient為11個(gè)主成分的矩陣系數(shù)
各項(xiàng)指標(biāo)數(shù)據(jù)標(biāo)準(zhǔn)化后不僅消除了各成分所帶單位量綱的影響,而且更有利于數(shù)據(jù)的后續(xù)處理。利用歸一化后的標(biāo)準(zhǔn)數(shù)據(jù)構(gòu)成的矩陣計(jì)算特征值及其所對(duì)應(yīng)的特征向量,得到各主成分所對(duì)應(yīng)得分,再結(jié)合各個(gè)主成分對(duì)應(yīng)的貢獻(xiàn)率情況,得出由第一主成分以及第二主成分構(gòu)成的表達(dá)式,考慮到這2個(gè)主成分已經(jīng)可以涵蓋農(nóng)業(yè)現(xiàn)代水平評(píng)估效果的96%以上的信息,用第一主成分與第二主成分評(píng)價(jià)農(nóng)業(yè)現(xiàn)代化水平的情況,主成分表達(dá)式見式(3)。
經(jīng)計(jì)算第一、二主成分的貢獻(xiàn)率之和為96.6%,已經(jīng)超過(guò)95%,因此,利用第一、二主成分表示綜合數(shù)據(jù)模型。用2個(gè)主成分的特征值計(jì)算得到貢獻(xiàn)率的權(quán)重表示綜合評(píng)估模型的系數(shù),表示為式(4)。
依據(jù)前2個(gè)主成分得分得出其實(shí)際意義,可知各個(gè)年份的農(nóng)業(yè)信息化水平受第一主成分與第二主成分的影響不同。
由上文可知主要影響農(nóng)業(yè)現(xiàn)代化的成分是y1與y2,更直觀的分析出農(nóng)業(yè)信息化影響的因素,主要影響農(nóng)業(yè)信息化的因素見表5。
表5 簡(jiǎn)化后數(shù)據(jù)
由上述2個(gè)主成分可以得出農(nóng)業(yè)信息化的程度呈上升趨勢(shì),其中虛線部分是第一主成分和第二主成分共同作用線的農(nóng)業(yè)信息化變化趨勢(shì),因此,更直觀的得出陜西省農(nóng)業(yè)信息化的變化情況,將農(nóng)業(yè)信息化發(fā)展程度更進(jìn)一步的可視化,更體現(xiàn)出了本研究的重要性,直觀的表示了農(nóng)業(yè)信息化的發(fā)展情況,見圖2。
本成果是在以往學(xué)者的研究基礎(chǔ)上,結(jié)合實(shí)際問(wèn)題,深入分析了具體省份的農(nóng)業(yè)現(xiàn)代化實(shí)際發(fā)展?fàn)顩r,以全面的角度、可操控與科學(xué)性的前提、實(shí)用性的宗旨為原則,搭建了可以衡量陜西省農(nóng)業(yè)信息現(xiàn)代化的發(fā)展水平指標(biāo)體系。