鄭沫利 趙艷軻 陳思露 陳祺東 孫俊
摘要:為使減少糧食儲(chǔ)藏環(huán)節(jié)的損耗,調(diào)查儲(chǔ)藏環(huán)節(jié)中糧食作物的損失情況并進(jìn)行評(píng)估預(yù)測(cè)。通過(guò)分析問(wèn)卷,統(tǒng)計(jì)描述影響損失率的各個(gè)因素,應(yīng)用隨機(jī)漂移粒子群優(yōu)化算法(random drift particle swarm optimization,RDPSO)和徑向基函數(shù)(radial basis function,RBF)網(wǎng)絡(luò)對(duì)儲(chǔ)藏環(huán)節(jié)損耗進(jìn)行評(píng)估預(yù)測(cè),將調(diào)查問(wèn)卷獲得的數(shù)據(jù)作為RBF模型數(shù)據(jù)集,應(yīng)用RDPSO算法進(jìn)行模型的參數(shù)訓(xùn)練,從而獲得糧食損耗的智能評(píng)估模型。采用稻谷數(shù)據(jù)作為各模型的數(shù)據(jù)集,通過(guò)仿真試驗(yàn),對(duì)比數(shù)據(jù)擬合情況和均方誤差,其RDPSO-RBF模型學(xué)習(xí)性能和泛化性能更強(qiáng)。因此,RDPSO-RBF能更好地應(yīng)用于實(shí)際的糧食管理中。
關(guān)鍵詞:產(chǎn)后糧食;統(tǒng)計(jì)描述分析;RDPSO-RBF模型;儲(chǔ)藏?fù)p耗;評(píng)估
中圖分類(lèi)號(hào): F326.11文獻(xiàn)標(biāo)志碼: A
文章編號(hào):1002-1302(2020)08-0307-05
收稿日期:2019-03-05
基金項(xiàng)目:國(guó)家公益性行業(yè)(糧食)科研專(zhuān)項(xiàng)(編號(hào):201513004、201513004-6)。
作者簡(jiǎn)介:鄭沫利(1967—),男,廣東陸豐人,教授級(jí)高級(jí)工程師,主要從事糧食經(jīng)濟(jì)學(xué)研究,E-mail:zhengmoli@sohu.com。共同第一作者:趙艷軻(1987—),女,河南洛陽(yáng)人,博士研究生,中級(jí)工程師,主要從事糧食經(jīng)濟(jì)學(xué)研究,E-mail:zhao_yanke@126.com。
通信作者:孫?俊,博士,教授,主要從事人工智能、機(jī)器學(xué)習(xí)、計(jì)算智能和高性能計(jì)算研究。E-mail:sunjin_wx@hotmial.com。
糧食是人類(lèi)最基本的生存物資,是人類(lèi)生活的第一要求,在國(guó)民經(jīng)濟(jì)中占有重要地位。長(zhǎng)期以來(lái),我國(guó)在保障糧食安全問(wèn)題上一直較注重產(chǎn)前與產(chǎn)中的管理與投入。然而在糧食產(chǎn)后損失的關(guān)注嚴(yán)重不足,產(chǎn)后大概分為收獲、運(yùn)輸、干燥、儲(chǔ)藏、加工、銷(xiāo)售和消費(fèi)等環(huán)節(jié)[1]。而每年糧食的產(chǎn)后損失情況極其嚴(yán)重,儲(chǔ)藏環(huán)節(jié)糧食損失在產(chǎn)后總損失中所占比例較高。若在此環(huán)節(jié)能采取有力的防護(hù)措施,將可有效控制產(chǎn)后儲(chǔ)藏環(huán)節(jié)中糧食的損耗。目前,已有不少的學(xué)者對(duì)糧食產(chǎn)后損失展開(kāi)廣泛的研究。在產(chǎn)后糧食損失方面,主要在儲(chǔ)糧的損耗分析和減損措施。如儲(chǔ)糧技術(shù)和儲(chǔ)糧安全,主要是研究不同因素對(duì)儲(chǔ)糧損耗的影響,進(jìn)而采取相關(guān)技術(shù)減損,保證儲(chǔ)糧的質(zhì)量與數(shù)量[2-3]。在儲(chǔ)糧模型構(gòu)造方面,主要是依據(jù)機(jī)器學(xué)習(xí)或優(yōu)化算法對(duì)儲(chǔ)糧害蟲(chóng)進(jìn)行研究[4-6]。鮮有對(duì)糧食產(chǎn)后儲(chǔ)藏環(huán)節(jié)的損失率預(yù)測(cè)的分析研究。
鑒于此,本研究調(diào)查了稻谷、大米、小麥、玉米、大豆5大糧食作物,通過(guò)問(wèn)卷的形式記錄了10個(gè)省份的產(chǎn)后糧食損失率和損失因素。為了解損失因素和其損失率的關(guān)系,將問(wèn)卷進(jìn)行變量處理和統(tǒng)計(jì)分析,并將各品種糧食作物生成變量相同的數(shù)據(jù)集。然后采用人工智能的方法,研究損失數(shù)據(jù)的因素對(duì)在儲(chǔ)藏環(huán)節(jié)產(chǎn)后糧食損失率的影響,提出了基于RDPSO(random drift particle swarm optimization)-RBF(radial basis function)損失預(yù)測(cè)模型。RBF神經(jīng)網(wǎng)絡(luò)能很好地逼近非線(xiàn)性數(shù)據(jù),真實(shí)地反映輸入、輸出變量間的內(nèi)在聯(lián)系,在眾多神經(jīng)網(wǎng)絡(luò)中RBF逼近能力比較突出。但直接采用RBF作為損失率預(yù)測(cè)模型,其初始隨機(jī)參數(shù)很難確定最優(yōu)值,導(dǎo)致預(yù)測(cè)結(jié)果隨機(jī)化。而RDPSO是一種全局優(yōu)化算法,在搜索能力、收斂速度以及高維問(wèn)題上表現(xiàn)突出。因此,用RDPSO優(yōu)化RBF網(wǎng)絡(luò)中參數(shù),以之克服RBF網(wǎng)絡(luò)預(yù)測(cè)結(jié)果的隨機(jī)性,可使預(yù)測(cè)值更接近實(shí)際值。在實(shí)際儲(chǔ)糧中,可以根據(jù)該預(yù)測(cè)值,判斷是否需要采取措施來(lái)改善某些因素的影響,以達(dá)到減少糧食損耗的目的。
1?產(chǎn)后糧食儲(chǔ)藏環(huán)節(jié)調(diào)查研究
1.1?產(chǎn)后糧食儲(chǔ)藏環(huán)節(jié)損失率調(diào)查概況
以?xún)?chǔ)藏環(huán)節(jié)的產(chǎn)后糧食作物稻谷、大米、小麥、玉米、大豆這5類(lèi)品種作為調(diào)查主體。本研究根據(jù)全國(guó)糧食種植分布數(shù)據(jù),抽取了青海、湖南、重慶、江西、福建、江蘇、安徽、黑龍江、貴州、遼寧10個(gè)省份的數(shù)據(jù),分別對(duì)這5類(lèi)作物產(chǎn)后糧食的損失率情況進(jìn)行專(zhuān)項(xiàng)調(diào)研。此外,在每個(gè)地區(qū)的抽樣中選出幾個(gè)市(區(qū)),對(duì)該抽樣出的市(區(qū))儲(chǔ)糧企業(yè)單位進(jìn)行訪(fǎng)問(wèn)。為了使問(wèn)卷真實(shí)、有效,通過(guò)與該企業(yè)代表人“一對(duì)一”訪(fǎng)談并當(dāng)場(chǎng)答卷的方式進(jìn)行調(diào)查,并由調(diào)查人員填寫(xiě)問(wèn)卷。最后,調(diào)查得到有效的關(guān)于產(chǎn)后糧食在儲(chǔ)藏環(huán)節(jié)損失率的問(wèn)卷324份。其中,調(diào)查稻谷的樣本問(wèn)卷占總問(wèn)卷的36.7%,其次是玉米、小麥分別占29.3%、27.2%,最后大豆和大米占 4.3% 和2.5%。因此,本研究選擇稻谷作為代表糧食,分析影響其損失率的特征變量。
1.2?糧食產(chǎn)后儲(chǔ)藏環(huán)節(jié)特征描述
在此次問(wèn)卷中,該產(chǎn)后糧食損失率是對(duì)產(chǎn)后糧食總損失率的描述,即為產(chǎn)后糧食在儲(chǔ)藏環(huán)節(jié)中的進(jìn)倉(cāng)損失率、出倉(cāng)損失率、蟲(chóng)害損失率、鼠害損失率、霉變損失率、其他損失率的總和。而影響這些損失率的因素包含了受訪(fǎng)者、受訪(fǎng)企業(yè)的信息,產(chǎn)后糧食儲(chǔ)藏的情況(年份、儲(chǔ)藏品種、儲(chǔ)藏時(shí)間、倉(cāng)型、儲(chǔ)藏量、儲(chǔ)藏形式)、進(jìn)倉(cāng)損失信息(進(jìn)倉(cāng)工藝、進(jìn)倉(cāng)總量)、出倉(cāng)損失(出倉(cāng)工藝、出倉(cāng)總量)等。從表1可以看出,糧食產(chǎn)后的儲(chǔ)藏條件并不是很理想,其中儲(chǔ)糧生態(tài)區(qū)域有60.7%為中溫高濕儲(chǔ)糧區(qū);儲(chǔ)糧技術(shù)有59.4%是尚未應(yīng)用“四合一”技術(shù)的常規(guī)儲(chǔ)藏;儲(chǔ)藏形式采用散裝的占95.0%。同時(shí),除了儲(chǔ)藏倉(cāng)型(使用平方倉(cāng)的比例為90.9%),其他特征所占比例分布相對(duì)較均勻。
2?RDPSO-RBF模型
2.1?RBF神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介
RBF神經(jīng)網(wǎng)絡(luò)是一種前饋神經(jīng)網(wǎng)絡(luò)[7]。一般最基本的RBF神經(jīng)網(wǎng)絡(luò)由輸入層、隱含層、輸出層構(gòu)成3層網(wǎng)絡(luò)結(jié)構(gòu),其公式如下:
Y=f(x)=∑Kk=1αkφk(x)。(1)
式中:αk是第k個(gè)隱含層節(jié)點(diǎn)到輸出層的連接權(quán)值,φk(x)是第k個(gè)隱含層結(jié)點(diǎn)的輸出值,其定義如下:
φk(x)=exp-‖x-μk‖2σ2k。(2)
式中:μk和σ2k分別代表了第k個(gè)隱含層結(jié)點(diǎn)的中心向量和擴(kuò)展常數(shù)。
2.2?RDPSO算法簡(jiǎn)介
隨機(jī)漂移粒子群(RDPSO)算法是基于PSO對(duì)于受到自由電子運(yùn)動(dòng)軌跡分析的啟發(fā)而提出的[8-9]。當(dāng)金屬導(dǎo)體在外電場(chǎng)時(shí),其導(dǎo)體內(nèi)的自由電子會(huì)發(fā)生定向漂移,同時(shí)還存在無(wú)規(guī)則的隨機(jī)熱運(yùn)動(dòng),這2種運(yùn)動(dòng)的結(jié)合可以使整體的勢(shì)能逐漸變小。因此,電子的運(yùn)動(dòng)過(guò)程類(lèi)似于優(yōu)化問(wèn)題中的求解最優(yōu)解使得目標(biāo)函數(shù)值最小化。在RDPSO算法中,第t+1次的第i個(gè)粒子在j維的定向速度和隨機(jī)熱運(yùn)動(dòng)速度分別為Vdt+1i,j、Vrt+1i,j,因此第t+1次粒子速度為:
Vt+1i,j=Vdt+1i,j+Vrt+1i,j。(3)
根據(jù)PSO算法中粒子趨向局部位置的學(xué)習(xí)機(jī)理,定向漂移速度Vdt+1i,j的定義如下:
Vdt+1i,j=c1·rti,j·(Pti,j-Xti,j)+c2·Rti,j·(Gtj-Xti,j)。(4)
式中:c1和c2為常數(shù);rti,j和Rti,j是在(0,1)區(qū)間內(nèi)均勻分布的隨機(jī)數(shù),Pti,j是個(gè)體粒子最優(yōu)值,Gtj是其所有粒子中最優(yōu)值。而式(4)可以等價(jià)為
Vdti,j=β·(pti,j-Xti,j);(5)
β=c1·rti,j+c2·Rti,j;(6)
pti,j=c1·rti,j·Pti,j+c2·Rti,j·Gtjc1·rti,j+c2·Rti,j。(7)
式中:β為漂移系數(shù);pti,j為吸引子。
假設(shè)RDPSO中的粒子的無(wú)規(guī)則隨機(jī)熱運(yùn)動(dòng)速度Vrt+1i,j服從雙指數(shù)分布,通過(guò)蒙特卡洛法得到其表達(dá)式如下:
Vrt+1i,j=δti,j·φti,j。(8)
式中:φti,j為高斯分布函數(shù);δti,j是高斯分布的標(biāo)準(zhǔn)差,定義為
δti,j=α·|Mti,j-Xti,j|。(9)
α為熱敏系數(shù);Mti,j為當(dāng)前種群中所有粒子個(gè)體的歷史最優(yōu)位置平均值,即
Mti,j=1N∑Ni=1Pti,j。(10)
因此,式(8)可以改寫(xiě)為:
Vrt+1=α·|Mti,j-Xti,j|·φti,j。(11)
綜上,RDPSO算法中粒子速度和位置的更新公式為:
Vti,j=β·(pti,j-Xti,j)+α|Mti,j|-Xti,j·φti,j;(12)
Xti,j=Xti,j+Vt+1i,j。(13)
2.3?RDPSO-RBF模型
2.3.1?RBF神經(jīng)網(wǎng)絡(luò)模型確定
通過(guò)調(diào)查得到的問(wèn)卷,在SPSS中進(jìn)行分析。樣本在變量處理后得到51個(gè)特征變量。由于某些糧食品種樣本數(shù)量相對(duì)較少,特征數(shù)量過(guò)多,在試驗(yàn)中其誤差結(jié)果并不理想。通過(guò)相關(guān)性分析,得到其中8個(gè)相關(guān)性最高的變量,作為實(shí)驗(yàn)室數(shù)據(jù)樣本輸入變量,而產(chǎn)后總損失率作為樣本輸出。因此,RBF神經(jīng)網(wǎng)絡(luò)的輸入層結(jié)點(diǎn)個(gè)數(shù)為8,輸出結(jié)點(diǎn)1個(gè)。隱含層通過(guò)利用對(duì)手受罰的競(jìng)爭(zhēng)學(xué)習(xí)算法確定為8。綜上所述,該RBF神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)為8-8-1。
2.3.2?RDPSO算法目標(biāo)函數(shù)
采用均方誤差作為RDPSO算法的目標(biāo)函數(shù),評(píng)價(jià)粒子群中所有個(gè)體,從中尋找最佳個(gè)體來(lái)判斷是否更新粒子的Pti和Gt。
2.3.3?RDPSO-RBF算法步驟
步驟1:通過(guò)上述描述的思想,構(gòu)建RBF網(wǎng)絡(luò),同時(shí)給定輸入與輸出樣本集。
步驟2:將RBF神經(jīng)網(wǎng)絡(luò)中的隱含層中心、擴(kuò)展系數(shù)和權(quán)值編碼成實(shí)數(shù)串代表粒子個(gè)體,同時(shí)隨機(jī)產(chǎn)生規(guī)模為S的粒子群并初始化其位置和速度。
步驟3:解碼得到每個(gè)粒子個(gè)體串,映射到RBF網(wǎng)絡(luò)的不同參數(shù),同時(shí)將N組訓(xùn)練樣本輸入到RBF網(wǎng)絡(luò)中,得到相應(yīng)的輸出,計(jì)算優(yōu)化算法的目標(biāo)函數(shù)。
步驟4:計(jì)算漂移系數(shù)β,根據(jù)式(10)計(jì)算群體平均最優(yōu)位置。
步驟5:對(duì)每個(gè)粒子按照式(12)和(13)進(jìn)行速度和位置的更新。
步驟6:更新得到全局最優(yōu)值Gtj和粒子局部最優(yōu)位置Ptj。
步驟7:判斷全局最優(yōu)值是否滿(mǎn)足RDPSO算法中的結(jié)束條件,即算法給定預(yù)定值或迭代條件。如果滿(mǎn)足條件,轉(zhuǎn)入步驟8,否則轉(zhuǎn)入步驟3。
步驟8:算法結(jié)束。
3?結(jié)果與分析
基于上述思路在MATLAB2015a中編程,創(chuàng)建RDPSO-RBF網(wǎng)絡(luò)模型,采用的計(jì)算機(jī)配置為:Intel CoreTM i7-6500U CPU @2.5 GHz,8 G內(nèi)存。這里采用產(chǎn)后糧食作物稻谷作為試驗(yàn)數(shù)據(jù)集,將207組樣本數(shù)據(jù)隨機(jī)分成2份,前160組作為網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù),后47組作為測(cè)試樣本?;谏鲜雒枋觯ㄟ^(guò)降維后的變量(這里利用相關(guān)性,如:企業(yè)所屬生態(tài)區(qū)域、儲(chǔ)藏量、進(jìn)倉(cāng)總量、出倉(cāng)總量、進(jìn)倉(cāng)形式是散糧散裝進(jìn)倉(cāng)、出倉(cāng)形式是包糧拆包出倉(cāng)等)作為模型網(wǎng)絡(luò)的輸入,其產(chǎn)后糧食總損失率作為輸出。
首先,通過(guò)訓(xùn)練樣本訓(xùn)練出預(yù)測(cè)模型,并根據(jù)學(xué)習(xí)得到的模型輸出的訓(xùn)練樣本的預(yù)測(cè)值與訓(xùn)練樣本實(shí)際值作比較。為了突出RDPSO-RBF模型預(yù)測(cè)產(chǎn)后總損失率的效果,將設(shè)計(jì)線(xiàn)性回歸模型、RBF模型進(jìn)行試驗(yàn)效果的比較。從圖1可以看出,線(xiàn)性回歸模型在訓(xùn)練樣本的擬合情況相當(dāng)差,說(shuō)明了該數(shù)據(jù)集并非線(xiàn)性的,線(xiàn)性模型在這里不適用于糧食的產(chǎn)后損失數(shù)據(jù)。而非線(xiàn)性的RBF神經(jīng)網(wǎng)絡(luò)和RDPSO-RBF網(wǎng)絡(luò),卻能較好地?cái)M合。
通過(guò)圖1得知,RBF神經(jīng)網(wǎng)絡(luò)算法和RDPSO-RBF算法通過(guò)訓(xùn)練樣本學(xué)習(xí)到模型,其模型對(duì)訓(xùn)練樣本有精準(zhǔn)的預(yù)測(cè)輸出。因此,為了檢驗(yàn)?zāi)P偷姆夯阅埽瑘D2呈現(xiàn)了在測(cè)試集上的擬合情況,可以看出基于RDPSO-RBF模型能更好地預(yù)測(cè)損失率,其泛化性能比基于RBF神經(jīng)網(wǎng)絡(luò)模型的更好,其RBF模型有過(guò)擬合現(xiàn)象。
根據(jù)表3的2種算法模型的均方誤差的數(shù)據(jù)可知RDPSO-RBF模型學(xué)習(xí)能力與泛化能力的優(yōu)越性,能更好地預(yù)測(cè)糧食產(chǎn)后損失率。
4?結(jié)論
研究?jī)?chǔ)藏環(huán)節(jié)糧食損失因素、預(yù)測(cè)糧食損失率,以期為糧食在儲(chǔ)藏環(huán)節(jié)損失量提供參考值。為此,本研究基于對(duì)糧食產(chǎn)后損失率情況的調(diào)查,描述影響損失因素的特征。為精準(zhǔn)地預(yù)測(cè)糧食產(chǎn)后儲(chǔ)藏環(huán)節(jié)損失率,建立了RDPSO-RBF網(wǎng)絡(luò)模型。通過(guò)試驗(yàn)對(duì)比,RDPSO優(yōu)化后的RBF神經(jīng)網(wǎng)絡(luò)能更好地對(duì)損失率作出準(zhǔn)確預(yù)測(cè),具有更強(qiáng)的泛化性能,在實(shí)際場(chǎng)景中預(yù)測(cè)損失率的值更加準(zhǔn)確。
參考文獻(xiàn):
[1]高利偉,許世衛(wèi),李哲敏,等. 中國(guó)主要糧食作物產(chǎn)后損失特征及減損潛力研究[J]. 農(nóng)業(yè)工程學(xué)報(bào),2016,32(23):1-11.
[2]張歡歡,唐浩林,葉???,等. 糧食儲(chǔ)存損耗的原因分析及對(duì)策[J]. 糧食加工,2015,40(3):69-72.
[3]張?彩. 散裝糧食平房倉(cāng)外圍護(hù)體系研究[D]. 鄭州:河南工業(yè)大學(xué),2015.
[4]胡麗華,郭?敏,張景虎,等. 儲(chǔ)糧害蟲(chóng)檢測(cè)新技術(shù)及應(yīng)用現(xiàn)狀[J]. 農(nóng)業(yè)工程學(xué)報(bào),2007,23(11):286-290.
[5]Shen Y F,Zhou H L,Li J T,et al. Detection of stored-grain insects using deep learning[J]. Computers & Electronics in Agriculture,2018,145:319-325.
[6]郭?敏,張明真. 基于GMM和聚類(lèi)方法的儲(chǔ)糧害蟲(chóng)聲信號(hào)識(shí)別研究[J]. 南京農(nóng)業(yè)大學(xué)學(xué)報(bào),2012,35(6):44-48.
[7]Chen S,Cowan C F N,Grant P M,et al. Orthogonal least squares learning algorithm for radial basis function networks[J]. IEEE Transactions on Neural Networks,1991,2(2):302-309.
[8]Sun J,Wu X,Palade V,et al. Random drift particle swarm optimization algorithm:convergence analysis and parameter selection[J]. Machine Learning,2015,101(1/2/3):345-376.
[9]Kennedy J,Eberhart R. Particle swarm optimization:Proceedings of ICNN95-International Conference on Neural Networks[C]. Perth:IEEE,2002,1942-1948.
[10]張?鈴,張?鈸. 人工神經(jīng)網(wǎng)絡(luò)理論及應(yīng)用[M]. 杭州:浙江科學(xué)技術(shù)出版社,1997.