亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        粒子群算法的近紅外光譜定性分析預處理及特征提取參數(shù)優(yōu)化方法研究

        2021-09-14 09:32:52李浩光于云華沈?qū)W鋒
        光譜學與光譜分析 2021年9期
        關鍵詞:嵌套識別率適應度

        李浩光, 于云華, 逄 燕, 沈?qū)W鋒

        1. 山東石油化工學院機械與控制工程學院, 山東 東營 257061 2. 中國石油大學(華東)新能源學院, 山東 東營 257061

        引 言

        在近紅外光譜定性分析時, 為取得最優(yōu)識別效果, 首先需對原始光譜數(shù)據(jù)預處理, 并進行特征提取。 預處理主要目的是為消除樣品自身與外界環(huán)境干擾因素對近紅外光譜數(shù)據(jù)影響, 常用預處理方法包括平滑、 一階導、 歸一化等[1-2]; 而特征提取方法能夠剔除近紅外光譜數(shù)據(jù)中的無關信息, 保留有效信息, 常用特征提取方法有偏最小二乘(partial least squares,PLS)、 主成分分析(principal component analysis, PCA)、 線性判別分析(linear discriminant analysis,LDA)、 正交線性判別分析(orthogonal linear discriminant analysis,OLDA)等[3-5]。 不同預處理方法及特征提取方法具有不同特點, 構建近紅外定性分析數(shù)學模型時, 單獨使用某種預處理方法或特征提取方法往往難以取得理想結果, 常將多種預處理方法及多種特征提取方法組合使用以提升模型性能, 在各種預處理及特征提取方法中往往需要設定一些可變參數(shù), 這些可變參數(shù)對定性分析的性能有重要影響, 因此采用多個預處理方法及多個特征提取方法就存在多個參數(shù)需要確定的問題。

        常用的確定各參數(shù)的方法包括試湊法及多重循環(huán)嵌套尋優(yōu)方法。 試湊法求取各待定參數(shù)最優(yōu)值時難以求得全局最優(yōu)解; 多重循環(huán)嵌套尋優(yōu)方法需要消耗大量計算機內(nèi)存與時間, 存在效率低的缺點。 為高效確定預處理環(huán)節(jié)及特征提取環(huán)節(jié)的多個待定參數(shù), 提出了一種基于粒子群算法的近紅外光譜預處理及特征提取參數(shù)組合尋優(yōu)方法, 并以玉米籽粒單倍體二倍體光譜為例, 對兩種方法進行了實驗驗證。 可以快速獲得預處理與特征提取環(huán)節(jié)的最優(yōu)參數(shù)組合, 并保證代入最優(yōu)參數(shù)組合的近紅外定性分析模型具有最優(yōu)的識別性能。

        1 算法原理

        粒子群算法(particle swarm optimization,PSO)首先由Eberhart博士和Kennedy博士在1995年提出, 該算法是一種進化算法, 從隨機解出發(fā), 通過迭代搜尋最優(yōu)解, 具有較強的自適應能力及解決問題能力, 在很多領域獲得了成功應用[4]。

        PSO算法基于對鳥群覓食行為的模仿: 鳥群在自然界隨機搜尋食物時, 若所在區(qū)域里只有一塊食物, 所有的鳥在搜索前均不知食物具體位置, 但是鳥群可以判斷感知當前位置與食物的距離, 最有效食物搜索策略就是搜索當前離食物目標距離最近的鳥的附近空間。

        用于參數(shù)組合尋優(yōu)的PSO算法流程如圖1所示。

        圖1 預處理及提取最優(yōu)參數(shù)組合粒子群算法流程圖Fig.1 Flow chart of Pretreatment and extraction parameters combination search based on PSO method

        在參數(shù)尋優(yōu)過程中, 待求最優(yōu)解等價于鳥類欲搜尋的食物, 而鳥類覓食的搜索區(qū)域則對應于待求解問題的變量范圍, 在搜尋食物目標過程中, 各個個體的鳥不僅需要自己的知識積累, 還需根據(jù)整個鳥群的搜索經(jīng)驗來修正自己的速度, 從而使自己不斷靠近食物。

        提出的基于粒子群算法的特征提取參數(shù)優(yōu)化方法實現(xiàn)步驟如下:

        (1)參數(shù)初始化: 首先設定各待定參數(shù)變化范圍, 學習因子設定為C1和C2, 最大進化代數(shù)G,kg表示當前進化代數(shù)。 在一個D維的搜索空間中, 粒子種群規(guī)模為size, 每個粒子代表解空間的一個候選解。 其中, 第i(1

        (2)個體評價(適應度評價): 將各粒子初始位置作為個體極值, 計算群體中各粒子的初始適用值f(xi), 并求出種群最優(yōu)位置, 在本節(jié)中使用預處理、 特征提取、 分類器等環(huán)節(jié)構成近紅外定性分析模型對實驗數(shù)據(jù)所得的鑒別準確率作為適應度函數(shù)值。

        (3)更新粒子速度和位置, 生成新種群, 并對粒子速度與位置進行越界檢查。

        其中, kg=1,2,…,G, i=1,2,…,size, r1和r2為0到1的隨機數(shù), c1為局部學習因子, c2為全局學習因子, 一般取c2為較大值。

        (4)比較粒子當前適應值f(xi)與自身歷史最優(yōu)值Pi, 如果f(xi)優(yōu)于Pi, 則設置為當前值f(xi), 并更新粒子位置。

        (5)比較粒子當前適應f(xi)與種群最優(yōu)值BestS, 如果f(xi)優(yōu)于BestS, 則BestS為當前值f(xi), 更新種群全局最優(yōu)值。

        (6)判斷粒子群算法收斂條件, 若滿足, 則結束尋優(yōu), 輸出最優(yōu)參數(shù)組合及其對應適應度函數(shù)值, 否則kg=kg+1, 轉(zhuǎn)至步驟(3)。 結束條件一般是最大迭代次數(shù)或評價值小于設定精度。

        2 算法設計

        基于上述粒子群算法原理, 未對該算法進行驗證, 選擇如下近紅外光譜數(shù)據(jù)集作為實驗數(shù)據(jù)集:

        以中國農(nóng)業(yè)大學國家玉米改良中心提供的某品種玉米單倍體和二倍體籽粒作為研究對象, 分5日連續(xù)采集其近紅外光譜, 使用自制近紅外光譜采集裝置[5-7], 并以漫透射采集方式交替采集單倍體、 二倍體單籽粒近紅外光譜各100條, 共5組數(shù)據(jù), 5個實驗數(shù)據(jù)集按時間順序依次編號為T1—T5。

        針對近紅外光譜定性分析模型中預處理及特征提取參數(shù)優(yōu)化問題對算法設計如下:

        (1)適應度函數(shù)設計

        適應度函數(shù)可用于評價粒子群算法所搜尋的各個參數(shù)組合的質(zhì)量, 根據(jù)適應度函數(shù)值的變化, 進行迭代進化搜索粒子最優(yōu)值, 并對粒子群中其他粒子狀態(tài)進行更新, 利用粒子適應度函數(shù)值能夠反映粒子質(zhì)量, 即粒子是否能夠使適應度函數(shù)取得最優(yōu)值。 擬進行參數(shù)優(yōu)化的適應度函數(shù)模型如圖2所示, 在特征提取參數(shù)優(yōu)化問題中將整個定性分析模型作為適應度函數(shù), 由圖2可知, 適應度函數(shù)由平滑、 一階導、 歸一化、PLS特征提取、OLDA特征提取、SVM分類器等環(huán)節(jié)構成, 其中待尋優(yōu)參數(shù)有: 平滑系數(shù)、 一階導系數(shù)、PLS特征提取維數(shù)、OLDA特征提取維數(shù)。

        圖2 粒子群算法適應度函數(shù)流程圖Fig.2 Flow chart of fitness function of PSO algorithm

        (2)算法參數(shù)設計

        粒子群算法相對于其他優(yōu)化算法, 其特點是需要設置參數(shù)相對較少, 參數(shù)變化與算法尋優(yōu)能力、 收斂速度密切相關。

        算法中需要確定的參數(shù)有: 種群規(guī)模、 粒子長度、 粒子范圍、 粒子速度范圍、 加速度常數(shù)等。

        ①種群規(guī)模

        圖3是模型識別率隨粒子種群規(guī)模變化曲線, 由圖3可以看出, 種群規(guī)模, 即同一批粒子的種群數(shù)量增加到40后便對識別率的影響很小, 種群數(shù)目取 40時, 適應度函數(shù)值即分類器對待分類數(shù)據(jù)的識別率就能夠達到95%左右, 其后識別率增長速度較慢。

        圖3 識別率隨粒子種群規(guī)模變化曲線圖Fig.3 Recognition rate curve with particlepopulation size changing

        圖4是算法收斂速度隨粒子種群規(guī)模變化曲線, 由圖4可以看出。 隨著粒子種群數(shù)目增大, 粒子間相互配合能力隨之增強, 每個粒子負責搜尋空間相對變小, 較大的粒子種群數(shù)更易搜索到全局最優(yōu)解, 但易帶來負面問題, 即算法運行時間直線上升。

        圖4 算法收斂速度隨粒子種群規(guī)模變化曲線圖Fig.4 Curve of convergence time with particlepopulationsize changing

        綜合考慮尋優(yōu)能力與收斂時間, 本節(jié)中粒子群種群規(guī)模適宜設置為40。

        ②粒子長度

        粒子長度即每個粒子所包含的待定參數(shù)的維數(shù), 對應本節(jié)中的適應度函數(shù), 本節(jié)中粒子的長度為4維。

        ③粒子范圍

        粒子范圍指粒子在多維解空間中尋優(yōu)區(qū)域, 由具體優(yōu)化問題與目標確定, 一般將待優(yōu)化參數(shù)取值范圍固定為粒子范圍, 本研究中粒子的每一維搜索范圍并不相同, 具體設置如下:

        平滑參數(shù)(smooth parameter)用SP表示, 其最大值用maxSP表示, 步長為2, 變化范圍為[3,5,7,…,maxSP]; 一階導參數(shù)(FD parameter)用FDP表示, 其最大值用maxFDP表示, 步長為2, 變化范圍為[3,5,7,…,maxFDP]; PLS特征提取的維數(shù)(PLS parameter)用PLS表示, 其最大值用maxPLS表示, 步長為1, 變化范圍為[3,4,5,…,maxPLS]; OLDA特征提取后的維數(shù)(OLDA parameter)用FDP表示, 因為其最大值不可能超過PLS特征提取后的維數(shù), 因此其最大值用PLS表示。

        ④粒子速度范圍

        粒子飛行速度范圍表示粒子搜索過程中單次運動距離, 若粒子飛行的速度過高, 粒子飛行跨度過大, 易錯過最優(yōu)解。 若飛行的速度太低, 粒子只能在一個小的局部范圍內(nèi)進行搜索, 可能搜尋到局部最優(yōu)解。 本節(jié)規(guī)定粒子飛行速度為k·xmax, 其中k在0.1至1之間變化,xmax為各維粒子飛行速度的最大值, 粒子每一維都采用相同取值方法。

        ⑤加速度常數(shù)c1,c2

        加速度常數(shù)代表粒子群算法中的學習因子, 兩值分別代表各粒子向個體極值與全局極值飛行時的加速度權重比值。 較小的加速度值允許粒子在被拉回目標值前能夠擴展搜索目標值范圍之外的區(qū)域。 加速度值設置過大則會導致粒子越過目標搜索范圍。 根據(jù)實際調(diào)試過程, 本節(jié)中PSO算法加速度常數(shù)c1為1.48,c2設為1.85。

        基于上述分析, 針對參數(shù)優(yōu)化問題, 粒子群算法參數(shù)設置如下:

        粒子種群規(guī)模為40, 最大進化代數(shù)為200,c1為1.48,c2設為1.85。

        適應度函數(shù): 使用平滑、 一階導、 歸一化、 PLS特征提取、 OLDA特征提取、 SVM分類器等環(huán)節(jié)構成近紅外定性分析模型, 隨機抽取T1數(shù)據(jù)集的一半作為訓練集, 另一半作為測試集, 重復20次, 將識別率取平均后作為適應度函數(shù)值。

        對比實驗算法設計: 循環(huán)嵌套方法與所提出的粒子群算法進行對比實驗, 循環(huán)嵌套方法的流程圖如圖5所示, 程序利用4個循環(huán)嵌套實現(xiàn)4個待確定參數(shù)尋優(yōu)。

        圖5 預處理參數(shù)及特征提取參數(shù)循環(huán)嵌套尋優(yōu)流程圖Fig.5 Flow chart of loop nesting optimization method

        圖5中近紅外定性鑒別子程序包括平滑、 一階導、 歸一化、 PLS特征提取、 OLDA特征提取、 SVM分類器等環(huán)節(jié), 多個環(huán)節(jié)組合實現(xiàn)對單倍體與二倍體兩類籽粒的分類。 在分類時, 隨機抽取T1數(shù)據(jù)集的一半作為訓練集, 另一半作為測試集, 重復20次, 將識別率取平均得到平均識別率, 分類完成后保存所得平均識別率與對應的參數(shù)組合, 并對識別率進行排序。

        3 結果與討論

        利用圖2所示的PSO算法流程以及圖5所示的多重循環(huán)嵌套方法分別對上述近紅外定性分析模型最優(yōu)參數(shù)組合進行搜尋, 近紅外光譜定性分析模型中待尋優(yōu)的參數(shù)包括平滑參數(shù)、 一階導系數(shù)、 PLS維數(shù)、 OLDA維數(shù)共4個。

        實驗數(shù)據(jù): 使用玉米單倍體二倍體光譜數(shù)據(jù)作為實驗數(shù)據(jù)集。

        針對上述數(shù)據(jù)建立近紅外光譜定性分析模型, 定性分析模型中數(shù)據(jù)預處理采用平滑(Smoothing)、 一階導(first Derivative, FD)、 矢量歸一化(vector normalization, VN)三種方法相結合[8-9], 特征提取環(huán)節(jié)采用PLS+OLDA組合的方式, 最后利用SVM方法進行分類鑒別。

        將T1作為預處理與特征提取參數(shù)組合優(yōu)化算法的實驗數(shù)據(jù)集, T2—T5數(shù)據(jù)集作為測試集驗證所獲得優(yōu)化參數(shù)組合的推廣性能, 使用上述兩種方法所得實驗結果及其分析見表1和表2。

        表1 識別率及其對應參數(shù)列表(PSO方法)Table 1 Recognition rate and its correspondingparameter list (PSO method)

        表2 識別率及其對應參數(shù)列表(多重循環(huán)嵌套方法)Table 2 Recognition rate and its corresponding parameter list (multiple loop nesting method)

        表1及表2是分別使用粒子群算法與多重循環(huán)嵌套方法尋優(yōu)得到模型識別率最高時的幾組參數(shù)組合, 由兩表可以看出, 在兩種方法中識別率較高時對應參數(shù)有多種組合。

        選擇表2中任意一組數(shù)據(jù)可以發(fā)現(xiàn): PSO算法與多重循環(huán)嵌套方法獲得的參數(shù)值比較接近, PSO算法與多重循環(huán)嵌套方法所獲的第二組參數(shù)組合則完全一致。

        此外, 在同一種方法所獲的幾種參數(shù)組合中, 參數(shù)之間相差并不大, 基本在小范圍內(nèi)波動。 以PSO算法為例, 平滑參數(shù)在9~11范圍內(nèi)波動, 而OLDA維數(shù)在4~5之間波動。 因此, 在模型實際使用時, 為獲得較優(yōu)或者最優(yōu)的識別性能, 可以將參數(shù)設置在一定范圍內(nèi)。

        對于本實驗數(shù)據(jù)與對應分類任務, 最優(yōu)識別效果對應平滑參數(shù)一般可設置為9, 11和13, 而一階導參數(shù)可設置為7, 9, 11和13, PLS參數(shù)可設置為7, 9和11, OLDA可設置為4和5。

        在構建近紅外光譜定性分析模型時, 選擇表格中任一組參數(shù)組合代入模型, 均可獲得最優(yōu)或者較優(yōu)的預測性能。

        表3是利用PSO方法在數(shù)據(jù)集T1上獲得的最優(yōu)預處理與特征提取參數(shù)組合代入近紅外定性鑒別模型后, 在多個測試數(shù)據(jù)集上所得識別率。 對每一個數(shù)據(jù)集進行實驗時, 從各數(shù)據(jù)集中隨機抽取一半作為訓練集建立定性分析模型, 剩余一半作為測試集對所建模型進行測試, 抽取樣本時, 兩類樣本各占50%, 20次實驗所得識別率取均值。

        表3 最優(yōu)參數(shù)組合在其他數(shù)據(jù)集的識別結果表Table 3 Recognition results of optimal parameter combination tested with other data sets

        建立模型階段代入PSO方法搜尋得到的預處理與特征提取參數(shù)組合SP=9, FDP=9, PLS=11, OLDA=4。 由表3可以看出, 所獲參數(shù)組合在幾個數(shù)據(jù)集上均能獲得高于95%的識別率, 說明粒子群方法所獲取優(yōu)化參數(shù)組合在不同數(shù)據(jù)集均具有較好推廣性能。

        表4是在同一臺計算機分別使用多重循環(huán)嵌套方法以及PSO方法對最優(yōu)參數(shù)組合進行尋優(yōu)所消耗的時間。 由表4可知, PSO方法只需586 s, 而循環(huán)嵌套方法需要2 825 s, PSO方法尋優(yōu)效率較高, 而多重循環(huán)嵌套方法尋優(yōu)效率需要消耗大量的計算機內(nèi)存與計算時間, 效率較低。

        表4 程序消耗時間對比表Table 4 Comparison of program consumption time

        4 結 論

        針對近紅外光譜定性分析模型中預處理及特征提取環(huán)節(jié)多參數(shù)需要尋優(yōu), 當前常用試湊法及多重循環(huán)嵌套方法存在無法獲得全局最優(yōu)解、 效率低的問題。 研究中提出了一種基于粒子群算法的定性分析模型預處理與特征提取參數(shù)組合優(yōu)化方法, 首先采用粒子群算法與SVM算法對預處理與特征提取的多環(huán)節(jié)參數(shù)組合進行尋優(yōu), 再利用多個測試集對代入最優(yōu)參數(shù)組合的定性分析模型進行測試, 實驗結果證明了方法的有效性。

        猜你喜歡
        嵌套識別率適應度
        例析“立幾”與“解幾”的嵌套問題
        改進的自適應復制、交叉和突變遺傳算法
        計算機仿真(2022年8期)2022-09-28 09:53:02
        基于嵌套Logit模型的競爭性選址問題研究
        基于類圖像處理與向量化的大數(shù)據(jù)腳本攻擊智能檢測
        計算機工程(2020年3期)2020-03-19 12:24:50
        基于真耳分析的助聽器配戴者言語可懂度指數(shù)與言語識別率的關系
        提升高速公路MTC二次抓拍車牌識別率方案研究
        高速公路機電日常維護中車牌識別率分析系統(tǒng)的應用
        基于空調(diào)導風板成型工藝的Kriging模型適應度研究
        中國塑料(2016年11期)2016-04-16 05:26:02
        一種基于區(qū)分服務的嵌套隊列調(diào)度算法
        計算機工程(2014年6期)2014-02-28 01:25:29
        無背景實驗到有背景實驗的多重嵌套在電氣專業(yè)應用研究
        河南科技(2014年23期)2014-02-27 14:19:17
        国产精品自线在线播放| 日韩精品视频av在线观看| 最新在线观看免费的a站国产| 精品国产日韩亚洲一区在线| 午夜视频一区二区三区播放| 久久久久国色av免费观看性色| 久久中文字幕无码专区| 丰满五十六十老熟女hd| 国产乱人视频在线看| 欧美日韩区1区2区3区| 精品国产一区二区三区久久女人| 国产小车还是日产的好| 色视频日本一区二区三区| 久久精品人妻中文av| 肥老熟妇伦子伦456视频| 精品无码人妻一区二区三区品| 一本大道久久a久久综合| 蜜桃伦理一区二区三区| 久久99精品国产麻豆| 国产av无码专区亚洲av蜜芽| 午夜成人理论无码电影在线播放| 日韩中文在线视频| 中文字幕精品一区二区日本 | 在厨房被c到高潮a毛片奶水| 精品无码国产自产野外拍在线| 亚洲午夜精品a区| 中文一区二区三区无码视频| 国产91大片在线观看| 大地资源网在线观看免费官网| 中文人妻无码一区二区三区在线| 欧美日韩一线| 亚洲精品一区二区三区在线观| 在线免费观看一区二区| 麻豆精品传媒一二三区| 日本成人字幕在线不卡| 一区二区三区中文字幕在线观看| 乱人伦中文视频在线| 国产一卡2卡3卡四卡国色天香| 国产精品原创巨作AV女教师 | 亚洲av日韩av不卡在线观看| 久久亚洲精彩无码天堂|