亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于近紅外光譜的安胎丸生產(chǎn)年份預(yù)測方法

        2020-08-08 07:39:52鄭恩讓馬晉芳葛發(fā)歡肖環(huán)賢
        光譜學(xué)與光譜分析 2020年8期
        關(guān)鍵詞:分類模型

        陳 蓓,鄭恩讓*,馬晉芳,葛發(fā)歡,肖環(huán)賢

        1. 陜西科技大學(xué)電氣與控制工程學(xué)院,陜西 西安 710021 2. 廣州譜民信息科技有限公司,廣東 廣州 510006 3. 中山大學(xué)藥學(xué)院,廣東 廣州 510006 4. 江西保利制藥有限公司,江西 贛州 341900

        引 言

        安胎丸是經(jīng)典古方,由當(dāng)歸、 白芍、 白術(shù)、 川穹、 黃芩等五味藥材加工制成,具有安胎養(yǎng)血的功效[1]。隨著人們經(jīng)濟和生活水平的提高,需求日益增加。市售安胎丸由于藥品的原材料差異,并且隨著藥物生產(chǎn)和保存的時間、 儲存環(huán)境不同等都使藥效差別較大,會對患者帶來一定的損失,制劑的批間差異是其質(zhì)量考量的重要指標(biāo)。衛(wèi)生部藥品標(biāo)準(zhǔn)中采用薄層色譜法對其中三味藥材進行定性鑒別,王雪麗等[2-3]主要采用高效液相色譜(HPLC)化學(xué)檢測方法對部分質(zhì)控成分的進行定量檢測,這些質(zhì)控方法不僅會損耗樣品,且檢測時間長,檢測成本高。中藥制劑成分多樣,發(fā)生反應(yīng)機制復(fù)雜,部分成分尚不明確,單一或者幾種成分含量測定具有片面性。近紅外光譜(near infrared spectroscopy,NIRS)是利用近紅外光對化學(xué)物質(zhì)中不同含氫基團的吸收信息來進行分析、 檢測的一種新型無損、 快速、 無污染的分析技術(shù)[4],可作為一種整體質(zhì)量評價的手段,在中醫(yī)藥質(zhì)控領(lǐng)域,主要應(yīng)用在品種鑒定、 產(chǎn)地鑒別、 品質(zhì)分級和定量分析等方面[5-6],對于藥品生產(chǎn)年份質(zhì)控方式的相關(guān)研究未見報道。

        近紅外光譜通常包含大量的波長變量,一定程度上還會引入噪聲,通過篩選特征波長建立模型,可以降低模型的復(fù)雜程度,提高預(yù)測能力。常用的波長提取方法有遺傳算法(GA)、 無信息變量消除法(UVE)、 連續(xù)投影算法(successive projection algorithm,SPA)等。王濤等[7]在預(yù)測胡楊葉含水量中建模對比,采用SPA波長選擇算法預(yù)測精度和相關(guān)度都優(yōu)于GA;經(jīng)UVE篩選之后的波長變量數(shù)目仍然過于龐大,不能達到最終的簡化目標(biāo),SPA算法能大大減少建模所需變量的數(shù)目,比GA和UVE算法得到的變量數(shù)目更少,可提高建模的效率和速度。有研究利用SPA結(jié)合支持向量機(support vector machine,SVM)有效地對玉米的霉變程度進行了判別,預(yù)測準(zhǔn)確率達到了91.11%,但文中SVM參數(shù)是憑經(jīng)驗選取的合適參數(shù),并不能保證參數(shù)是最佳的。鑒于此,本文提出一種基于近紅外光譜技術(shù)的安胎丸生產(chǎn)年份預(yù)測方法,以某藥廠三年的105粒安胎丸為研究對象,實驗采集其近紅外光譜,應(yīng)用SPA算法去除光譜冗余信息,優(yōu)選出樣本的特征波長,結(jié)合粒子群優(yōu)化(particle swarm optimization, PSO)算法對SVM分類模型進行參數(shù)尋優(yōu),建立PSOSVM分類預(yù)測模型。通過該方法可以區(qū)分安胎丸生產(chǎn)的不同年份,對藥物的質(zhì)量評價提供一種方法。

        1 實驗部分

        1.1 儀器

        SupNIR1500近紅外光譜儀(聚光科技(杭州)有限公司),Matlab2018(美國MathWorks公司),Ultimate3000高效液相色譜儀(美國Thermo公司)。

        1.2 樣本采集

        從2013年—2015年安胎丸中隨機抽取樣品15個批次,批號為:130501,130502,130601,130602,130701,131101,131201,140401,140402,140501,140502,141103,151001,151002和151101,總共105丸樣品。

        利用美國Thermo公司的Ultimate3000高效液相色譜儀,測定安胎丸中關(guān)鍵質(zhì)量控制成分的含量,列表統(tǒng)計如表1所示。

        表1 安胎丸中關(guān)鍵質(zhì)控成分的含量測定統(tǒng)計表(mg·pill-1)Table 1 Statistical table for determination of key quality control indicator components in Antaipills (mg·pill-1)

        利用聚光科技有限公司生產(chǎn)的SupNIR1500近紅外光譜儀采集安胎丸光譜,漫反射模式,波長掃描范圍是1 000~1 799 nm。每丸樣品重復(fù)掃描三次,得到平均的光譜數(shù)據(jù)保存。105個樣品的光譜如圖1所示。從圖1可以看出來,近紅外光譜信息重疊嚴(yán)重,特別是2013年和2014年的光譜,很難從峰值位置直觀鑒別各樣品的特征信息。因此,必須采用合適的特征提取辦法,才能對安胎丸樣品進行年份的鑒別。

        圖1 105個安胎丸樣本的光譜圖Fig.1 The spectra of 105Antai pills samples

        1.3 數(shù)據(jù)預(yù)處理

        根據(jù)年份不同,對安胎丸樣品對應(yīng)的光譜數(shù)據(jù)進行分類,可以將樣品分為三類,得到的具體分類表如表2。

        表2 樣本根據(jù)年份分類表Table 2 The table of sample classification according to year

        從表1中數(shù)據(jù)可以看出,生產(chǎn)年份不同,存放的時間不同,關(guān)鍵質(zhì)控指標(biāo)成分里的含量也不同,體現(xiàn)了生產(chǎn)年份與安胎丸的質(zhì)量有密切關(guān)系,進一步說明按年份分類研究對藥物的質(zhì)量控制有一定的意義。

        1.4 建模方法與模型評價

        近紅外光譜測量得到的數(shù)據(jù)數(shù)量龐大,光譜波長較多,相鄰波長間存在較多的冗余信息和相關(guān)性,如果直接用全光譜建模,必然會使得建模的時間和模型的復(fù)雜度增加,模型的預(yù)測正確率和穩(wěn)定性降低。

        具體的實驗建模分析過程如圖2所示。先使用連續(xù)投影算法(SPA)對采集到的波長進行優(yōu)化,對輸入進行降維,最大程度的消除干擾。得到降維后的光譜數(shù)據(jù)輸入到PSOSVM分類模型中,進行分類預(yù)測。利用分類正確率作為模型的評價準(zhǔn)則,其定義為

        圖2 實驗數(shù)據(jù)處理流程圖Fig.2 The flow chart of processing experimental data

        (1)

        在式(1)中N為測試集樣本數(shù)量,Ni為識別第i類分類正確的樣本數(shù)量。

        1.4.1 波長優(yōu)化選擇算法SPA

        連續(xù)投影算法[8](successive projection algorithm,SPA)屬于前向選擇變量算法,首先選擇一個波長變量作為初始值,計算該變量在未選變量上的投影,將最大投影向量對應(yīng)的波長作為新的待選變量,依次迭代,直到內(nèi)部交互驗證均方根誤差(RMSECV)達到最小,選出最佳波長變量數(shù)N及波長變量集合Y。SPA算法實現(xiàn)步驟如下:

        (1) 光譜矩陣Xn×p(其中n為樣本數(shù),p為待選波長變量)標(biāo)準(zhǔn)化;

        (2) 隨機選取初始迭代波長:從X中隨機選擇一個列向量Xj,記為列向量Xk(0),k(0)=1,2,3…,p;

        (3)將光譜矩陣X中剩余的列向量記為S,S={j,1≤j≤p,j?k(0),k(1),…,k(n-1)};

        (4) 分別計算xj對剩余列向量S的投影Pxj,

        (2)

        (5)定義k(n)=arg[max(‖Pxj‖,k∈s)]為N-1個投影值中的最大;

        (6)將最大投影值對應(yīng)的波長變量作為下次迭代的初始值:

        xj=Pxj,j∈S

        (7) 令i=i+1,如果i

        (8) 將優(yōu)化降維后得到的所有波長組合在一起,表示為集合Y:

        Y={xk(n):n=1,2,…,N-1}

        SPA算法可以從全部波段里提取出特征波長,能夠幾乎消除原始光譜矩陣中的冗余信息,將優(yōu)化降維后的特征波長輸入到后面的建模中,能夠顯著增加模型正確率和運算速度。

        1.4.2 分類建模算法PSOSVM

        支持向量機(support vector machine,SVM)是在統(tǒng)計學(xué)的VC維理論基礎(chǔ)上發(fā)展起來的機器學(xué)習(xí)方法,在1995年由Vapnik首先提出[9],具有理論完備、 分類準(zhǔn)確率高、 泛化性能好等優(yōu)點,能夠解決小樣本、 非線性和高維數(shù)據(jù)劃分的問題,主要用于模式識別和非線性回歸,它的思想是建立一個分類超平面作為決策曲面,使正例和反例之間的隔離邊緣最大化。SVM引入核函數(shù)K(x,xi)巧妙地解決了非線性分類問題,SVM有很多不同的核函數(shù),由于徑向基RBF核函數(shù)能夠逼近任何非線性函數(shù),具有很好的學(xué)習(xí)能力,因此選擇RBF核函數(shù),表達式如式(3)

        K(x,xi)=exp(-γ‖x-xi‖2),γ>0

        (3)

        但是,SVM模型中懲罰參數(shù)C和核函數(shù)參數(shù)γ的選取對分類的正確率影響很大。僅依賴于經(jīng)驗值的試湊是不可行的。

        粒子群優(yōu)化(particle swarm optimization,PSO)算法是計算智能領(lǐng)域基于群體智能的優(yōu)化算法之一,算法概念源于對人工生命和鳥群捕食行為的研究[10],采用仿生智能算法進行參數(shù)尋優(yōu),不用遍歷所有參數(shù)組,目前已經(jīng)廣泛應(yīng)用于神經(jīng)網(wǎng)絡(luò)、 函數(shù)優(yōu)化等其他算法中。

        PSOSVM算法的流程如圖3所示,將PSO算法用于支持向量機的參數(shù)優(yōu)化,可以降低優(yōu)化過程的計算代價,提高分類的正確率[11]。

        圖3 PSOSVM算法的流程圖Fig.3 Flow chart of the PSOSVM algorithm

        2 結(jié)果與討論

        2.1 優(yōu)選特征波長

        實驗采集的近紅外光譜波長掃描范圍1 000~1 799 nm,共有800個波長變量,如果直接作為分類模型的輸入,輸入量過大,訓(xùn)練時間過長。SPA通過最小化變量之間的共線性,實現(xiàn)了最優(yōu)波長的選擇,通過SPA對近紅外光譜數(shù)據(jù)進行降維。

        針對上述105丸樣品,隨機選擇80個作為訓(xùn)練集,25個為測試集,數(shù)據(jù)隨機分布,符合建模要求。選取質(zhì)控成分中含量最高,且含量聚類與年份分類吻合的黃芩苷的含量為基準(zhǔn),根據(jù)測試集的內(nèi)部交叉驗證均方根誤差值最小,由圖4可看出,提取最佳的特征波長有11個,分別是:{1 692,1 714,1 405,1 001,1 114,1 478,1 514,1 788,1 202,1 014,1 164} nm,其重要程度依次遞減。

        圖4 優(yōu)選特征波長分布圖Fig.4 The distribution map of preferred characteristic wavelength

        2.2 分類模型分析對比

        利用訓(xùn)練集80個樣本的光譜數(shù)據(jù)及年份分類,采用SPA-PSOSVM算法建立安胎丸生產(chǎn)年份鑒別的分析模型,以分類的正確率作為評價準(zhǔn)則。隨機給定SVM分類模型參數(shù),其中懲罰參數(shù)C=1和核函數(shù)參數(shù)γ=1,同時將建模結(jié)果與SVM和SPA-SVM兩種算法作對比,得到的測試集的分類結(jié)果對比如圖5—圖7所示。

        圖5 基于SVM的測試集分類結(jié)果Fig.5 The graph of test classification result based on SVM

        圖6 基于SPA-SVM的測試集分類結(jié)果Fig.6 The graph of test classification result based on SPA-SVM

        圖7 基于SPA-PSOSVM的測試集分類結(jié)果Fig.7 The graph of test classification result based on SPA-PSOSVM

        為更清楚地對比三種方法的效果,匯總仿真中部分變量、 參數(shù)和結(jié)果,如表3所示(其中黑體字表示本文所用方法)。

        從表3對比可知,近紅外光譜數(shù)據(jù)通過三種方法分類建模測試,第一種方法,單一的SVM建模參與變量數(shù)目最多,正確率最低;第二種方法,全光譜數(shù)據(jù)經(jīng)過SPA降維后,變量數(shù)目從800個降到11個,再利用SVM建模,正確率提高到92%,模型耗時大大縮短,體現(xiàn)了SPA算法可有效提高正確率和降低建模時間;第三種方法,即本方法,光譜經(jīng)SPA降維后,再通過PSO尋優(yōu),SVM分類算法的最佳懲罰參數(shù)C和核函數(shù)參數(shù)γ(BestC=16.406 4,γ=0.773 39),正確率達到了100%,由于尋優(yōu)過程消耗時間,模型耗時高于單一的SVM分類方法。綜合考慮,基于近紅外光譜結(jié)合SPA-PSOSVM建立安胎丸的年份分類預(yù)測模型正確率最高,性能較好(見圖7)。

        表3 三種方法測試效果對比表Table 3 Table of testcomparison of three methods

        3 結(jié) 論

        對安胎丸近紅外光譜數(shù)據(jù)進行SPA優(yōu)化降維,在全波段提取了11個特征波長,占全部波長的1.375%,建立了PSOSVM分類模型,預(yù)測模型正確率達到了100%,表明SPA算法是一種比較有效的特征波長提取辦法,建立的SPA-PSOSVM分類模型正確率明顯高于SVM和SPA-SVM,可以有效地用于安胎丸的生產(chǎn)年份分類預(yù)測,為藥材原材料的優(yōu)選、 廠家生產(chǎn)工藝的革新和偽劣過期藥品的判別提供參考和依據(jù)。根據(jù)中藥的主要質(zhì)控成分含量隨存儲時間的變化特點,本方法可為中藥的質(zhì)量評價提供一種快速無損的判定方式。

        猜你喜歡
        分類模型
        一半模型
        分類算一算
        垃圾分類的困惑你有嗎
        大眾健康(2021年6期)2021-06-08 19:30:06
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        3D打印中的模型分割與打包
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        美丽的熟妇中文字幕| 美女免费视频观看网址| 中文无码人妻有码人妻中文字幕| 亚洲色精品aⅴ一区区三区| 国产精品入口牛牛影视| 日韩av一区在线播放| 日本一区二区国产精品| 国产精品无码无在线观看| 精品久久久久久国产| 男女激情床上视频网站| 丝袜美腿福利视频在线| 久久综合丝袜日本网| 亚洲AV无码不卡无码国产| 精品中文字幕日本久久久| 成人偷拍自拍视频在线观看| 99久久免费国产精品| 亚洲精品第一国产麻豆| 精品av一区二区在线| 国产情侣一区二区三区| 国产精品久久久久久52avav| 日本香蕉久久一区二区视频| 免费人成在线观看播放视频| 久久精品中文闷骚内射| 97超级碰碰人妻中文字幕| 国产一级片内射在线视频| 成年人干逼视频水好多| 波多野42部无码喷潮| 久久国产成人亚洲精品影院老金| 国产影片免费一级内射| 无码色av一二区在线播放| 丝袜足控一区二区三区| 国产成人午夜av影院| 91在线视频在线视频| 亚洲国产精品久久久久婷婷老年| 欧美日韩国产亚洲一区二区三区 | 日韩精品中文字幕第二页| 久久久久成人精品无码中文字幕 | 久久精品视频日本免费| 午夜精品射精入后重之免费观看| 欧美黑人又粗又大久久久 | 日本丰满老妇bbw|