劉 哲 孫樂(lè)圣 于 駿 陸 檸 徐 瑩* 郭 淼
1(杭州電子科技大學(xué)自動(dòng)化學(xué)院儀器科學(xué)與工程研究所,杭州 310018)
2(杭州電子科技大學(xué)信息工程學(xué)院,杭州 311305)
多巴胺(dopamine,DA)是一種兒茶酚胺類神經(jīng)遞質(zhì),在哺乳動(dòng)物的心血管和中樞神經(jīng)系統(tǒng)起著至關(guān)重要的作用,且DA、尿酸(uiric acid,UA)等遞質(zhì)通常是人體生理健康狀況指示劑,其在體液、尿液和血液中的含量反映各種疾病征兆,因此DA 的準(zhǔn)確測(cè)量具有重要的生理及病理意義[1]。目前,DA檢測(cè)的經(jīng)典方法有多種,包括熒光法、高效液相色譜法、以及分光光度法[2]等,但以上方法均具有操作復(fù)雜、靈敏度低及無(wú)法選擇性檢測(cè)等缺點(diǎn)[3]。電化學(xué)法是現(xiàn)場(chǎng)檢測(cè)中常用的應(yīng)用于遞質(zhì)檢測(cè)方法,該方法具有操作簡(jiǎn)單、價(jià)格低廉、靈敏度高和選擇性高等優(yōu)點(diǎn)[4]。循環(huán)伏安法(cyclic voltammetry,CV)是其中應(yīng)用最廣泛的電化學(xué)檢測(cè)方法之一,既能定性分析電化學(xué)反應(yīng)特性,又可以測(cè)定電化學(xué)參數(shù)用于定量檢測(cè)待測(cè)物,在神經(jīng)遞質(zhì)等微量特征物檢測(cè)和分析中取得了尚佳的效果[5,6]。
在電化學(xué)檢測(cè)應(yīng)用過(guò)程中,需要恒電位儀施加高精度電位來(lái)維持傳感器的電化學(xué)穩(wěn)定,以得到較準(zhǔn)確的輸出信號(hào)。本課題組研究了一種基于STM32單片機(jī)的便攜式恒電位儀系統(tǒng),用于DA 溶液的現(xiàn)場(chǎng)快速CV 檢測(cè)。然而,恒電位儀普遍存在功能模塊靈敏度和穩(wěn)定性較低的問(wèn)題。為提高DA 溶液的檢測(cè)精度,利用納米金屬材料高比表面積的特性,結(jié)合電沉積技術(shù)制備了一種納米修飾層玻碳電極(AuNPs/GCE)以放大前端檢測(cè)信號(hào),較其他修飾電極,該電極具有制備簡(jiǎn)單、靈敏度高、價(jià)格低廉和重復(fù)性好等優(yōu)點(diǎn),適合用于大樣本量下的DA 分子的快速重復(fù)性測(cè)定[7,8]。
目前,基于CV 法定量分析DA 濃度的研究中,大多數(shù)是利用峰電流和濃度擬合的方法進(jìn)行未知濃度的測(cè)定,例如,Guan 等[9]求取峰電流與DA 濃度間的線性回歸方程作為估計(jì)未知濃度的參考,傳感器的靈敏度反映為方程斜率。采用擬合法預(yù)測(cè)未知濃度時(shí),需要嚴(yán)格控制恒定的實(shí)驗(yàn)環(huán)境和實(shí)驗(yàn)參數(shù)。實(shí)際上,在利用恒電位儀系統(tǒng)對(duì)DA 溶液進(jìn)行CV 快速檢測(cè)時(shí),隨著實(shí)驗(yàn)人員、實(shí)驗(yàn)環(huán)境和實(shí)驗(yàn)要求的不斷變化,無(wú)法保證不產(chǎn)生其他干擾因素,這極大影響了CV 曲線對(duì)DA 濃度的表征。已有眾多文獻(xiàn)報(bào)道了關(guān)于影響DA 在修飾電極上CV 響應(yīng)的重要因素。Ghanbari 等[10]對(duì)pH 值如何影響DA電化學(xué)反應(yīng)進(jìn)行了研究。結(jié)果顯示,DA 的陽(yáng)極峰電位隨pH 的增加發(fā)生負(fù)向線性移動(dòng),隨著pH 值的增加,陽(yáng)極峰值電流也會(huì)增加,當(dāng)pH 值為7.0 時(shí),陽(yáng)極峰電流達(dá)到最大,隨后電流信號(hào)逐漸減小。同時(shí)電流響應(yīng)隨掃速的增加呈線性增加,峰值電流與掃描速度的平方根呈線性關(guān)系。Shashikumara等[11]研究發(fā)現(xiàn)掃描速率在20 ~200 mV/s 范圍內(nèi)增加時(shí),峰值電流增加,峰值電位略有正移;隨著pH值的增加,DA 的陽(yáng)極峰電位向較低的正電位轉(zhuǎn)移??芍趯?duì)DA 的CV 檢測(cè)中,底液的pH 和掃描速率是重要的干擾因素。在對(duì)DA 溶液進(jìn)行現(xiàn)場(chǎng)快速測(cè)定時(shí),若pH 和掃速未知,傳統(tǒng)的峰高與濃度擬合分析方法也就沒(méi)有了檢測(cè)意義。Zhao 等[6]在對(duì)胰島素和葡萄糖的多組分檢測(cè)中,胰島素和葡萄糖的CV 響應(yīng)氧化峰發(fā)生重疊,僅依靠傳統(tǒng)電化學(xué)檢測(cè)方法難以解耦氧化電流,實(shí)現(xiàn)各組分準(zhǔn)確測(cè)定,于是引入人工智能算法克服以上問(wèn)題。據(jù)此,本研究利用機(jī)器學(xué)習(xí)算法構(gòu)建pH 和掃速混雜干擾下的DA 濃度預(yù)測(cè)模型,實(shí)現(xiàn)多干擾下DA 濃度的準(zhǔn)確測(cè)定。
XGBoost 算法是一種新興機(jī)器學(xué)習(xí)方法,基于梯度提升樹模型構(gòu)建集成學(xué)習(xí)模型,以回歸決策樹作為基模型,計(jì)算效率高且適用于小樣本數(shù)據(jù)分析。Cheng 等[12]利用XGBoost 算法可以實(shí)現(xiàn)特征重要性排序的特點(diǎn),對(duì)多金屬離子的實(shí)驗(yàn)數(shù)據(jù)特征選擇最佳特征子集,以提高預(yù)測(cè)性能。由于不同的干擾因素會(huì)對(duì)CV 檢測(cè)曲線的不同相應(yīng)特征產(chǎn)生影響,因此,為降低干擾因素對(duì)CV 檢測(cè)曲線的相應(yīng)特征產(chǎn)生的影響,本研究在預(yù)測(cè)濃度前,通過(guò)XGBoost對(duì)特征參數(shù)進(jìn)行篩選,以降低實(shí)驗(yàn)數(shù)據(jù)的冗余度,改善預(yù)測(cè)性能。首先提取CV 曲線中具有代表性的特征值,以濃度為標(biāo)簽,實(shí)現(xiàn)對(duì)CV 檢測(cè)數(shù)據(jù)信息的充分挖掘。然后,基于極端梯度提升樹(extreme gradient boosting, XGBoost) 和隨機(jī)森林(random forest,RF) 構(gòu)建了兩階段 DA 濃度預(yù)測(cè)模型XGBoost-RF;第一階段基于XGBoost 模型計(jì)算特征重要性得分,篩選其中得分較高的特征生成新的數(shù)據(jù)集;第二階段將新特征集輸入到RF 模型中進(jìn)行訓(xùn)練和濃度預(yù)測(cè)。
本研究利用納米修飾電極和兩階段預(yù)測(cè)模型XGBoost-RF 相結(jié)合的方法,提出一種用于多干擾因素下DA 濃度快速測(cè)定的方法,不僅彌補(bǔ)了恒電位儀直接檢測(cè)靈敏度較低的缺陷,而且可實(shí)現(xiàn)遠(yuǎn)程監(jiān)測(cè)、便攜檢測(cè)等不同實(shí)驗(yàn)場(chǎng)景下對(duì)DA 濃度的定量分析,在底液pH 和掃描速率的干擾下,仍可實(shí)現(xiàn)對(duì)DA 的高精度預(yù)測(cè),降低檢測(cè)成本。
實(shí)驗(yàn)基于自主研發(fā)的便攜式恒電位儀系統(tǒng)完成,其中三電極系統(tǒng)組成為:納米材料修飾電極為工作電極,參比電極為Ag/AgCl 電極,鉑絲為對(duì)電極[13]。磷酸鹽緩沖溶液(PBS)濃度為0.1 mol/L,DA、氯金酸(HAuCl4)為分析純,實(shí)驗(yàn)用水為去離子水[14]。場(chǎng)發(fā)射掃描電子顯微鏡(SU8010,日本Hitachi 公司)。
便攜式恒電位儀系統(tǒng)由三電極檢測(cè)系統(tǒng)、下位機(jī)和PC 上位機(jī)軟件組成,其中下位機(jī)是整個(gè)系統(tǒng)的核心,作用是將三電極系統(tǒng)中目標(biāo)分析物的濃度信息利用電化學(xué)原理轉(zhuǎn)化為電信號(hào)并傳遞給PC 上位機(jī),進(jìn)行并行測(cè)量。如圖1(a)所示,三電極系統(tǒng)包括恒電位儀、三電極測(cè)試電路和電解質(zhì)溶液,三電極測(cè)試電路由工作電極(WE)、參比電極(RE)和輔助電極(CE)組成,其中工作電極作為測(cè)試電極,參比電極為測(cè)試提供基準(zhǔn)電位,輔助電極提供電流輸出,電化學(xué)檢測(cè)主要是研究工作電極上發(fā)生的電極反應(yīng)[15],如圖1(b)為該系統(tǒng)整體連接實(shí)物圖,該系統(tǒng)可進(jìn)行并行電化學(xué)檢測(cè)實(shí)驗(yàn)。便攜式恒電位儀下位機(jī)選用STM32 單片機(jī)作為控制核心,再配合D/A 轉(zhuǎn)換模塊、AFE 模塊(傳感器模擬前端)、A/D轉(zhuǎn)換模塊、藍(lán)牙通信模塊和電源模塊組成整個(gè)下位機(jī)系統(tǒng),如圖1(c)所示。上位機(jī)軟件采用模塊化的設(shè)計(jì)思想,基于QT Creator4.5.0 集成開發(fā)環(huán)境采用QT C ++框架開發(fā)完成,可以運(yùn)行于平板等便攜終端[16]。
圖1 便攜式恒電位儀系統(tǒng)示意圖。(a)三電極體系原理圖;(b)便攜式恒電位儀并行檢測(cè);(c)系統(tǒng)框架圖Fig.1 Diagram of portable potentiostat system. (a)Schematic of the three-electrode system; (b) Parallel detection diagram of portable potentiostat; ( c)System frame diagram(a)
分別用1.00、0.30、0.05 μm 氧化鋁粉末拋光玻碳電極,并在蒸餾水中超聲清洗。電極在氮?dú)獯捣飨赂稍铮缓蠼?.1 M H2SO4電解質(zhì)的0.1%HAuCl4溶液中,在-200 mV(參比電極為Ag/AgCl)單電位模式下進(jìn)行電化學(xué)沉積,時(shí)間為30 s。取出后用水沖洗,晾干備用,即得AuNPs 修飾電極(AuNPs/GCE)。
以不同pH 的PBS 緩沖液為支持電解質(zhì),在不同掃速下對(duì)不同濃度的DA 溶液進(jìn)行重復(fù)性交叉CV 檢測(cè),其中底液pH 分別為5.7、6.3、6.7、7.0、7.4、8.0,掃速參數(shù)設(shè)置為20、50、70、100、120 mV/s,DA 濃度為0.05、0.07、0.10、0.15、0.30、0.40、0.50 mM,共得到1 620組檢測(cè)數(shù)據(jù)。所有實(shí)驗(yàn)均在室溫下完成。
1.4.1 CV 曲線特征參數(shù)
對(duì)于實(shí)驗(yàn)得到的DA 溶液CV 檢測(cè)曲線,不同濃度和檢測(cè)條件下的結(jié)果曲線具有較大的差異性。其中,隨著目標(biāo)分析物濃度的提高,檢測(cè)曲線的峰電流和峰面積會(huì)增大;隨著掃速的增加,氧化峰電流會(huì)發(fā)生正移,還原峰電流發(fā)生負(fù)移,峰面積和基線斜率逐漸增大;由于有質(zhì)子參與DA 的氧化還原反應(yīng),所以隨著pH 值的增加,DA 的峰電位和起始氧化還原電位均負(fù)移[17]。綜上所述,為了全面體現(xiàn)實(shí)驗(yàn)結(jié)果的信息差異性,選擇峰電流、峰電位、基線斜率、峰面積、起始氧化電位和起始還原電位作為模型的特征變量,各個(gè)特征參數(shù)的詳細(xì)描述見表1。
表1 CV 曲線特征參數(shù)Tab.1 Characteristic parameters of CV curve
1.4.2 XGBoost-RF 兩階段預(yù)測(cè)模型
針對(duì)獲取的實(shí)驗(yàn)數(shù)據(jù)集,某些特征參數(shù)會(huì)成為預(yù)測(cè)過(guò)程的冗余信息,這些特征不僅會(huì)降低訓(xùn)練效率,還增加了預(yù)測(cè)誤差。XGBoost 充分考慮了數(shù)據(jù)的稀疏狀況,減小數(shù)據(jù)集不均衡對(duì)模型泛化性能的影響,而RF 方差和偏差都較低,泛化性能優(yōu)越,為此建立XGBoost-RF 兩階段模型對(duì)CV 檢測(cè)數(shù)據(jù)集進(jìn)行濃度預(yù)測(cè)。第一階段利用XGBoost 模型選取重要度得分較高的特征,降低特征集的冗余程度;第二階段將新的特征集輸入到RF 模型中進(jìn)行濃度準(zhǔn)確預(yù)測(cè)。系統(tǒng)流程圖如圖2 所示,結(jié)合便攜式恒電位儀系統(tǒng)和XGBoost-RF 實(shí)現(xiàn)不同干擾因素下DA溶液的濃度預(yù)測(cè)共包含5 個(gè)部分:不同濃度DA 溶液的配置、基于便攜式恒電位儀系統(tǒng)的CV 檢測(cè)實(shí)驗(yàn)、檢測(cè)曲線的特征提取、兩階段預(yù)測(cè)模型和不同濃度DA 溶液的預(yù)測(cè)結(jié)果。
圖2 主要測(cè)試系統(tǒng)分析流程Fig.2 Frame diagram of the measuring system
對(duì)于單個(gè)決策樹計(jì)算特征重要性的依據(jù)是該特征分割使模型性能提升的程度,而對(duì)于整個(gè)XGBoost 模型而言,特征的重要性是該特征在每一棵樹中的表現(xiàn)的綜合評(píng)估。每一棵回歸樹的目標(biāo)函數(shù)為
式中,loss() 為損失函數(shù),Ω為復(fù)雜度,yi、分別為訓(xùn)練集標(biāo)簽和預(yù)測(cè)標(biāo)簽,xi為特征參數(shù)。
利用貪心算法求取目標(biāo)函數(shù)最小的增益,增益函數(shù)為
式中,Gi和Hi分別為第i棵樹的一階和二階導(dǎo)常數(shù),λ為常數(shù)系數(shù),γ為模型的復(fù)雜度代價(jià)。增益值越大,葉節(jié)點(diǎn)分裂的損失越小,所以在分割節(jié)點(diǎn)時(shí),選擇增益最大的特征[18]??傻茫卣鱥在第t棵回歸樹的重要度公式為
式中,j為節(jié)點(diǎn),L為節(jié)點(diǎn)總數(shù),vj為與j的關(guān)聯(lián)特征。
綜上,特征i在所有樹的重要度得分計(jì)算公式為
式中,n為決策樹的個(gè)數(shù),t為決策樹的編號(hào)。
將1.4.1 小節(jié)提取的10 個(gè)特征輸入XGBoost模型中,計(jì)算特征重要度得分,進(jìn)而篩選出對(duì)結(jié)果影響程度較大的特征用于后續(xù)的濃度預(yù)測(cè)。為使不同特征參數(shù)間具有可比性,消除不同量綱對(duì)模型預(yù)測(cè)結(jié)果的影響,在第一階段XGBoost 模型特征選取前對(duì)數(shù)據(jù)集進(jìn)行歸一化處理。
RF 是一種集成學(xué)習(xí)算法,具有運(yùn)算速度快,抗噪聲能力強(qiáng),調(diào)整參數(shù)少,對(duì)數(shù)據(jù)量的要求低等優(yōu)點(diǎn),對(duì)小樣本數(shù)據(jù)集具有適用性。其基本單元是二叉決策樹,每棵樹之間獨(dú)立同分布,n棵樹可集成為一個(gè)森林形成強(qiáng)回歸器。
隨機(jī)森林回歸模型的構(gòu)建過(guò)程
步驟1:從樣本集中有放回地隨機(jī)抽取部分?jǐn)?shù)據(jù)樣本作為決策樹根節(jié)點(diǎn)的樣本集;
步驟2:在決策樹的每個(gè)分裂節(jié)點(diǎn)處,遍歷每個(gè)特征,按照最小均方差原則選擇分裂閾值與最優(yōu)特征;
步驟3:根據(jù)節(jié)點(diǎn)的分裂屬性進(jìn)行分裂直至葉節(jié)點(diǎn),葉節(jié)點(diǎn)存儲(chǔ)的是決策樹的輸出結(jié)果Ot,t為第t棵樹。
步驟4:重復(fù)以上步驟m次即形成擁有m棵數(shù)的森林。隨機(jī)森林模型的輸出值為每棵樹的輸出平均值O,表示為
具體的XGBoost-RF 預(yù)測(cè)模型算法流程圖如圖3 所示。特別地,為適應(yīng)數(shù)據(jù)集維度較低,且特征參數(shù)為連續(xù)型的特點(diǎn),步驟2 中RF 模型中在節(jié)點(diǎn)分裂時(shí)參與判斷的最大特征數(shù)選取所有特征數(shù)的開方,提高每個(gè)樹模型的擬合能力,決策樹的數(shù)目選擇為1 000,使模型的泛化誤差收斂于一個(gè)極限值,結(jié)合以上參數(shù)優(yōu)化提高模型對(duì)本實(shí)驗(yàn)電化學(xué)檢測(cè)數(shù)據(jù)的預(yù)測(cè)能力。為驗(yàn)證所建立的XGBoost-RF兩階段模型對(duì)電化學(xué)檢測(cè)數(shù)據(jù)的特征提取和訓(xùn)練等方面的優(yōu)異性,建立SVR 預(yù)測(cè)模型作為對(duì)比。
圖3 XGBoost-RF 算法流程Fig.3 Flowchart of XGBoost-RF model
利用不同放大功率下的場(chǎng)發(fā)射掃描電鏡圖(FESEM)觀察AuNPs/GCE 表面的微觀形貌,結(jié)果如圖4(a)所示。GCE 表面相對(duì)光滑,在AuNPs/GCE 表面附著有離散的球狀金納米顆粒,顆粒分布較為均勻,且大小接近,直徑范圍主要在50 nm 左右。這些金納米顆粒均勻排布在電極表面,增大了與DA 的接觸面積,提高了對(duì)DA 催化氧化的能力。如圖4(b)所示為裸玻碳電極(A)和納米金修飾電極(B)分別在含有0.1 mM DA 的0.1 mol/L PBS(pH=7.3)溶液中的CV 響應(yīng)結(jié)果(參比電極為Ag/AgCl)。可知,和GCE 相比,DA 在AuNPs/GCE 上的氧化還原峰峰形比較尖銳,尤其是還原峰的響應(yīng)明顯增大,而兩者的兩個(gè)峰電位基本相同。利用裸玻碳電極、AuNPs/GCE(滴涂法)和AuNPs/GCE(電沉積法)分別對(duì)同一DA 溶液(0.1 mM,pH=7.3)進(jìn)行重復(fù)性CV 檢測(cè)(n=10)。結(jié)果顯示,3 種電極下的氧化峰電流均值分別為(4.10±0.39)μA、(4.12±0.39)μA、(6.69±0.36)μA,相對(duì)標(biāo)準(zhǔn)偏差分別為9.60%、9.50%、6.69%,其中DA 在電沉積法制備的AuNPs/GCE 下的氧化峰電流最大,且該修飾電極的重復(fù)性最優(yōu)。
圖4 AuNPs/GCE 表征結(jié)果。(a)AuNPs/GCE 的FESEM 圖;(b)不同修飾電極對(duì)含有0.1 mM DA的CV 測(cè)試曲線Fig.4 Characterization results of AuNPs/GCE.(a) FESEM images of AuNPs/GCE; (b) CV curves of different modified electrodes containing 0.1mm DA
以上結(jié)果表明,電沉積法制備的AuNPs/GCE修飾電極對(duì)DA 的氧化還原反應(yīng)具有良好的電催化活性,可實(shí)現(xiàn)DA 的高靈敏度、高重復(fù)性和快速檢測(cè),便于后期針對(duì)較多實(shí)驗(yàn)數(shù)據(jù),進(jìn)行干擾環(huán)境下的機(jī)器學(xué)習(xí)預(yù)測(cè)分析。
以AuNPs/GCE 為工作電極,在不同掃速(20、50、70、100、120 mV/s)下檢測(cè)含有0.1 mM DA 的0.1 mol/L PBS(pH =7.3)溶液,其他條件不變,共測(cè)得300 組CV 數(shù)據(jù)。其中一組數(shù)據(jù)結(jié)果如圖5(a)所示,隨著掃速的增加,氧化峰電流發(fā)生正移,還原峰電流發(fā)生負(fù)移,峰面積和基線斜率逐漸增大,且峰電流與掃速平方根呈良好線性相關(guān),R-square 為0.87 和0.89。保持其他條件不變,研究底液pH 對(duì)DA 檢測(cè)的影響,在AuNPs/GCE 電極上對(duì)含有0.1 mM DA 的不同pH 值(5.7、6.3、6.7、7.0、7.4、8.0)0.1 mol/L PBS 溶液進(jìn)行CV 檢測(cè),掃速為50 mV/s,共測(cè)得300 組CV 數(shù)據(jù)。其中1 組數(shù)據(jù)結(jié)果如圖5(b)所示,隨著pH 值的增加,DA 的峰電位和起始氧化還原電位均發(fā)生負(fù)移,且峰電位分別與PBS 的pH 呈良好線性相關(guān),R-square 均為0.99。同時(shí),在底液pH 從5.3 增加到7.4 時(shí),氧化峰電流逐漸增大,之后隨pH 增大逐漸降低。綜上所述,底液pH 值和掃速是影響DA 在AuNPs/GCE 電極上CV 響應(yīng)的重要因素,在測(cè)定不同濃度DA 時(shí)需要嚴(yán)格保證底液pH 和掃速不變,否則DA 的直接檢測(cè)結(jié)果具有較大的誤差。
圖5 AuNPs/GCE 在不同底液pH 和掃速下對(duì)DA 的CV 響應(yīng)。(a)在不同掃速下對(duì)DA 的CV響應(yīng)(插圖為峰電流與掃速平方根關(guān)系圖);(b)在不同pH 下對(duì)DA 的CV 響應(yīng)(插圖為峰電位與pH 線性關(guān)系圖)Fig.5 CV responses of DA on AuNPs/GCE at different pH and scan rates. (a) CV response of DA at different scan rates ( The internal illustration shows the relationship between peak current and square root of sweep speed);(b) CV response of DA at different pH (The internal illustration shows the linear relationship between peak potential and pH)
以AuNPs/GCE 為工作電極,保持其他檢測(cè)條件不變,對(duì)不同濃度DA 溶液(0.05、0.07、0.15、0.30 和0.50 mM)進(jìn)行CV 檢測(cè),共測(cè)得1 500 組CV 數(shù)據(jù)。其中一組實(shí)驗(yàn)結(jié)果(PBS 溶液pH 為7.5,掃速為50 mV/s)如圖6(a)所示,隨著濃度的增大,CV 曲線的氧化峰電流正移,還原峰電流負(fù)移,峰面積和基線斜率均逐漸增大。在0.05~0.50 mM 濃度范圍內(nèi),峰電流與濃度呈線性相關(guān),R-square 分別為0.99 和0.97。然而,由于測(cè)試的便攜化、遠(yuǎn)程化及測(cè)試人員的影響,利用恒電位儀對(duì)低濃度DA 進(jìn)行快速測(cè)定時(shí),不可避免地使多誤差輸入源測(cè)量結(jié)果混入,如底液pH 和掃速干擾問(wèn)題。如圖6(b)為不同底液pH 和掃速下對(duì)0.15 和0.30 mM DA 溶液的CV 檢測(cè)結(jié)果??芍?,在不同pH 和掃速的影響下,DA 檢測(cè)曲線的特征參數(shù)發(fā)生很大改變,其中變化較大的為峰電流、峰電位和峰面積,也就無(wú)法利用CV 曲線相關(guān)特征與濃度之間的線性關(guān)系分析不同濃度DA 檢測(cè)曲線并準(zhǔn)確測(cè)定DA 濃度。對(duì)此,基于機(jī)器學(xué)習(xí)算法構(gòu)建兩階段DA 濃度預(yù)測(cè)模型,在底液pH 和掃速對(duì)DA 測(cè)定的干擾下,提升了對(duì)DA濃度的預(yù)測(cè)準(zhǔn)確性。
圖6 有無(wú)干擾因素對(duì)不同濃度DA 的CV 響應(yīng)。(a)無(wú)干擾源(插圖為峰電流與DA 濃度線性關(guān)系圖);(b)有干擾源Fig.6 CV response under different concentrations of DA with and without interference factors.(a) Without interference(The internal illustration is the linear relationship between peak current and DA concentration); (b) With interference of pH and sweep speed
為驗(yàn)證XGBoost-RF 兩階段模型在不同干擾因素下對(duì)DA 濃度預(yù)測(cè)的優(yōu)異性,選用經(jīng)典模型SVR與XGBoost-RF 進(jìn)行對(duì)比。對(duì)混有底液pH 和掃速干擾下的1 620組實(shí)驗(yàn)數(shù)據(jù)提取特征整理成數(shù)據(jù)集,并進(jìn)行歸一化處理。分別輸入80%處理后的數(shù)據(jù)集到SVR 和XGBoost-RF 進(jìn)行訓(xùn)練。XGBoost-RF 第一階段基于XGBoost 的特征重要度得分如圖7(a)所示,氧化峰面積、還原峰基線斜率、還原峰電流、氧化峰電流、氧化峰基線斜率和還原峰電位6 個(gè)特征占總特征分值的74%,保留以上特征對(duì)RF 訓(xùn)練,但保留全部特征訓(xùn)練SVR。
圖7 預(yù)測(cè)結(jié)果(箭頭所指為未經(jīng)訓(xùn)練的盲濃度)。(a)特征重要度得分;(b)SVR 預(yù)測(cè)結(jié)果;(c)XGBoost-RF 預(yù)測(cè)結(jié)果Fig.7 Prediction results(The arrows indicate the untrained blind concentrations). (a) Feature importance score; (b) Prediction result of SVR;(c) Prediction result of XGBoost-RF
圖7(b)、(c)分別SVR 對(duì)全部特征測(cè)試集的預(yù)測(cè)結(jié)果和XGBoost-RF 第二階段基于RF 對(duì)特征篩選后的測(cè)試集具體預(yù)測(cè)結(jié)果。其中,為了驗(yàn)證預(yù)測(cè)模型對(duì)未經(jīng)訓(xùn)練的DA 盲濃度具有有效預(yù)測(cè)性,在不同干擾因素下(不同pH 值和掃速)采集了兩組不同濃度(0.10 和0.40 mM)DA 溶液的CV 數(shù)據(jù),每組各60 個(gè)數(shù)據(jù)樣本,預(yù)測(cè)結(jié)果如圖7(b)、(c)箭頭標(biāo)示。從圖中整體預(yù)測(cè)結(jié)果來(lái)看,對(duì)于多濃度下的未經(jīng)訓(xùn)練的DA 濃度,SVR 和XGBoost-RF 預(yù)測(cè)得到的濃度值與實(shí)際濃度值間都達(dá)到一定擬合度,但RSquare 分別為0.875、0.943,可知XGBoost-RF 較SVR 的預(yù)測(cè)效果更佳。兩模型的誤差指標(biāo)結(jié)果如表2 所示,相較于SVR 模型,XGBoost-RF 濃度預(yù)測(cè)模型的MAE、RMSE 和MAPE%分別降低了53.9%、39.7%和2.7%?;赬GBoost 對(duì)重要特征進(jìn)行篩選后,RF 預(yù)測(cè)模型的訓(xùn)練時(shí)間降低23%,預(yù)測(cè)準(zhǔn)確度提升7%??芍?,對(duì)多干擾因素下的DA 濃度預(yù)測(cè),XGBoost-RF 兩階段模型具有更為理想的效果。
表2 預(yù)測(cè)模型誤差指標(biāo)對(duì)比Tab.2 Comparison of error indicators for prediction models
綜上所述,對(duì)于多干擾因素下的DA 溶液CV 檢測(cè)數(shù)據(jù),XGBoost-RF 濃度預(yù)測(cè)模型實(shí)現(xiàn)了高準(zhǔn)確度的預(yù)測(cè),未來(lái)隨著不同濃度DA 溶液檢測(cè)數(shù)據(jù)對(duì)模型的訓(xùn)練,該模型的泛化性能和預(yù)測(cè)準(zhǔn)確度會(huì)進(jìn)一步提高。
目前,國(guó)內(nèi)外基于DA 等神經(jīng)遞質(zhì)溶液的電化學(xué)檢測(cè)主要采用循環(huán)伏安法、計(jì)時(shí)電流法等,并圍繞檢測(cè)下限展開,這對(duì)于實(shí)驗(yàn)人員、實(shí)驗(yàn)條件具有較嚴(yán)格的要求[5,19]。隨著生物醫(yī)療等行業(yè)對(duì)DA 等檢測(cè)物的現(xiàn)場(chǎng)檢測(cè)、遠(yuǎn)程檢測(cè)、便攜檢測(cè)多種需求逐漸提升,造成實(shí)驗(yàn)人員和實(shí)驗(yàn)場(chǎng)景的不斷變化,從而無(wú)法確?,F(xiàn)場(chǎng)快速檢測(cè)的實(shí)驗(yàn)條件保持一致,導(dǎo)致實(shí)驗(yàn)結(jié)果中混雜入不同程度的干擾,對(duì)目標(biāo)物濃度的測(cè)定產(chǎn)生重要影響。已有許多研究顯示,對(duì)于DA 的CV 響應(yīng)中,其陽(yáng)極峰電位隨pH 值的增加發(fā)生負(fù)向線性移動(dòng),陽(yáng)極峰值電流也會(huì)隨著pH 的增加而增加,當(dāng)pH 值到達(dá)一定值時(shí),陽(yáng)極峰電流達(dá)到最大,隨后電流信號(hào)會(huì)隨著pH 的增加而減?。煌瑫r(shí),掃速在一定范圍內(nèi)增加時(shí),峰值電流會(huì)逐漸增大[10-11]??芍?,掃速和底液pH 是對(duì)于DA 的CV 快速測(cè)定影響較為突出的兩個(gè)干擾因素。
為此,針對(duì)在多干擾存在的情況下實(shí)現(xiàn)DA 的現(xiàn)場(chǎng)快速測(cè)定,本研究提出納米修飾電極和機(jī)器學(xué)習(xí)相結(jié)合的方法。目前,已有較多文獻(xiàn)報(bào)道了關(guān)于提高DA 檢測(cè)靈敏度的方法。Liu 等[7]曾通過(guò)還原HAuCl4合成一款納米金修飾電極,結(jié)果顯示其對(duì)DA 表現(xiàn)出良好的電流響應(yīng),證明了金納米顆粒對(duì)DA 分子具有良好的催化效應(yīng)。Mahalakshmi 等[8]使用LSV 在聚苯胺修飾電極上原位電沉積AuNPs,研究證明沉積金納米顆粒的修飾電極對(duì)DA 具有高效的電催化作用。雖然納米金修飾電極在DA 檢測(cè)中的靈敏度和有效性已經(jīng)得到相關(guān)研究人員的認(rèn)可,但是以上納米金修飾電極的制備過(guò)程繁瑣且制備成本高,無(wú)法適用于DA 的現(xiàn)場(chǎng)快速測(cè)定。本研究利用電沉積技術(shù)制備了一種簡(jiǎn)易的納米金修飾電極(AuNPs/GCE),用于實(shí)現(xiàn)DA 溶液的快速檢測(cè)。通過(guò)SEM 圖像[見圖4( a)]觀察到該修飾電極表面較均勻附著約50 nm 的納米金顆粒,可實(shí)現(xiàn)對(duì)DA 分子的有效電催化。另外,該修飾電極的制備操作比較簡(jiǎn)便,這會(huì)有效提高DA 溶液的測(cè)定效率,在上千組DA 快速檢測(cè)應(yīng)用中具有較大優(yōu)勢(shì)。
當(dāng)前,許多研究開始將機(jī)器學(xué)習(xí)算法引入到電化學(xué)檢測(cè)領(lǐng)域中,以得到更加優(yōu)異的檢測(cè)效果。例如,Schaumloffel 等[20]為分別量化生物柴油樣品中四種抗氧化劑的濃度,采用電化學(xué)微分脈沖伏安法和人工神經(jīng)網(wǎng)絡(luò)(ANN)進(jìn)行結(jié)合,有效克服抗氧化劑混合物之間對(duì)檢測(cè)結(jié)果的相互干擾,4 種抗氧化劑的實(shí)際濃度與測(cè)定濃度間呈現(xiàn)高度相關(guān)性。這表明,引入機(jī)器學(xué)習(xí)算法可有效克服不同實(shí)驗(yàn)條件對(duì)電化學(xué)測(cè)定結(jié)果的干擾。根據(jù)電化學(xué)檢測(cè)領(lǐng)域的主要干擾源,本研究首先進(jìn)行了不同底液pH、掃速和不同低濃度DA 溶液的重復(fù)性交叉CV 檢測(cè)實(shí)驗(yàn),以探究多干擾因素下的濃度有效測(cè)定。然后對(duì)實(shí)驗(yàn)曲線提取具有代表性的特征,其中包括峰電流、峰電位、基線斜率、峰面積、起始氧化電位和起始還原電位等,并整理成特征集。根據(jù)實(shí)驗(yàn)數(shù)據(jù)特征參數(shù)呈離散化特點(diǎn),本研究基于XGBoost 和RF構(gòu)建兩階段DA 濃度預(yù)測(cè)模型。第一階段基于XGBoost 模型根據(jù)特征參數(shù)的重要性得分選取得分較高的特征以降低特征冗余度,并提升模型訓(xùn)練效率。第二階段將選取的特征輸入到RF 模型中進(jìn)行訓(xùn)練和濃度預(yù)測(cè)。結(jié)果顯示,相較于傳統(tǒng)SVR 模型,XGBoost-RF 濃度預(yù)測(cè)模型的MAE、RMSE 和MAPE%分別降低53.9%、39.7%和2.7%,預(yù)測(cè)準(zhǔn)確度提升7%,預(yù)測(cè)濃度(其中包括未經(jīng)訓(xùn)練的盲濃度)與實(shí)際濃度間均具有良好擬合度,R-Square 為0.943,這說(shuō)明該模型具備較高的預(yù)測(cè)準(zhǔn)確度,且通過(guò)特征篩選后,模型的訓(xùn)練時(shí)間降低23%,這一點(diǎn)在快速檢測(cè)相關(guān)領(lǐng)域具有重要意義。從整體結(jié)果來(lái)看,在對(duì)存在多干擾因素下的DA 濃度預(yù)測(cè)中,XGBoost-RF 兩階段模型表現(xiàn)出優(yōu)良的泛化性能和測(cè)定效率,說(shuō)明基于納米修飾電極和機(jī)器學(xué)習(xí)相結(jié)合的方法具有良好應(yīng)用前景。
本研究主要工作機(jī)制可概況為:首先,采用本領(lǐng)域的主要經(jīng)典檢測(cè)技術(shù)——電化學(xué)CV 法進(jìn)行DA 溶液檢測(cè)。其次,為進(jìn)一步提高檢測(cè)靈敏度,選取高導(dǎo)電性和催化性能的納米金粒子作為電極修飾材料,放大由DA 氧化反應(yīng)所引起電流響應(yīng),增強(qiáng)DA 定量檢測(cè)精確度。為保證修飾電極的信號(hào)穩(wěn)定性和再現(xiàn)性,采取電沉積技術(shù)制備表面均勻、具活性位點(diǎn)的納米粒子。第三,對(duì)于檢測(cè)結(jié)果中由于現(xiàn)場(chǎng)檢測(cè)中底液pH 和掃速不同等所造成的干擾,對(duì)CV 曲線提取重要特征,并構(gòu)建XGBoost-RF 兩階段濃度預(yù)測(cè)模型?;跇涞腦GBoost 模型和RF 模型屬于機(jī)器學(xué)習(xí)領(lǐng)域的經(jīng)典模型,其中XGBoost 通過(guò)正則化以及多階導(dǎo)數(shù)精確訓(xùn)練,其內(nèi)置的稀疏感知算法,適用于本研究中含有多因素以及多特征的小樣本數(shù)據(jù)。RF 模型通過(guò)多個(gè)子樹的集成學(xué)習(xí)并進(jìn)行隨機(jī)采樣,具備更強(qiáng)的抗干擾能力和泛化能力,易于尋找有效特征并挖掘不同因素間的微小差異,實(shí)現(xiàn)高精度預(yù)測(cè)[21]。下一階段將進(jìn)一步加強(qiáng)多種電化學(xué)方法,如CV 法、計(jì)時(shí)電流法、差分伏安法等與機(jī)器學(xué)習(xí)相結(jié)合的分析[20],[22]。CV 法可提取的特征參量雖較多,但由于CV 法除了分析樣品的定量測(cè)試,也主要用于電極動(dòng)力學(xué)分析。因此,在后續(xù)的研究中,課題將進(jìn)一步綜合脈沖伏安法、方波伏安法和計(jì)時(shí)電流法等其它檢測(cè)方法并協(xié)同分析,擴(kuò)充代表性特征參數(shù)維度,增強(qiáng)實(shí)驗(yàn)數(shù)據(jù)的多元化及分析準(zhǔn)確度,優(yōu)化機(jī)器學(xué)習(xí)模型,從提高靈敏度和檢測(cè)精度的角度實(shí)現(xiàn)對(duì)低濃度目標(biāo)溶液在多干擾因素下的定量分析,促進(jìn)便攜儀器的工程化及商用化。
本研究基于納米金修飾電極、便攜式恒電位儀系統(tǒng)和XGBoost-RF 兩階段預(yù)測(cè)模型在提高DA 現(xiàn)場(chǎng)檢測(cè)準(zhǔn)確性的同時(shí),進(jìn)一步有效降低了主要干擾因素-底液pH 和掃速對(duì)DA 現(xiàn)場(chǎng)檢測(cè)結(jié)果帶來(lái)的誤差,為在不同實(shí)驗(yàn)環(huán)境下實(shí)現(xiàn)DA 的現(xiàn)場(chǎng)快速高精度測(cè)定提供了新的思路和方法。未來(lái)可針對(duì)差分脈沖伏安法和計(jì)時(shí)電流法等共同進(jìn)行特征提取以提高實(shí)驗(yàn)數(shù)據(jù)特征參數(shù),進(jìn)一步提升預(yù)測(cè)準(zhǔn)確度。