亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于UMAP輔助的模糊C聚類方法進行太赫茲光譜識別

        2022-09-05 03:26:06易燦燦張文濤
        光譜學(xué)與光譜分析 2022年9期
        關(guān)鍵詞:赫茲降維時域

        易燦燦, 庹 帥, 涂 閃, 4, 張文濤

        1. 武漢科技大學(xué)冶金裝備與控制技術(shù)教育部重點實驗室, 湖北 武漢 430081 2. 武漢科技大學(xué)湖北省機械傳動與制造工程重點實驗室, 湖北 武漢 430081 3. 武漢科技大學(xué)精密制造研究院, 湖北 武漢 430081 4. 廣西師范大學(xué)物理科學(xué)與技術(shù)學(xué)院, 廣西 桂林 541004 5. 桂林電子科技大學(xué)電子工程與自動化學(xué)院, 廣西 桂林 541004

        引 言

        太赫茲THz(Terahertz)是電磁波中一個特殊的波段, 其頻率為0.1~10 THz, 波長為0.03~3 mm, 位于毫米波和紅外波之間的特殊位置。 近年來, 人們發(fā)現(xiàn)THz光譜具有反映物質(zhì)結(jié)構(gòu)的“指紋”特征[1], 在物質(zhì)鑒別分類和無損檢測領(lǐng)域具有廣泛應(yīng)用。 與X射線相比, 太赫茲輻射的能量很低, 不會由于電離而損壞被檢測的物質(zhì)[2], 在無損檢測方面具有很大的潛力。 施衛(wèi)[3]等搭建了一套THz時域光譜測量系統(tǒng), 用來對微量活細(xì)胞進行檢測, 為活性生物大分子或組織的檢測奠定了基礎(chǔ)。 饒近秋[4]等利用太赫茲時域光譜技術(shù)對中藥進行了無損檢測, 實現(xiàn)了炮制品、 偽造品以及正品中藥的定性識別。 楊帆[5]等將太赫茲時域光譜技術(shù)與有效介質(zhì)理論結(jié)合起來, 實現(xiàn)了對皮膚水分含量的變化的準(zhǔn)確評估, 為太赫茲皮膚燒傷和皮膚疾病檢測提供理論支撐。 除此之外, 太赫茲時域光譜技術(shù)還應(yīng)用于農(nóng)產(chǎn)品中農(nóng)藥的安全檢測[6]以及人體癌變細(xì)胞或組織的檢測[7]等。

        相對于傳統(tǒng)的棉花種子, 轉(zhuǎn)基因棉花種子具有抗蟲、 抗旱、 產(chǎn)量高等優(yōu)點。 運用太赫茲時域光譜技術(shù)實現(xiàn)對不同類型的轉(zhuǎn)基因棉花種子進行識別, 能夠根據(jù)種植環(huán)境的不同選擇合適的棉花種子, 以此來提高棉花的產(chǎn)量。 在轉(zhuǎn)基因棉花種子的鑒別方面, Qin[8]等提出一種結(jié)合支持向量機(support vector machine, SVM)和多種群遺傳算法(multi-population genetic algorithm, MPGA)的轉(zhuǎn)基因棉花種子的鑒定方法。 陳濤[9]等提出一種布谷鳥搜索算法優(yōu)化支持向量機的轉(zhuǎn)基因產(chǎn)品鑒別方法。 Liu[10]等建立了一種基于太赫茲頻譜的改進決策支持向量機(decision support vector machine, DSVM)模式識別模型。 首先, 通過因子分析(factor analysis, FA)對原始太赫茲光譜數(shù)據(jù)進行降維, 提取數(shù)據(jù)特征; 然后, 將選擇的特征光譜數(shù)據(jù)輸入到DSVM模型中, 成功識別預(yù)測樣本。 現(xiàn)有的對轉(zhuǎn)基因棉花種子的太赫茲光譜識別主要是通過主成分分析(principal component analysis , PCA)和SVM來實現(xiàn)的, 雖然取得了一定的效果, 但是也存在一些不足。 例如, SVM作為一種適合小樣本的學(xué)習(xí)方法, 核參數(shù)的正確選擇對最終結(jié)果的影響很大。 而PCA作為一種常用的線性降維方法, 用其累計方差貢獻率最大的幾個成分去解釋全體樣本, 往往存在一定的偶然性, 而且忽略掉的成分往往包含著反映樣本特征的重要信息。 針對以上不足, 本文提出均勻流形逼近與投影(uniform manifold approximation and projection, UMAP)輔助的模糊C聚類方法, 實現(xiàn)對不同類型的轉(zhuǎn)基因棉花種子的判別。

        區(qū)別于常用的降維方法如PCA[11]、 局部線性嵌入(local linear embedding, LLE)[12]、 局部保持投影(local preserving projection, LPP)[13], 均勻流形逼近與投影(uniform manifold approximation and projection , UMAP)是一種新的流形學(xué)習(xí)技術(shù)[14], 其利用局部流形逼近和局部模糊單純形集表示來構(gòu)造高維數(shù)據(jù)的拓?fù)浔硎尽?在低維空間中, 其優(yōu)化數(shù)據(jù)的低維空間布局, 使高維和低維兩個拓?fù)浔硎局g的交叉熵最小。 UMAP不僅具有可視化的優(yōu)點, 而且同時耗時短、 對嵌入維數(shù)沒有限制, 可以擴展到更大的維度的數(shù)據(jù)集。

        傳統(tǒng)的模糊C聚類方法(Fuzzy C-clustering method, FCM)[15]在選擇聚類中心時沒有一個確定的標(biāo)準(zhǔn), 聚類中心往往隨機選定。 當(dāng)選擇的初始聚類中心不合適時, 其聚類結(jié)果可能出現(xiàn)局部最優(yōu)的現(xiàn)象, 從而使聚類產(chǎn)生錯誤。 為此, 本文提出一種基于UMAP輔助的模糊C聚類算法, 首先采用UMAP對原始光譜數(shù)據(jù)矩陣進行降維, 然后根據(jù)降維的結(jié)果進行初始聚類中心的選取, 最后利用模糊C方法進行聚類分析。 為了驗證所提方法的可行性, 首先采用太赫茲時域光譜技術(shù)探測了四種類型不同的轉(zhuǎn)基因棉花種子, 獲得了四種轉(zhuǎn)基因棉花種子的太赫茲吸收光譜。 然后采用本文所提方法對吸光度光譜數(shù)據(jù)進行聚類分析, 并與PCA, LLE和LPP等方法進行對比, 研究結(jié)果表明本文提出的基于UMAP輔助的模糊C聚類算法在轉(zhuǎn)基因棉花種子的太赫茲光譜分類識別上具有很好的實用性。

        1 原 理

        1.1 太赫茲時域光譜理論

        太赫茲波是一種波長在0.03~3 mm范圍內(nèi)的電磁波其對應(yīng)的頻率為0.1~10 THz。 為了分析太赫茲光譜數(shù)據(jù), 引入式(1)

        (1)

        式(1)中,G0(ω)是太赫茲參考信號的幅度,Gtrans(ω)是發(fā)射的太赫茲信號的幅度,φ(ω)是樣本和參考信號之間的相差,ω是太赫茲波振動的角頻率。

        材料的吸收系數(shù)定義為

        (2)

        式(2)中,b是表示材質(zhì)吸收的消光系數(shù),c是光速。

        式(1)可以近似為

        (3)

        式(3)中,h為試樣厚度, 均為1 mm, 誤差小于0.05 mm。 材料的折射率z和吸收系數(shù)β可通過式(4)和式(5)獲得

        (4)

        (5)

        1.2 UMAP降維理論

        UMAP算法分兩步進行降維, 首先通過將相鄰多維值之間的差異轉(zhuǎn)換為權(quán)重, 生成多維結(jié)果的有偏k-近鄰圖; 然后優(yōu)化數(shù)據(jù)集維度的交叉熵。

        輸入數(shù)據(jù)集X={x1,x2, …,xN},xi∈RM, 尋找其最優(yōu)低維表示Y={y1, …,yN∣yi∈Rk}。 UMAP降維分兩步進行: (1)在高維空間中構(gòu)造一個特定的加權(quán)k近鄰圖; (2)計算該圖的低維布局。

        高維空間中, 設(shè)X={x1, …,xN}為輸入數(shù)據(jù)集, 帶有一個度量d:X×X→R≥0。 給定輸入超參數(shù)k, 對于每個xi, 計算集合{xi1, …,xik}, 使用最近鄰下降算法進行該計算。

        對于每個xi, 定義ρi和σi

        ρi=min{d(xi,xij)|1≤j≤k,d(xi,xij)>0}

        (6)

        并將σi用式(7)定義

        (7)

        (8)

        B=A+A′-A°A

        (9)

        式(9)中, °表示逐點乘積。

        低維空間中, UMAP使用力導(dǎo)向圖布局算法, 利用引力和排斥力演化出一個等價的加權(quán)圖H, 它包含一組點{yi}i=1, …, N。yi和yj處的引力和斥力由式(10)和式(11)定義

        (10)

        (1-w((xi,xj)))(yi-yj)

        (11)

        式(10)和式(11)中,a和b是超參數(shù),ε是一個小數(shù), 以防止被零除。

        1.3 傳統(tǒng)模糊C聚類理論

        設(shè)N個待分類樣本的集合為X={xi,i=1, 2, …,N), 模糊C均值聚類是以隸屬度函數(shù)u作為樣本xi的類別標(biāo)號, 將N個樣本劃分到C個類別中。 其分類準(zhǔn)則是使聚類中心V={vj,j=1, 2, …,N}的模糊誤差平方和最小, 聚類損失函數(shù)定義為

        (12)

        式(12)中,b用于控制聚類結(jié)果的模糊程度。

        在該算法中, 隸屬度函數(shù)u為連續(xù)的,uj(xi)可在區(qū)間[0, 1]任意取值, 并且有

        (13)

        為求式(12)中J的極小值, 分別令其對uj(xi)和vj的偏導(dǎo)數(shù)為0, 則

        (14)

        (15)

        盡管模糊C算法得到了較為廣泛的應(yīng)用, 但該方法也存在著不足之處: 由于模糊C聚類方法的初始聚類中心隨機確定, 當(dāng)初始聚類中心選擇不當(dāng)時會影響聚類的效率, 且很可能出現(xiàn)聚類準(zhǔn)則陷入局部最小的情況, 從而導(dǎo)致錯誤的聚類結(jié)果。

        1.4 UMAP輔助的模糊C聚類方法

        針對經(jīng)典模糊C聚類方法易陷入局部最優(yōu)的缺點, 本文首先采用均勻流形逼近與投影(UMAP)對不同樣本的太赫茲光譜數(shù)據(jù)進行降維, 再根據(jù)樣本的分布特征來確定屬于不同類別的樣本點, 以此作為初始聚類中心來進行后續(xù)的分析。 具體步驟如下:

        (1)獲得參與聚類的原始數(shù)據(jù)X(N×M), 其中N為樣本數(shù),M為高維空間的維數(shù)。

        (2)UMAP降維。 利用UMAP方法對原始數(shù)據(jù)矩陣X(N×M)進行降維, 得到反映樣本之間距離的新的特征空間Y(N×L), 其中N是樣本數(shù),L是低維空間的維數(shù)(通常取值為2或者3)。

        (3)初始聚類中心的優(yōu)化。 求出樣本在最大主方向上的投影Y1, 并將Y1的值按照由大到小排列得到新的序列Y11。 根據(jù)待處理樣本的類別數(shù)目C, 進行初始聚類中心的選取。

        (4)隸屬度的迭代計算。 利用(3)所得初始聚類中心對(2)所得新的特征空間進行聚類。 迭代過程中, 式‖Va+1-Va‖<ε中的ε代表迭代閾值。

        體驗式教學(xué)法,是指在教學(xué)過程中為了達(dá)到既定的教學(xué)目的,從教學(xué)需要出發(fā),引入、創(chuàng)造或創(chuàng)設(shè)與教學(xué)內(nèi)容相適應(yīng)的具體情境或氛圍,以引起學(xué)生的情感體驗,幫助學(xué)生迅速而正確地理解教學(xué)內(nèi)容,促進他們心理機能全面和諧發(fā)展的一種教學(xué)方法。體驗式教學(xué)法使學(xué)生身臨其境或如臨其境,一則帶給學(xué)生從形象的感知到抽象的理性的頓悟,二則激發(fā)學(xué)生的學(xué)習(xí)興趣和學(xué)習(xí)情緒,使學(xué)習(xí)活動成為自主自發(fā)的活動。同時,在教學(xué)實踐中,體驗式教學(xué)法在英語閱讀課、寫作課研究相對較多,而將其運用到語法課研究的則比較少。[1]

        本文提出方法的計算流程如圖1所示。

        圖1 基于UMAP輔助的模糊C聚類方法流程圖

        從圖1可以看出: 本文所提方法的核心是利用UMAP進行降維, 然后根據(jù)類之間距離最大化的原則來進行聚類中心的選擇, 與傳統(tǒng)方法相比, 本文所提方法可以有效避免局部最優(yōu)問題的出現(xiàn), 提高聚類的正確率。

        2 實驗部分

        如圖2所示, 采用具有45度入射的透射太赫茲系統(tǒng)進行THz數(shù)據(jù)的采集。 Toptica Photonics AG的超快飛秒激光器用于泵浦和檢測太赫茲波。 激光束用作光源, 激光被λ/2波片分為泵浦光和探測光。 較強的一束是泵浦光, 泵浦光透過分束鏡, 經(jīng)平面鏡的反射, 再依次經(jīng)過斬波器、 延遲器, 經(jīng)平面鏡反射后照射在砷化鎵(GaAs)天線上, 激發(fā)出太赫茲脈沖, 太赫茲脈沖先后經(jīng)準(zhǔn)直和聚焦, 照射待測樣品, 從而攜帶樣品信息。 較弱的一束光為探測光, 探測光經(jīng)準(zhǔn)直、 聚焦后照射在碲化鋅(ZnTe)晶體上, 經(jīng)電光取樣后, 獲得太赫茲電場。 太赫茲波聚焦照射光電二極管調(diào)制探測光, 從而使探測光的偏振方向發(fā)生改變, 期間鎖相放大器收到產(chǎn)生的調(diào)制信號。 實驗中, LabVIEW程序?qū)崿F(xiàn)對掃描臺的控制, 鎖相放大器用來對太赫茲信號進行采集。

        圖2 太赫茲時域光譜系統(tǒng)原理

        本文采用上述實驗裝置對魯棉研28、 魯棉研29、 魯棉研36、 中棉28四種不同類型的轉(zhuǎn)基因棉花種子進行探測, 獲得四種不同類型的轉(zhuǎn)基因棉花種子的吸光度光譜數(shù)據(jù), 運用UMAP輔助的模糊C聚類方法對吸光度光譜數(shù)據(jù)進行處理, 并分析不同樣本的聚類情況。

        3 結(jié)果與討論

        3.1 光譜數(shù)據(jù)采集

        實驗中為了觀察樣品對太赫茲波的吸收特征, 首先定義一個參考信號, 參考信號定義為在不放置樣品時采集到的太赫茲信號。 對采集到的數(shù)據(jù)進行光譜分析, 時域圖如圖3所示。 不難看出, 四種轉(zhuǎn)基因棉花種子相對于參考信號都發(fā)生了不同的頻率偏移。 對時域數(shù)據(jù)進行快速傅里葉變換(FFT)得到四種轉(zhuǎn)基因棉花種子的頻域圖, 如圖4所示, 可以發(fā)現(xiàn)四種轉(zhuǎn)基因棉花種子的太赫茲波的強度相對于參考信號都有所降低, 這是由于樣品對太赫茲波的吸收導(dǎo)致的。 四種轉(zhuǎn)基因棉花種子都在相同的條件下制備且實驗環(huán)境相同, 不同的只是轉(zhuǎn)基因棉花種子的型號, 因此可以說明不同型號的轉(zhuǎn)基因棉花種子對太赫茲的吸收是不同的。

        圖3 四種轉(zhuǎn)基因棉花種子時域圖

        圖4 四種轉(zhuǎn)基因棉花種子頻域圖

        實驗中, 選取的樣本的純凈度很高, 但并不是純凈物, 并且經(jīng)過研磨壓片處理的樣品, 其厚度仍有略微不同。 為了減小厚度對給后續(xù)分析帶來的影響, 采用吸光度(Absorbance)處理實驗數(shù)據(jù), 吸光度表示光波被材料吸收的程度。 吸光度公式在第2節(jié)已經(jīng)給出。 四種轉(zhuǎn)基因棉花種子的吸光度曲線如圖5所示。

        圖5 四種轉(zhuǎn)基因棉花種子吸光度

        從圖5可以看出, 魯棉研28的吸收峰值和其他三類轉(zhuǎn)基因棉花種子有較大差異, 但魯棉研29、 魯棉研36、 中棉28的吸收峰值相近, 不易區(qū)分。 因此, 需要建立數(shù)學(xué)模型對四種不同類型的轉(zhuǎn)基因棉花種子進行區(qū)分。

        3.2 聚類分析

        實驗中, 選取的實驗樣品為轉(zhuǎn)基因棉花種子。 實驗樣品共包含4個類別, 分別是魯棉研28、 魯棉研29、 魯棉研36、 中棉28, 每個類別包含30個樣本, 一共有30×4個樣本。 參與聚類的數(shù)據(jù)為四種轉(zhuǎn)基因棉花種子的吸光度數(shù)據(jù)。 首先, 對吸光度數(shù)據(jù)進行降維處理, 分別采用PCA, LLE, LPP和UMAP對吸光度矩陣進行降維。 其中算法的參數(shù)設(shè)計如下: PCA中累計方差貢獻率為0.85; LLE中的最大近鄰點的個數(shù)設(shè)置為30, 最大嵌入維數(shù)設(shè)置為3; LPP中的最大近鄰點的個數(shù)設(shè)置為30, 原始空間中兩點的距離權(quán)重系數(shù)為0(xi和xj不是近鄰點時)或1(xi和xj是近鄰點時); UMAP中設(shè)置的最大近鄰點的個數(shù)為30, 目標(biāo)嵌入維度為3, 嵌入空間中閉合兩點的間隔設(shè)為0。 不同方法降維的結(jié)果如圖6所示。

        圖6 不同降維方法下的聚類效果(三維)

        從圖6(a)—(c)可以看出, PCA, LLE以及LPP雖然實現(xiàn)了光譜數(shù)據(jù)的降維, 但是不能實現(xiàn)不同轉(zhuǎn)基因棉花種子光譜數(shù)據(jù)的準(zhǔn)確聚類, 分類的準(zhǔn)確率都為0。 通過圖6(d)發(fā)現(xiàn), UMAP的聚類效果要明顯優(yōu)于上述3種方法, 其對魯棉研28、 魯棉研29、 魯棉研36、 中棉28分類的正確率分別為0.6, 0.633 3, 0.7和0.566 7, 分類總正確率為0.625, 但是其聚類識別的精度仍然需要進一步提升。

        下面我們采用不同降維模型來優(yōu)化模糊C聚類方法, 并對吸光度數(shù)據(jù)進行處理。 經(jīng)UMAP降維后, 聚類中心的選擇結(jié)果如圖7所示。

        圖7 聚類中心的選擇

        根據(jù)樣本經(jīng)過降維后的分布特征來確定屬于不同類別的樣本點, 以此作為初始聚類中心來進行后續(xù)的模糊C聚類分析, 效果如圖8所示。

        圖8 不同降維方法輔助的模糊C聚類效果(三維)

        對比圖6和圖8可以看出, 在結(jié)合了模糊C聚類方法后, 四種方法出現(xiàn)的聚類混疊現(xiàn)象有了改善, 只出現(xiàn)了將少部分樣本聚類錯誤的情況, 由此可見PCA(LLE或LPP或UMAP)輔助的模糊C聚類方法的聚類效果要明顯好于單純的降維方法。 為了進一步驗證本文所提方法的實用性, 本文通過計算基于不同降維方法輔助的模糊C聚類方法聚類的正確率來進行比較, 其結(jié)果如表1所示。 從表1可以發(fā)現(xiàn), 在結(jié)合了模糊C聚類方法后, 不同類別的識別正確率和總正確率相對于單純的降維方法都有所提高, 說明將降維方法和模糊C聚類方法結(jié)合在太赫茲光譜識別方面具有較高的可靠性。 同時, UMAP輔助的模糊C聚類方法對魯棉研28、 魯棉研29、 魯棉研36、 中棉28的分類正確率為1, 1, 0.966 7和0.966 7, 分類總正確率達(dá)到了0.983 3, 要遠(yuǎn)遠(yuǎn)高于前三者, 說明本文所提出的方法具有極大的優(yōu)勢, 可靠性更高。

        表1 不同降維方法輔助的模糊C聚類的正確率

        4 結(jié) 論

        針對太赫茲對轉(zhuǎn)基因作物進行鑒別過程中, 存在過程復(fù)雜、 準(zhǔn)確率不高的問題, 本文提出基于UMAP輔助的模糊C聚類方法用來進行太赫茲光譜識別。 (1)與傳統(tǒng)方法相比, 本文的創(chuàng)新點是將UMAP與模糊C理論相結(jié)合, 用UMAP對吸光度數(shù)據(jù)進行降維, 然后根據(jù)類與類之間距離最大化的原則, 選擇初始聚類中心從而實現(xiàn)模糊C聚類。 (2)為了驗證本文所提方法的可靠性, 采用太赫茲時域光譜技術(shù)對四種轉(zhuǎn)基因棉花種子進行測量, 并對得到的四種轉(zhuǎn)基因棉花種子的吸光度數(shù)據(jù)進行聚類分析。 (3)通過與PCA, LLE, LPP及傳統(tǒng)模糊C聚類方法處理的結(jié)果進行對比, 發(fā)現(xiàn)本文所提方法的聚類效果明顯要好于其他方法, 說明UMAP輔助的模糊C聚類方法與THz光譜相結(jié)合是轉(zhuǎn)基因棉花種子無損檢測的潛在識別工具。

        猜你喜歡
        赫茲降維時域
        Three-Body’s epic scale and fiercely guarded fanbase present challenges to adaptations
        降維打擊
        海峽姐妹(2019年12期)2020-01-14 03:24:40
        基于時域信號的三電平逆變器復(fù)合故障診斷
        基于雙頻聯(lián)合處理的太赫茲InISAR成像方法
        太赫茲低頻段隨機粗糙金屬板散射特性研究
        太赫茲信息超材料與超表面
        基于極大似然準(zhǔn)則與滾動時域估計的自適應(yīng)UKF算法
        基于時域逆濾波的寬帶脈沖聲生成技術(shù)
        基于時域波形特征的輸電線雷擊識別
        電測與儀表(2015年2期)2015-04-09 11:28:50
        拋物化Navier-Stokes方程的降維仿真模型
        計算物理(2014年1期)2014-03-11 17:00:18
        中文人妻av大区中文不卡 | 亚洲av不卡一区二区三区| 又污又黄又无遮挡的网站| 亚洲 暴爽 AV人人爽日日碰 | 精品亚洲第一区二区三区| 国产成人综合亚洲看片| 国产偷窥熟女精品视频| 亚洲熟伦在线视频| 久久久国产精品黄毛片| 啦啦啦中文在线观看日本| 色综合久久久久久久久五月| 国产精品无码久久AⅤ人妖| 一级老熟女免费黄色片| 公和我做好爽添厨房中文字幕| 国产成人精品午夜福利| 国产粉嫩美女一区二区三| 亚洲国产精品久久婷婷| 午夜福利啪啪片| 久久久久中文字幕精品无码免费| 精品日韩av专区一区二区 | 国产精品午夜福利亚洲综合网| 伊人久久大香线蕉av不变影院| 在线亚洲欧美日韩精品专区| 成年女人在线观看毛片| 国产91极品身材白皙| 亚洲国产精品无码久久| 国产精品原创巨作AV女教师| 中文字幕av久久激情亚洲精品| 亚洲成人中文字幕在线视频| a级大胆欧美人体大胆666| 精品少妇爆乳无码aⅴ区| 国产精品久久av高潮呻吟| 国产激情无码一区二区| 久久国产精品波多野结衣av| 国产毛片三区二区一区| 亚洲中文久久精品字幕| 国精无码欧精品亚洲一区| 久久青草国产免费观看| 久久久精品人妻一区二区三区游戏| 亚洲avav天堂av在线网毛片| 国产成人户外露出视频在线|