雷 蕾,滕亞君,劉汗青,閔 紅,祖恩東
(1.昆明理工大學(xué)材料科學(xué)與工程學(xué)院,云南昆明 650093;2.昆明海關(guān)技術(shù)中心,云南昆明 650228;3.上海出入境檢驗(yàn)檢疫局工業(yè)品與原材料檢測(cè)技術(shù)中心,上海 200135)
翡翠被譽(yù)為“玉石之王”,具有獨(dú)特的文化魅力和經(jīng)濟(jì)價(jià)值。國(guó)際珠寶市場(chǎng)寶石級(jí)翡翠主要產(chǎn)自緬甸、俄羅斯、危地馬拉、哈薩克斯坦以及日本。緬甸一直是寶石級(jí)翡翠最主要的產(chǎn)出國(guó),全球98% 的翡翠都產(chǎn)自于緬甸[1]。緬甸按行政區(qū)和地理位置將翡翠礦床劃分為8 大場(chǎng)區(qū),從方向上分為3 個(gè)礦帶,其中位于最西北部的后江—雷打礦帶為帝王綠翡翠主要產(chǎn)區(qū);中部的帕敢—道茂礦帶既有原生礦又有次生礦,是緬甸最重要的翡翠產(chǎn)區(qū)。
翡翠產(chǎn)地相關(guān)研究有:張智宇等[2]利用偏光顯微鏡、電子探針對(duì)危地馬拉硬玉礦區(qū)的硬玉巖、硬玉化綠輝巖進(jìn)行測(cè)試研究,闡述危地馬拉硬玉巖成因;Mitrani 等[3]通過(guò)無(wú)損光譜和微離子束分析技術(shù)對(duì)危地馬拉翡翠進(jìn)行鑒別分析,闡述該產(chǎn)地翡翠物相特征;鄭亭[4]利用陰極發(fā)光、X 射線(xiàn)粉晶衍射、紫外可見(jiàn)光光譜法對(duì)危地馬拉翡翠進(jìn)行測(cè)試分析,得到該產(chǎn)地翡翠的寶石學(xué)特征以及顏色成因和譜學(xué)特征;趙玥[5]利用偏光顯微鏡、傅里葉紅外光譜儀等儀器對(duì)俄羅斯翡翠的礦物學(xué)特征進(jìn)行研究,探討俄羅斯翡翠成礦過(guò)程以及次生礦物對(duì)翡翠品質(zhì)的影響;鄒妤等[6]利用電子探針對(duì)緬甸、俄羅斯、哈薩克斯坦翡翠的結(jié)構(gòu)特征及成礦過(guò)程進(jìn)行對(duì)比研究;陳慕雨[7]利用傅里葉紅外光譜儀、X 射線(xiàn)粉晶衍射儀和激光共焦顯微拉曼光譜儀對(duì)3 種不同組分的硬玉巖進(jìn)行分析,得到硬玉巖顯示硬玉的紅外光譜圖,綠輝—硬玉巖顯示類(lèi)似的硬玉紅外光譜圖,當(dāng)類(lèi)質(zhì)同相替代中置換的陽(yáng)離子半徑小于Na+、Al3+時(shí),紅外光譜圖中部分波段的吸收峰和譜帶會(huì)向低頻方向偏移;王亞軍等[8]利用電子探針和傅里葉紅外光譜儀對(duì)緬甸不同化學(xué)成分的翡翠紅外光譜特征進(jìn)行分析,鑒別在低波數(shù)區(qū)域的紅外吸收峰波數(shù)<422.75cm-1、<574.5cm-1、<658.7cm-1為綠輝石質(zhì)翡翠,反之則為硬玉質(zhì)翡翠;刑瑩瑩[9]利用電子探針及傅里葉紅外光譜儀等儀器分析得出合成翡翠紅外光譜的指紋區(qū)、v(M/Cr-O)伸縮振動(dòng)和vas(M-OH)伸縮振動(dòng)導(dǎo)致的吸收譜帶與天然翡翠存在很大差異。
目前對(duì)翡翠產(chǎn)地鑒定技術(shù)系統(tǒng)性研究較少,主要使用電子探針、X 射線(xiàn)粉晶衍射儀、紅外光譜測(cè)試等方法,這類(lèi)鑒別方法不能直接得到準(zhǔn)確的分析結(jié)果,后期需大量的人力分析,且樣品前處理方法繁瑣,分析檢測(cè)時(shí)間長(zhǎng),不能實(shí)現(xiàn)對(duì)大批量樣品的快速檢測(cè)鑒別。PCA-Fisher 判別分析法(FDA)和PCA-BP 神經(jīng)網(wǎng)絡(luò)模型以其高效、快速、良好的自學(xué)性等優(yōu)勢(shì)廣泛應(yīng)用于食品、經(jīng)濟(jì)、醫(yī)藥、礦井安全評(píng)價(jià)等行業(yè),但在寶玉石產(chǎn)地鑒別方面應(yīng)用較少。本文以緬甸4 個(gè)主要場(chǎng)口隆肯、帕敢、達(dá)木坎、雷打翡翠為研究對(duì)象,建立基于PCA-Fisher 分析(FDA)和PCA-BP 神經(jīng)網(wǎng)絡(luò)的翡翠產(chǎn)地判別模型,將不同模型鑒別效果進(jìn)行對(duì)比,為海關(guān)檢驗(yàn)監(jiān)管提供一種高效方法。
Fisher 判別分析為一種線(xiàn)性判別方法,主要將K組P維數(shù)據(jù)投影在某個(gè)方向,盡可能使數(shù)據(jù)投影組與組之間分開(kāi),以方差分析思想構(gòu)造判別式。方式為將新樣品X的P個(gè)指標(biāo)代入判別式得到y(tǒng)值,將其與判別分界點(diǎn)比較后進(jìn)行判別歸類(lèi)[10-13]。
設(shè)模型總體為G1,G2,…,Gk,其協(xié)方差矩陣為S1,S2…,Sk,均值向量為M1,M2…,Mk。考慮X∈Gi(i=1,2,…,m),其線(xiàn)性函數(shù)為:
根據(jù)隨機(jī)變量的線(xiàn)性組合方差和均值性質(zhì),可得Y在Gi中的方差與均值為:
令Y在Gi中均值yi的離差平方和為b,方差之和為e,則:
b為方差分析中的組間差,可反映均值yi間的離散程度,e為組內(nèi)差,反映Y在類(lèi)中方差之和,離散程度b越大或方差之和e越小,G1,G2,…,Gk就越能分開(kāi)。根據(jù)方差分析思想,選擇使的u為判別函數(shù)Y的系數(shù)向量,得到(E-1B) 最大特征值λ對(duì)應(yīng)的特征向量u,即可建立判別函數(shù)Y=uT x。
BP 神經(jīng)網(wǎng)絡(luò)即多層前饋人工神經(jīng)網(wǎng)絡(luò),也稱(chēng)為誤差反向傳播神經(jīng)網(wǎng)絡(luò)。BP 神經(jīng)網(wǎng)絡(luò)有很好的學(xué)習(xí)、非線(xiàn)性映射及自學(xué)習(xí)功能,具有輸入信號(hào)正向傳播,誤差反向傳播特點(diǎn)。輸入信號(hào)參數(shù)從輸入層輸入經(jīng)隱藏層處理,由輸出層輸出信號(hào)完成前向傳播,當(dāng)輸出信號(hào)不能滿(mǎn)足輸出要求則轉(zhuǎn)向誤差逆向傳播[14-17]。BP 神經(jīng)網(wǎng)絡(luò)不受非線(xiàn)性模型限制,有很強(qiáng)的非線(xiàn)性映射能力,能很好解決信息少、數(shù)據(jù)少、不確定性問(wèn)題,應(yīng)用十分廣泛。BP 神經(jīng)網(wǎng)絡(luò)主要由輸入層、隱含層、輸出層3 層神經(jīng)元組成,其中隱含層可以有多層,其訓(xùn)練步驟如下:
(1)網(wǎng)絡(luò)初始化。模型輸入層輸出層隱含層各神經(jīng)元之間連接權(quán)值Wij、Wjk,隱含層輸出層閾值a、b,設(shè)定神經(jīng)元激勵(lì)函數(shù)與學(xué)習(xí)速率。
(2)隱含層神經(jīng)元輸出。計(jì)算如下:
(3)輸出層輸出。計(jì)算如下:
(4)誤差計(jì)算。當(dāng)達(dá)到輸出要求立即結(jié)束訓(xùn)練,不滿(mǎn)足則繼續(xù)下一步。
(5)更新網(wǎng)絡(luò)結(jié)構(gòu)閾值和權(quán)值。不斷修正權(quán)值和閾值,直到滿(mǎn)足期望輸出要求。
本文選取緬甸市場(chǎng)上流行的4 個(gè)場(chǎng)口翡翠,即隆肯、帕敢、達(dá)木坎、雷打。
(1)模型變量選擇。以不同場(chǎng)口翡翠電子探針成分結(jié)果(見(jiàn)表1)為變量,總共包含30 個(gè)樣品。本文采用主成分分析法實(shí)現(xiàn)數(shù)據(jù)的降維處理,提取其中主成分,從而提高模型的效率和穩(wěn)定性。
Table 1 Chemical composition of jadeite samples表1 翡翠樣品化學(xué)成分
(2)電子探針測(cè)試。實(shí)驗(yàn)儀器型號(hào):EPMA-1600 電子探針?lè)治鰞x。測(cè)試條件:加速電壓為20KV,電流為1×10-8A,出射角為52.5°,分析方法為波譜分析,修正方法為ZAF。
為探索電子探針成分結(jié)果對(duì)不同產(chǎn)地翡翠的判別效率,對(duì)其進(jìn)行PCA 分析。主成分分析法在分析處理高維數(shù)據(jù)時(shí)主要采用降維思想,將能代表整體數(shù)據(jù)樣本的多個(gè)變量指標(biāo)通過(guò)投影提取轉(zhuǎn)化為極少數(shù)變量指標(biāo),使用極少數(shù)變量指標(biāo)就能反應(yīng)整個(gè)原始樣本數(shù)據(jù)大量信息,所有主成分即原始標(biāo)量指標(biāo)的線(xiàn)性組合。在分析復(fù)雜變量數(shù)據(jù)時(shí),提取其主成分進(jìn)行分析,從而達(dá)到簡(jiǎn)化分析模型的目的[18-20]。表2 為前3 個(gè)主成分變量累計(jì)貢獻(xiàn)率。由此可知,不同產(chǎn)地翡翠樣品的主要化學(xué)成分基本相似,但是化學(xué)成分含量有一定差異。主成分分析提取的主成分按照其貢獻(xiàn)率大小排序,前3 個(gè)主成分的累計(jì)方差貢獻(xiàn)率達(dá)到78.681%,表明前3 個(gè)主成分基本可以反映總體數(shù)據(jù)信息。第一主成分貢獻(xiàn)率44.192%,第二主成分貢獻(xiàn)率為18.754%,第三主成分貢獻(xiàn)率為15.735%。確定好主成分個(gè)數(shù)及貢獻(xiàn)率后,即可通過(guò)PCA 方法降低翡翠成分元素?cái)?shù)據(jù)的維數(shù)。
Table 2 Cumulative contribution rate of principal components表2 主成分累計(jì)貢獻(xiàn)率
本研究在主成分分析基礎(chǔ)上,對(duì)不同場(chǎng)口的翡翠采用Fisher 判別分析、BP 神經(jīng)網(wǎng)絡(luò)模型分析方法,分別建立判別模型。
2.2.1 Fisher 判別分析
通過(guò)對(duì)不同產(chǎn)地翡翠的化學(xué)成分PCA 分析結(jié)果可以得出,僅利用主成分分析對(duì)翡翠產(chǎn)地進(jìn)行判別不可行,因此建立PCA-Fisher 判別模型對(duì)不同場(chǎng)口翡翠進(jìn)行判別預(yù)測(cè)。
達(dá)木坎、帕敢、隆肯、雷打翡翠的判別模型分別如下:
利用該模型對(duì)不同場(chǎng)口翡翠樣品進(jìn)行判別分析,結(jié)果如表3 所示。由表3 可知,PCA-Fisher 判別模型對(duì)達(dá)木坎、帕敢、隆肯、雷打翡翠的正確判別率分別為71.4%、55.6%、50%、50%。所有樣品的綜合正確率為56.75%,正確率較低,表明該判別模型整體可靠性較低,僅對(duì)達(dá)木坎產(chǎn)地樣品具有較好的預(yù)測(cè)判別效果,對(duì)帕敢、隆肯、雷打場(chǎng)口的翡翠誤判概率較大。
Table 3 Identification results of jadeite origin表3 翡翠產(chǎn)地鑒別結(jié)果
2.2.2 BP 判別分析
在BP 神經(jīng)網(wǎng)絡(luò)模型中,將主成分分析提取的3 個(gè)主成分作為BP 神經(jīng)網(wǎng)絡(luò)模型的輸入數(shù)據(jù),因此輸入層節(jié)點(diǎn)為3;將翡翠不同場(chǎng)口作為輸出數(shù)據(jù),因此輸出層節(jié)點(diǎn)為4;隱藏層含3 個(gè)節(jié)點(diǎn)。選擇雙曲正切函數(shù)作為隱藏層激活函數(shù),Softmax 作為輸出層激活函數(shù),最終建立3∶3∶4 的3 層BP 神經(jīng)網(wǎng)絡(luò)模型。訓(xùn)練組樣本為原始樣本,共計(jì)30個(gè),另在達(dá)木坎、帕敢、隆肯、雷打的原始樣本中按每個(gè)場(chǎng)口選取3 個(gè)樣本作為檢驗(yàn)組樣本共計(jì)12 個(gè)。
實(shí)驗(yàn)結(jié)果如表4 所示。訓(xùn)練組中,PCA-BP 神經(jīng)網(wǎng)絡(luò)模型對(duì)7 個(gè)達(dá)木坎樣品進(jìn)行判別,將1 個(gè)達(dá)木坎場(chǎng)口樣品分別誤判為帕敢場(chǎng)口,鑒別準(zhǔn)確率為85.7%。該模型對(duì)9個(gè)帕敢樣品進(jìn)行判別,將兩個(gè)帕敢場(chǎng)口樣品誤判為隆肯、雷打場(chǎng)口,鑒別準(zhǔn)確率為77.7%。該模型對(duì)8 個(gè)隆肯場(chǎng)口樣品進(jìn)行判別,將2 個(gè)隆肯場(chǎng)口樣品誤判為帕敢場(chǎng)口,鑒別準(zhǔn)確率為75%。該模型對(duì)6 個(gè)雷打場(chǎng)口翡翠進(jìn)行判別,將1 個(gè)雷打場(chǎng)口樣品誤判為達(dá)木坎場(chǎng)口,鑒別準(zhǔn)確率為83.3%。訓(xùn)練組綜合準(zhǔn)確判別率為80.4%。檢驗(yàn)組總樣品判別正確率100%,表明PCA-BP 神經(jīng)網(wǎng)絡(luò)模型對(duì)不同場(chǎng)口翡翠判別準(zhǔn)確率、可靠性高。BP 神經(jīng)網(wǎng)絡(luò)模型較強(qiáng)的映射和自學(xué)特點(diǎn),結(jié)合主成分分析方法減少參數(shù)之間的關(guān)聯(lián)性,利用自學(xué)能力不斷通過(guò)數(shù)據(jù)優(yōu)化修正模型,使鑒別精度相對(duì)PCA-FAD 模型大大提高[21-23]。
Table 4 Identification results of jadeite origin表4 翡翠產(chǎn)地鑒別結(jié)果
本文采用PCA-Fisher 判別法和PCA-BP 神經(jīng)網(wǎng)絡(luò)分析方法對(duì)不同產(chǎn)地翡翠礦物化學(xué)成分進(jìn)行鑒別分類(lèi)實(shí)驗(yàn)。
(1)在PCA-Fisher 判別模型下,達(dá)木坎、帕敢、隆肯、雷打場(chǎng)口翡翠的正確判別率分別為71.4%、55.6%、50%、50%,總樣品正確判別率為56.75%,準(zhǔn)確率低,表明該模型鑒別預(yù)測(cè)效果不理想。
(2)在PCA-BP 神經(jīng)網(wǎng)絡(luò)模型下,訓(xùn)練組達(dá)木坎、帕敢、隆肯、雷打場(chǎng)口翡翠準(zhǔn)確判別率分別為85.7%、77.7%、75%、83.3%,訓(xùn)練組綜合判別準(zhǔn)確率為80.4%,檢驗(yàn)組正確率均為100%,表明該模型應(yīng)用于翡翠產(chǎn)地快速鑒別可行,具有很好的鑒別預(yù)測(cè)效果和應(yīng)用前景。
(3)PCA-BP 神經(jīng)網(wǎng)絡(luò)判別方法與傳統(tǒng)寶石學(xué)鑒定相比,執(zhí)行效率高,操作簡(jiǎn)便,移植性強(qiáng),能滿(mǎn)足翡翠產(chǎn)地鑒別工作。為提高模型預(yù)測(cè)精度和應(yīng)用廣泛性,在后續(xù)工作中,需要收集更多產(chǎn)地翡翠的礦物化學(xué)成分?jǐn)?shù)據(jù)資料,對(duì)模型進(jìn)行不斷擴(kuò)充與優(yōu)化,提高模型鑒別可靠度。后續(xù)將建立系統(tǒng)化模型標(biāo)準(zhǔn),為翡翠產(chǎn)地鑒別提供高效可靠的新方法。