張倩 呂坤山 趙先慶 李瑞杰
摘 要:【目的】中國古代利用外來玻璃制作工藝制作出的玻璃制品,其化學(xué)成分與外界傳入的并不相同。古代玻璃易受環(huán)境影響而被風(fēng)化,內(nèi)部元素和外部元素進(jìn)行大量交換,成分比例會(huì)因此發(fā)生變化。通過分析玻璃類型等外部因素與表面風(fēng)化的相關(guān)性及玻璃組成成分與表面風(fēng)化的相關(guān)性,找出玻璃表面風(fēng)化原因?!痉椒ā客ㄟ^分析玻璃外部因素的相關(guān)性和對玻璃進(jìn)行獨(dú)立樣本Mann-Whitney檢驗(yàn),得到玻璃制品的成分,基于隨機(jī)森林建立模型,構(gòu)建不同分類標(biāo)準(zhǔn)?!窘Y(jié)果】研究發(fā)現(xiàn),玻璃制品紋飾等與表面風(fēng)化的相關(guān)性較弱,與二氧化硅等玻璃制品的相關(guān)性大,且氧化鉛成分在玻璃中的重要性最大?!窘Y(jié)論】要防止玻璃發(fā)生風(fēng)化,就要減少雜質(zhì)成分。
關(guān)鍵詞:獨(dú)立樣本檢驗(yàn);機(jī)器學(xué)習(xí)分類-隨機(jī)森林;聚類分析;相關(guān)性分析
中圖分類號:TP181? ? ?文獻(xiàn)標(biāo)志碼:A? ? ?文章編號:1003-5168(2023)09-0019-04
Abstract:[Purposes] The chemical composition of glass products produced by absorbing foreign glass production processes in ancient China is not the same as that imported from the outside world. Ancient glass is susceptible to environmental impact and is prone to being weathered. The internal elements and external elements are exchanged in large quantities, and the composition ratio will change accordingly. By analyzing the correlation between external factors such as glass type and surface weathering and the correlation between glass composition and surface weathering, the reasons for glass surface weathering are found. [Methods] Firstly, the correlation analysis of external factors of glass was carried out, and then the independent sample Mann-Whitney test analysis was carried out to obtain the composition of glass products. Based on the random forest model, different classification criteria were constructed. [Findings] It is found that the correlation between the decoration of glass products and surface weathering is weak, and the correlation with glass products such as silica is strong, and the lead oxide composition is the most important influence factor in glass. [Conclusions] The impurity components should be reduced to prevent the glass from weathering.
Keywords: independent sample testing; machine learning classification-Random Forest; cluster analysis;correlation analysis
0 引言
在中國玻璃發(fā)展史上,裝飾藝術(shù)玻璃制品因獨(dú)具特色的形制、紋飾和工藝,成為世界玻璃發(fā)展史上一顆璀璨的明珠[1]。中國古代匠人在吸收西方玻璃制作技術(shù)后,就地取材制作玻璃制品。因此,我國玻璃制品雖與國外玻璃制品外觀相似,其化學(xué)成分卻截然不同[2]。制作玻璃的主要原料是石英砂,主要化學(xué)成分是二氧化硅(SiO2)。在鉛鋇玻璃中,氧化鉛(PbO)、氧化鋇(BaO)的含量較高。古代玻璃極易受埋藏環(huán)境的影響而發(fā)生風(fēng)化,其成分比例發(fā)生變化,導(dǎo)致無法對玻璃類別進(jìn)行正確判斷。需要對玻璃成分進(jìn)行分析,探尋其風(fēng)化程度及成分之間的關(guān)聯(lián)程度。
1 問題分析
問題一:對玻璃文物表面風(fēng)化程度及玻璃類型、紋飾、顏色相關(guān)性進(jìn)行分析,分析文物樣品表面有無風(fēng)化化學(xué)成分含量及預(yù)測風(fēng)化前的化學(xué)成分含量。問題二:尋找高鉀類[3]玻璃、鉛鋇類[3]玻璃的分類規(guī)律,對其化學(xué)成分選擇合適的亞類進(jìn)行劃分,分析分類結(jié)果的合理性和敏感性。問題三:對未知類別玻璃的化學(xué)成分進(jìn)行分析與分類,分析分類結(jié)果的敏感性。問題四:分析兩種玻璃文物樣品的化學(xué)成分關(guān)系,比較兩者的差異性。
2 模型假設(shè)
為便于模型構(gòu)建,作出以下兩個(gè)假設(shè)。①古代玻璃受環(huán)境影響,導(dǎo)致其化學(xué)成分改變,為分析風(fēng)化、表面變色對玻璃化學(xué)成分的影響,假設(shè)玻璃僅存在風(fēng)化和表面變色。②隨著時(shí)間推移,玻璃可能會(huì)被人為破壞或修補(bǔ),導(dǎo)致分析過程中存在不準(zhǔn)確的情形。為便于對成分進(jìn)行分析,假設(shè)玻璃文物未受到人為破壞或修補(bǔ)。
3 模型建立與求解
3.1 數(shù)據(jù)預(yù)處理
根據(jù)相關(guān)研究可知,成分比例累加和在85%~105%的數(shù)據(jù)可視為有效數(shù)據(jù)。經(jīng)觀察可知,在玻璃風(fēng)化過程中,SiO2 的凈含量不變[4]。需要特別指出的是,空白處表示未檢測到該成分,并不是缺失值,應(yīng)將檢測到的成分賦“0”值處理。
3.2 問題一求解
3.2.1 表面風(fēng)化與定類變量間的差異化卡方檢驗(yàn)。通過觀察數(shù)據(jù),使用SPSSPro軟件進(jìn)行分析,發(fā)現(xiàn)類型、紋理、顏色和表面風(fēng)化為定類變量,多組定類變量應(yīng)采用差異性分析卡方檢驗(yàn)。將類型、紋理、顏色分別與表面風(fēng)化進(jìn)行差異性分析,結(jié)果見表1。
由表1可知,基于類型和表面風(fēng)化,檢驗(yàn)得到的P值為0.020 *,水平上呈現(xiàn)顯著性,拒絕原假設(shè),因此類型和表面風(fēng)化數(shù)據(jù)存在顯著性差異;基于紋飾和表面風(fēng)化,檢驗(yàn)得到的P值為0.056 **,水平上不呈現(xiàn)顯著性,接受原假設(shè),因此紋飾和表面風(fēng)化數(shù)據(jù)不存在顯著性差異;基于顏色和表面風(fēng)化,檢驗(yàn)得到的P值為0.507,水平上不呈現(xiàn)顯著性,接受原假設(shè),因此顏色和表面風(fēng)化數(shù)據(jù)不存在顯著性差異。
3.2.2 量化效應(yīng)分析。采用phi、Crammer's V、列聯(lián)系數(shù)和lambda指標(biāo)來分析樣本的相關(guān)程度,在此基礎(chǔ)上進(jìn)行效應(yīng)量化分析,得出表面風(fēng)化和三個(gè)定類變量的相關(guān)程度。效應(yīng)量化分析結(jié)果見表2。
由2可知,類型對應(yīng)的Cramer's V值為0.316,即類型和表面風(fēng)化的差異程度為中等程度差異;紋飾對應(yīng)的Cramer's V值為0.326,即紋飾和表面風(fēng)化的差異程度為中等程度差異;顏色對應(yīng)的Cramer's V值為0.341,即顏色和表面風(fēng)化的差異程度為中等程度差異。
通過對玻璃表面風(fēng)化與風(fēng)化化學(xué)成分含量的獨(dú)立樣本Mann-Whitney檢驗(yàn),得到中位數(shù)、統(tǒng)計(jì)量、效應(yīng)量Cohen's d等的相關(guān)值。通過P值與顯著性水平0.05的比較,得到幾種主要的風(fēng)化化學(xué)成分,即二氧化硅差異幅度中等、SrO差異幅度中等、PbO差異幅度非常大、氧化鋁差異幅度較小、氧化鉀差異幅度非常大。由于二氧化硅、SrO、氧化鉛、氧化鋁和氧化鉀對應(yīng)的P值均小于0.05,所以風(fēng)化與這五種化學(xué)成分的含量呈正相關(guān)。
3.2.3 五種主要風(fēng)化化學(xué)成分的分類匯總描述性分析。分析五種風(fēng)化化學(xué)成分分類匯總結(jié)果,計(jì)算出樣本量、最大值、最小值等統(tǒng)計(jì)量,研究分組后定量數(shù)據(jù)的整體情況,得到各成分在不同玻璃類型中的比重。經(jīng)分析后發(fā)現(xiàn),高鉀玻璃風(fēng)化后,二氧化硅的含量會(huì)顯著增加,其他四種化學(xué)成分會(huì)相應(yīng)降低。鉛鋇玻璃風(fēng)化后,氧化鉛、氧化鋁及氧化鍶的含量會(huì)有些許增加,二氧化硅和氧化鉀的含量會(huì)降低。
3.3 問題二求解
3.3.1 隨機(jī)森林分類。各特征(自變量)的重要性比例如圖1所示。由圖1可知,氧化鉛的重要性是最大的。通過以下步驟對所有特征進(jìn)行隨機(jī)森林分類。①基于訓(xùn)練集數(shù)據(jù)建立隨機(jī)森林分類模型;②基于建立的隨機(jī)森林來計(jì)算特征重要性;③將建立的隨機(jī)森林分類模型用于訓(xùn)練、測試數(shù)據(jù),得到模型的分類評估結(jié)果;④由于隨機(jī)森林具有隨機(jī)性,每次運(yùn)算結(jié)果都不一樣。若保存本次訓(xùn)練模型,后續(xù)可直接上傳數(shù)據(jù)代入到本次訓(xùn)練模型中進(jìn)行計(jì)算分類。
3.3.2 聚類分析。變量類型的聚類匯總?cè)鐖D2所示。由圖2可知,在聚類分析劃分類別時(shí)存在顯著性差異,對氧化鉀、氧化鉛、氧化鋇、氧化硅、氧化鈉、氧化鋁、氧化磷、氧化鍶進(jìn)行聚類分析劃分時(shí),類別間存在顯著性差異;對氧化鎂、氧化鈣、二氧化硫、氧化鐵、氧化錫、氧化銅在進(jìn)行聚類分析劃分時(shí),類別間不存在顯著性差異。由圖2可知,聚類結(jié)果共分兩類,聚類類別1的頻數(shù)為35,所占百分比為52.24%;聚類類別2的頻數(shù)為32,所占百分比為47.76%。
3.4 問題三求解
根據(jù)已有數(shù)據(jù)建立文物類型和各種成分含量散點(diǎn)分布,如圖3所示。由圖3可知,序號為2、3、4、5、8的文物為鉛鋇類[3]文物。
3.5 問題四求解
建立灰度關(guān)聯(lián)分析模型,關(guān)聯(lián)系數(shù)值見表3。
結(jié)合關(guān)聯(lián)度數(shù)值,對所有評價(jià)項(xiàng)進(jìn)行排序,得到各評價(jià)項(xiàng)排名。氧化鋁的評價(jià)最高(關(guān)聯(lián)度為0.831),其次是氧化銅(關(guān)聯(lián)度為0.768)。
對定量變量氧化鈣、氧化銅、氧化鋁、氧化鉛、五氧化二磷、氧化鍶、氧化鋇進(jìn)行描述性統(tǒng)計(jì)和正態(tài)性檢驗(yàn),分析不同成分的量化結(jié)果。其中,氧化銅、氧化鋁、氧化鍶、氧化鋇不滿足正態(tài)分布,其余均滿足正態(tài)分布,水平上不呈現(xiàn)顯著性。數(shù)據(jù)不全滿足正態(tài)分布,若正態(tài)圖基本上呈現(xiàn)鐘形(中間高、兩端低),說明數(shù)據(jù)雖不是絕對正態(tài),但基本可接受為正態(tài)分布。對所有足量變量進(jìn)行方差齊性檢驗(yàn),方差齊性檢驗(yàn)結(jié)果顯示,氧化鉛、氧化鍶、氧化鋇數(shù)據(jù)不滿足方差齊性。相關(guān)性分析結(jié)果說明,高鉀、鉛鋇玻璃在氧化鈣、氧化鋁、氧化鉛、氧化鍶、氧化鋇存在顯著差異,氧化銅、五氧化二磷不存在顯著差異。
4 模型評價(jià)
4.1 隨機(jī)森林模型優(yōu)點(diǎn)
隨機(jī)森林是常見樹結(jié)構(gòu)機(jī)器學(xué)習(xí)方法,具有對異常值和噪聲的高容忍度、不易出現(xiàn)過擬合等優(yōu)點(diǎn)。隨機(jī)森林模型的準(zhǔn)確率極高,能在大數(shù)據(jù)集上運(yùn)行,通過引入隨機(jī)性,不易過擬合,也具有很好的抗噪聲能力,但在數(shù)據(jù)噪聲較大時(shí)會(huì)出現(xiàn)過擬合。隨機(jī)森林模型能處理很高維度的數(shù)據(jù),不用降維,能處理離散型數(shù)據(jù)和連續(xù)型數(shù)據(jù),不用將數(shù)據(jù)集進(jìn)行規(guī)范化。
4.2 隨機(jī)森林模型缺點(diǎn)
雖然隨機(jī)森林算法足夠快,但當(dāng)隨機(jī)森林中的決策樹個(gè)數(shù)很多時(shí),訓(xùn)練所需的空間和時(shí)間就會(huì)變大,導(dǎo)致模型運(yùn)行緩慢。在實(shí)際應(yīng)用中,遇到實(shí)時(shí)性要求很高的情況,最好選擇其他算法。
5 結(jié)語
本研究基于隨機(jī)森林模型對高鉀玻璃和鉛鋇玻璃成分進(jìn)行分析,分析其風(fēng)化程度和變色程度對玻璃成分變化的影響及不同因素(如紋飾等)對玻璃成分的影響。在對古代玻璃成分進(jìn)行分析時(shí),發(fā)現(xiàn)鉛鋇容易風(fēng)化而高鉀不容易風(fēng)化。建立隨機(jī)森林模型,得到氧化鉛的重要性最大。通過對分類結(jié)果的敏感性及各成分間的關(guān)聯(lián)性進(jìn)行分析,可以看出,要想防止風(fēng)化等影響玻璃制品,就要減少雜質(zhì)成分。
參考文獻(xiàn):
[1]何媛媛.中國當(dāng)代裝飾藝術(shù)玻璃設(shè)計(jì)研究[D].武漢:武漢理工大學(xué),2015.
[2]殷宇龍.通過關(guān)聯(lián)預(yù)測對古代玻璃制品成分分析[J].當(dāng)代化工研究,2023(1):122-126.
[3]顧亮亮,周靜.關(guān)于中國古代玻璃藝術(shù)研究的幾個(gè)問題[J].藝術(shù)與設(shè)計(jì):理論版,2021(4):112-114.
[4]王承遇,陶瑛.硅酸鹽玻璃的風(fēng)化[J].硅酸鹽學(xué)報(bào),2003(1):78-85.