翟司潯
(河北經(jīng)貿(mào)大學(xué)信息技術(shù)學(xué)院,河北 石家莊 050000)
玻璃的主要原材料是石英砂,化學(xué)成分為二氧化硅及其他氧化物。純石英砂熔點(diǎn)較高,淬煉時(shí)需要添加助熔劑,降低熔化溫度。草木灰、硝石和鉛礦石是過去常用的助熔劑,需添加石灰石作為穩(wěn)定劑,煅燒后的主要成分為氧化鈣。由于添加的助熔劑不同,其主要化學(xué)成分也不同。
玻璃風(fēng)化情況與埋藏環(huán)境有著極大的關(guān)系,風(fēng)化過程中玻璃內(nèi)部元素與環(huán)境中的元素反應(yīng),導(dǎo)致成分比例發(fā)生變化,會(huì)影響對(duì)類型的判斷。無風(fēng)化的玻璃制品可明顯看到表面的紋飾、顏色及圖案等,但不排除輕微風(fēng)化情況。風(fēng)化嚴(yán)重的玻璃制品表面會(huì)裸露出大面積的灰黃色區(qū)域,是明顯的風(fēng)化層。通過數(shù)學(xué)建模對(duì)其進(jìn)行研究,可使文物研究更加科學(xué)有效,促進(jìn)玻璃制品的生產(chǎn)制造。
由圖1可知,無風(fēng)化的文物樣品-高鉀玻璃的二氧化硅含量最高,占60%以上,其他各元素含量均低于20%,其中氧化鎂、氧化鉛、氧化鋇、五氧化二磷、氧化鍶、氧化錫、二氧化硫含量均低于2%左右。風(fēng)化的文物樣品-高鉀玻璃的二氧化硅含量最高,占90%以上,遠(yuǎn)高于其他化學(xué)成分,基本無法檢測(cè)到氧化鈉、氧化鉛、氧化鋇、氧化鍶、氧化錫、二氧化硫的含量。
圖1 有無風(fēng)化的高鉀玻璃化學(xué)成分含量統(tǒng)計(jì)Fig.1 Statistics of the chemical composition of high potassium glass with or without weathering
使用SPSS 26.0得到的卡方檢驗(yàn)值如表1所示:
表1 卡方檢驗(yàn)Tab.1 Chi-square test
類型*表面風(fēng)化Pearson卡方P1=0.009<0.05,拒絕原假設(shè),認(rèn)為類型對(duì)玻璃表面是否風(fēng)化的影響顯著。紋飾*表面風(fēng)化Pearson卡方P2=0.084>0.05,顏色*表面風(fēng)化Pearson卡方P3=0.481>0.05,均接受原假設(shè),認(rèn)為紋飾和顏色對(duì)玻璃表面是否風(fēng)化的影響不顯著。
斯皮爾曼相關(guān)系數(shù)計(jì)算式:
使用Matlab求解斯皮爾曼相關(guān)系數(shù)并繪制熱力圖,正值用深色系標(biāo)準(zhǔn),負(fù)值用淺色標(biāo)注,如圖2所示:
圖2 斯皮爾曼相關(guān)系數(shù)圖Fig.2 Spearman correlation coefficient graph
相關(guān)系數(shù)定量刻畫出X和Y之間的相關(guān)程度,即|ρ|越大,相關(guān)程度越大,相關(guān)性越好;|ρ|=0時(shí),對(duì)應(yīng)的相關(guān)程度最低。由圖2可知,表面風(fēng)化情況與玻璃文物類型之間的相關(guān)程度較大,而紋飾對(duì)表面風(fēng)化程度影響較小,相關(guān)性較小。
均值法是根據(jù)風(fēng)化前后同一采樣點(diǎn)化學(xué)成分含量變化進(jìn)行預(yù)測(cè),模型如下:
風(fēng)化前,第i個(gè)采樣點(diǎn)所有化學(xué)成分含量之和為:
Pij=m11+m12+m13+…+mij
風(fēng)化前,第i個(gè)采樣點(diǎn)的第j種化學(xué)成分所占比例為:
Mij=mij/Pij
風(fēng)化后,第i個(gè)采樣點(diǎn)所有化學(xué)成分含量之和為:
Sij=n11+n12+n13+…+nij
風(fēng)化后,第i個(gè)采樣點(diǎn)的第j種化學(xué)成分所占比例為:
Nij=nij/Sij
風(fēng)化前后,第i個(gè)采樣點(diǎn)的第j種化學(xué)成分含量的變化值為:
Δhij=|Nij-Mij|
風(fēng)化前,第i個(gè)采樣點(diǎn)的第j種化學(xué)成分含量為:
kij=nij-Δhij
根據(jù)玻璃類型,將玻璃劃分為兩種,即高鉀玻璃和鉛鋇玻璃,使用 Matlab采用均值法,分別預(yù)測(cè)這兩種玻璃風(fēng)化前各個(gè)風(fēng)化點(diǎn)檢測(cè)數(shù)據(jù)的化學(xué)成分含量,部分高鉀玻璃采樣點(diǎn)處各化學(xué)物質(zhì)比例預(yù)測(cè)結(jié)果如表2所示。
表2 高鉀玻璃風(fēng)化前的化學(xué)成分含量Tab.2 Chemical content of high potassium glass before weathering
決策樹是一種用于數(shù)據(jù)分類的方法,具有如流程圖一樣的樹狀結(jié)構(gòu),每個(gè)內(nèi)部節(jié)點(diǎn)表示在一個(gè)屬性上的測(cè)試,每個(gè)分支節(jié)點(diǎn)表示一個(gè)測(cè)試輸出,每個(gè)葉子節(jié)點(diǎn)表示類或類分布,其本質(zhì)是一種自上向下的逐步構(gòu)造方法,構(gòu)造標(biāo)準(zhǔn)一般采用信增益度量,信息增益越大,表明數(shù)據(jù)集在分類過程中能夠最大化減小其不確定性,因此ID3在構(gòu)建算法的過程中所挑選的特征具有更好的分類效果。信息熵(H)及信息增益(G)定義如下:
H(p)=-∑p×lgp
G(D,A)=H(D)-H(D|A)
其中,p表示隨機(jī)變量概率,A表示特征,D代表數(shù)據(jù)集,H(D)定義為經(jīng)驗(yàn)熵,H(Y|X)定義為條件熵,H(D|A)表示特征A在數(shù)據(jù)集D條件下的經(jīng)驗(yàn)條件熵。
針對(duì)給出的數(shù)據(jù)集,選取70%的數(shù)據(jù)作為訓(xùn)練集,30%的數(shù)據(jù)作為測(cè)試集,運(yùn)用spss modeler得到如圖3所示的分類決策樹。
圖3 分類決策樹Fig.3 Classification decision tree
該決策樹深度為4層,根節(jié)點(diǎn)包含39個(gè)樣本,其中鉛鋇玻璃占64.1%,高鉀玻璃占35.9%。分析可知,高鉀玻璃和鉛鋇玻璃決策樹的第一分類標(biāo)準(zhǔn)是紋飾,若紋飾為B,那么該玻璃類別為高鉀玻璃,若紋飾為A或C,則有75.758%的概率為鉛鋇玻璃。第二分類標(biāo)準(zhǔn)為表面是否風(fēng)化,若紋飾為A或C且表面風(fēng)化,則類型為鉛鋇玻璃,若紋飾為A或C且表面無風(fēng)化,則有53%的可能是鉛鋇玻璃,47%的概率為高鉀玻璃。第三分類標(biāo)準(zhǔn)為顏色,若紋飾為A或C且表面無風(fēng)化且顏色為藍(lán)綠,則類別為高鉀玻璃。
通過計(jì)算斯皮爾曼相關(guān)系數(shù)得出文物表面風(fēng)化與文物類型有較強(qiáng)相關(guān)性,而紋飾對(duì)表面風(fēng)化程度影響較小,有較弱相關(guān)性。使用決策樹模型探究高鉀玻璃與鉛鋇玻璃的分類規(guī)律,可得出劃分玻璃類別標(biāo)準(zhǔn)的順序,再根據(jù)每個(gè)標(biāo)準(zhǔn)中的概率判斷玻璃種類。由于決策樹模型需要訓(xùn)練的數(shù)據(jù)規(guī)模較小,降低了算法時(shí)間復(fù)雜度,生成的決策樹規(guī)模更小,具有更少的葉子結(jié)點(diǎn)數(shù),比其他機(jī)器學(xué)習(xí)模型更容易構(gòu)建,可視性強(qiáng)。