嚴(yán)利偉,王昌南,唐高林,劉琪
?
多元線性回歸計算礦石體重方法的優(yōu)化——以某銅鋅礦為例
嚴(yán)利偉,王昌南,唐高林,劉琪
(四川金伯利地質(zhì)勘查有限公司,成都 610091)
本文提出多元線性回歸計算礦石體重的優(yōu)化方法,并以某銅鋅礦為例,采用優(yōu)化方法計算出體重值與礦石品位之間的方程關(guān)系。結(jié)果表明,銅鋅礦的礦石體重與銅(Cu)、硫(Sp)品位之間線性關(guān)系明顯,線性方程的擬合效果極好。預(yù)測體重與實際體重之間平均誤差<5%,可以直接利用于實際生產(chǎn)。
礦石體重;礦石品位;多元線性回歸;優(yōu)化
礦石體重是礦床勘查開發(fā)過程的一項重要參數(shù),獲得準(zhǔn)確的體重估值是礦床資源量估算的前提條件。傳統(tǒng)上礦石體重值是通過小樣本抽樣求算術(shù)平均值或者根據(jù)體積或重量進(jìn)行加權(quán)平均求得。但受樣本大小局限,并且由于取樣方式的隨機性,求得的礦石體重往往與理想的礦石體重存在較大偏差。近年來,許多學(xué)者嘗試建立小體重與礦石品位之間的線性方程,直接通過礦石品位推算礦石體重值,取得了一定的效果,但實際操作中存在以下問題:①沒有排除不同元素品位之間可能存在的自相關(guān)性;②默認(rèn)礦石體重和品位之間直接線性相關(guān),沒有建立模型加以驗證;③對線性方程的擬合優(yōu)度以及自變量顯著性缺乏統(tǒng)一的評判標(biāo)準(zhǔn)。以上問題直接影響線性方程式的準(zhǔn)確建立,從而影響估值結(jié)果的準(zhǔn)確性。為此,本文以川西南某銅鋅硫化物礦床為例,重點結(jié)合上述三個問題,對多元線性回歸計算礦石體重的方法進(jìn)行優(yōu)化。
1.1 元素品位之間自相關(guān)性的排除
由于礦石中礦物組合的多樣性,元素品位之間往往并非相互獨立不相關(guān)聯(lián)。例如,當(dāng)兩種元素出現(xiàn)在同一種礦物中時,元素品位實際呈現(xiàn)出固定比例的關(guān)系。同時采用這兩種元素品位參與回歸,相當(dāng)于重復(fù)引入自變量。當(dāng)一種元素同時賦存于多種礦物中的時候,其品位實際可以通過這些礦物中其他元素進(jìn)行計算得出,相當(dāng)于這種元素品位與其他元素品位值之間存在已知的線性關(guān)系。線性回歸模型中的自變量之間存在的精確相關(guān)關(guān)系或高度相關(guān)關(guān)系會使模型估計失真或難以估計準(zhǔn)確。但由于礦石中礦物類型以及成礦元素的賦存狀態(tài)往往是已知的,我們可以依據(jù)上述信息對自變量進(jìn)行預(yù)篩選及預(yù)處理,確定或者分離出與體重相關(guān)且不存在已知自相關(guān)性的自變量,從而排除這種自相關(guān)性對線性方程擬合的影響。
1.2礦石體重與元素品位的線性關(guān)系的建立
礦石體重與元素品位之間的具體關(guān)系需要建立相對理想的模型來確定。馮適安[1]通過鉛鋅礦的理想模型構(gòu)建了鉛鋅礦中鉛、鋅品位與礦石體重之間的方程式。在假定所有成礦元素均賦存于不同礦物中的前提下,這種方法可以推廣應(yīng)用到其他多金屬礦床。方法如下:
假設(shè)脈石礦物比重為常數(shù)0,為礦石量,為礦石體積,vvv為各礦石礦物體積,ddd為各礦石礦物比重則有:
設(shè)ccc為各元素在所賦存的礦石礦物內(nèi)的品位,PPP為各元素金屬量為礦石體重,,xxx為各元素在礦石中的品位,kkk為常數(shù),則有:
表1 某銅鋅礦品位及小體重值
根據(jù)理論模型的推算表明,礦石體重的倒數(shù)與元素品位之間可能存在顯著的相關(guān)關(guān)系。因此采用體重倒數(shù),而不只是體重值作為因變量,可以獲得更為準(zhǔn)確的擬合方程。
1.3 線性方程擬合效果的分析方法
前人一般都是采用復(fù)相關(guān)系數(shù)R或者R2或來評判多元線性方程的擬合效果[2-3],R的絕對值越接近于1,說明擬合效果越好。為了驗證因變量與自變量總體存在線性關(guān)系,擬合方程還必須通過顯著性檢驗(F檢驗)。由于礦石體重值會直接應(yīng)用于儲量計算,因此在統(tǒng)計參數(shù)的評判之外還必須要考慮實際的應(yīng)用效果。一般而言,體重值的誤差遠(yuǎn)小于儲量值的誤差時才有較好的應(yīng)用價值。結(jié)合生產(chǎn)實際情況,我們推薦預(yù)測體重與實際體重的平均誤差應(yīng)當(dāng)控制在10%以內(nèi)。
復(fù)相關(guān)系數(shù)只是對于模型擬合優(yōu)度的考量,并非說明各個自變量對因變量的影響顯著。在回歸分析中,不僅要模型的擬合度高,還要得到總體回歸系數(shù)的可靠估計量[4]?;谇笆龅哪P停诘V石品位值較高的情況下,一般都可以認(rèn)為其對體重值的影響較大,可以先作為自變量參與回歸。少數(shù)元素品位較低,對體重影響較小,可以采用變量顯著性檢驗(t檢驗)加以排除。這樣可以確保包括所有可能影響體重的因素,同時排除了無關(guān)信息的干擾。
表2 Cu、Sp、Zn三個自變量多元線性回歸統(tǒng)計量
某銅鋅礦圍巖地層為古元古界里伍巖群,圍巖巖性以石英巖、蝕變二云片巖為主。礦體呈似層狀大致平行于片理產(chǎn)出,礦石礦物以黃銅礦、磁黃鐵礦、閃鋅礦為主,次為方鉛礦、黃鐵礦等,含量較少。脈石礦物主要為石英、黑云母、絹云母、綠泥石等。礦石多為浸染狀、條帶狀、網(wǎng)團(tuán)狀構(gòu)造,少量為塊狀構(gòu)造。29塊樣品測定的體重值2.66~3.69(g/cm3),礦石品位分析主要成礦元素Cu、Zn、S三項,其中S品位0.45%~26.7%,Cu品位0.1%~9.43%,Zn品位0.02%~1.8%(表1)。樣品均為致密塊狀巖石、孔隙度與濕度對體重影響較小,可不作考慮。
由于礦石中的成礦礦物主要為磁黃鐵礦(Fe1-xS, x=0-0.17)、黃銅礦(CuFeS2)、閃鋅礦(ZnS),其中Cu和Zn分別只賦存于黃銅礦和閃鋅礦中,S同時賦存于三種礦物之中,與Cu、Zn均有一定相關(guān)性,因此需要在S品位中除去黃銅礦和閃鋅礦中的S含量,以磁黃鐵礦中的S(以S表示)作為一個自變量引入。
表3 Cu、Sp兩個自變量多元線性回歸統(tǒng)計量
本次多元線性回歸采用EXCEL軟件中加載的回歸分析工具進(jìn)行,以Cu、S、Zn三個自變量對體重倒數(shù)進(jìn)行回歸,得到以下統(tǒng)計結(jié)果:
由于回歸統(tǒng)計值中復(fù)相關(guān)系數(shù)R值和R2分別為0.97和0.94,均接近于1,給定顯著性水平0.05,F(xiàn)值>F0.025(3,24)=2.33,說明方程線性擬合的效果非常好。設(shè)計原假設(shè)H0:bi=0(i=1,2…k)與備擇假設(shè):H1:bi10,給定顯著性水平a=0.05,查得相應(yīng)臨界值:t0.025(24)=2.064。包括常數(shù)項在內(nèi)的3個自變量(截距、Cu、S)標(biāo)準(zhǔn)誤差較小,且都在95%的水平下顯著,都通過了變量顯著性檢驗。Zn品位值的標(biāo)準(zhǔn)誤差較大,且由于| t |< t0.025(24),接受原假設(shè)H0。因此我們認(rèn)為Zn的品位值與體重之間沒有關(guān)聯(lián),轉(zhuǎn)而采用Cu、S兩個自變量進(jìn)行回歸,回歸結(jié)果見表3。
表4 預(yù)測體重與真實體重誤差
給定顯著性水平a=0.05,F(xiàn)>F0.025(2,25)=2.53,表明方程總體線性顯著。包括常數(shù)項在內(nèi)的3個自變量都通過了顯著性檢驗。據(jù)上述參數(shù),設(shè)y為體重值,擬合的方程為:y=1/(0.370594-0.00495Cu-0.00406S)。以0.00495Cu+0.00406S為x,體重倒數(shù)為y’,進(jìn)行坐標(biāo)投影(圖1)。結(jié)果表明(表4),體重倒數(shù)與品位值呈現(xiàn)明顯線性趨勢。經(jīng)統(tǒng)計,通過回歸方程計算的預(yù)測體重與真實體重的誤差大部分在8%以下,平均誤差僅有4.61%,因此可以認(rèn)為回歸方程有較好的預(yù)測效果,可以直接用于儲量計算中。
圖1 體重倒數(shù)與品位之間線性關(guān)系
3.1回歸分析的質(zhì)量
本文采用的回歸實例采用有限數(shù)據(jù)就獲得了比較好的回歸結(jié)果,主要是因為本例中礦石組成與理想的礦石模型比較接近。具體表現(xiàn)為礦石礦物種類較少,對體重影響較大,且脈石成分、比重比較穩(wěn)定。在實際生產(chǎn)應(yīng)用中可能會出現(xiàn)一些問題。例如對于某些比如低品位礦或者稀有金屬礦,其元素品位與體重之間可能不存在相關(guān)性,回歸方法可能并不適用?;蛘邔w重影響較大的是一些非成礦元素,僅利用成礦元素品位,回歸效果往往不佳。因此在應(yīng)用之前需要對其可行性有基本的判斷,同時通過增加樣本數(shù)、優(yōu)選自變量的方法提高回歸方程的質(zhì)量。
3.2 應(yīng)用前景
礦石體重的多元線性回歸方程實際上提供了采用品位值來預(yù)測體重值的最佳方法,在實際生產(chǎn)中的應(yīng)用十分廣泛。例如,通過回歸方程計算體重與平均方法求得的礦石體重對比,可以及時發(fā)現(xiàn)小體重取樣中存在的偏差。在儲量計算方面,可以根據(jù)塊段內(nèi)礦石平均品位為各塊段分別計算體重。同樣,在基于礦體三維模型的儲量計算中,也可以引入多元線性方程分別為礦塊進(jìn)行體重賦值。以上方法相當(dāng)于對礦體不同部位的體重值進(jìn)行量化賦值,更符合礦體的自然特征,可以極大提高儲量計算的精度。
[1] 馮適安.1983.多金屬礦床中礦石體重與金屬品位的關(guān)系[J].湖南地質(zhì),2(2):58-61.
[2] 張景平,李社.2001. 基于SPSS的礦石小體重與品位的多元回歸分析模型的構(gòu)建[J].華東理工大學(xué)學(xué)報(自然科學(xué)版),34(1):62-66.
[3] 林喜.礦石體重的多元線性回歸分析及其檢驗[J].福建地質(zhì),2009,29:157-163.
[4] 劉曉石,陳鴻建,何臘梅,等.概率論與數(shù)理統(tǒng)計(第二版) [M].北京:科學(xué)出版社,2005.
Optimization of Multiple Linear Regression Analysis of Ore Density — By the Example of a Cu-Zn Deposit
YAN Li-wei WANG Chang-nan TANG Gao-lin LIU Qi
(Sichuan Jinboli Geological Exploration Co., Ltd., Chengdu 610091)
This article puts forward an optimized method of calculating ore density by use of multivariate linear regression and by the example of a Cu-Zn deposit. The results show that ore density value has a clear linear relationship to the grades of copper(Cu) and sulfur(S). The average error between the predicted density and the measured density is less than 5%. Such method can be well adapted to production.
ore density; ore grade; multivariate linear regression
P628+.1;P618.41
A
1006-0995(2017)02-0331-04
10.3969/j.issn.1006-0995.2017.02.037
2016-06-26
嚴(yán)利偉(1986-),男,江蘇南通市人,碩士,從事地質(zhì)勘查工作