許叢琳 牟志娟 陳坤(日照安科檢測評價技術有限公司,山東日照 276800)
化工分析與檢驗是一項十分復雜的工作,里面涉及很多復雜的操作,比如原料種類的多變性,使用很多的儀器,人為的對產(chǎn)品進行評估和數(shù)據(jù)分析,需要分析員有深厚的數(shù)學功底和數(shù)學建模水平,不同的分析人員因為不同的操作和經(jīng)驗會產(chǎn)生很大的不同,這就可能會導致產(chǎn)品上面出現(xiàn)不同程度的誤差,從而影響到企業(yè)實際的生產(chǎn)生活。
化工企業(yè)在進行化工分析之前肯定會進行撿樣,制樣,驗樣等一些操作,這些人為的操作中往往就會發(fā)生批漏,比如說撿取樣本的時候可能會出現(xiàn)少揀,錯揀,漏檢等現(xiàn)象。這些現(xiàn)象的危害是十分嚴重的,哪怕給你最好的化工分析員,它也會直接導致最后實驗結果分析的不準確,從而錯誤的指導化工生產(chǎn)。下面就如何避免原材料的錯誤和紕漏談一談具體的措施。
首先,撿樣和制樣的人員都是必須經(jīng)過專門培訓的[1]。撿樣的時候選擇隨機抽樣,比如說礦山企業(yè)的磷礦進行撿樣和抽樣,那么就要從不同的井口,井口里面不同的位置進行取樣。下面來說說制樣環(huán)節(jié),制樣的機器是十分昂貴的,而且維護成本也是昂貴的。所以最好的做法就是把員工培訓成能夠熟練操作使用這些機器的員工,避免員工在使用機器時候的不當而導致機器出現(xiàn)故障,如果員工在能夠撿樣和制樣的條件下也能夠自己維修制樣機器那是最好的了。最后一點要說明的就是員工采樣和制樣化工分析最好分成兩個步驟,也就是分成兩個工種:一批員工專門從事采樣和制樣,另外一批員工就去從事樣本的化工分析。且每天制作出來的樣本由制樣人直接送去化驗室交給化驗工作員,這樣就能最大程度上避免采樣,制樣,驗樣環(huán)節(jié)的紕漏。
督促相關工作人員落實分析與檢驗行為。建模與計算機運算只是減少化工分析誤差的手段,化工分析與檢驗工作的本質(zhì)上是人,數(shù)據(jù)可以減少理論上和實際工作中的誤差,但一些人為的誤差往往無法避免。相關工作人員在工作中,要提高自身對于新技術的掌握度,比避免操作誤差,細致分析化工分析與檢驗工作中的實驗用量,選定合理科學的指標劑,對于操作流暢要牢記于心,避免實驗誤差。另外,對于化工分析與檢驗的儀器,工作人員要定期清理,在再次使用前要徹底消毒,減少上次實驗殘留,這樣可以減少分析誤差。從而提高分析的精確度,促進企業(yè)進一步發(fā)展。
在化工企業(yè)進行化工分析指導化工生產(chǎn)的時候,最為關鍵的一環(huán)就是化工分析所得出的結果了,因為化工企業(yè)往往都是以這個結果為指標指導企業(yè)進行生產(chǎn)實踐,如果化工分析這個環(huán)節(jié)出了錯誤,那么就會對企業(yè)造成巨大的經(jīng)濟損失。而這個錯誤可能僅僅只是由化工分析人員分析實驗數(shù)據(jù)的誤差所導致的,當然,對于誤差這個東西,我們是不可避免的,那么如何把誤差降到最低呢,或者換句話說,如何構建一個數(shù)學模型使得對于實驗數(shù)據(jù)的擬合度最高。這是一個關鍵的問題。
擬合度是數(shù)據(jù)挖掘中的一個專屬名詞,它的定義就是給你一組實驗數(shù)據(jù),你通過一系列的算法和軟件對這些數(shù)據(jù)進行分析,最后得出一個數(shù)學模型也就是一個復雜的多元多次方程組來實現(xiàn)對這些數(shù)據(jù)的描述,這個就叫做擬合,也就是通過一個數(shù)學模型來高度擬合出我們的實驗數(shù)據(jù)?;し治鲋?,我們應該怎么做呢,首先,我們必須得要求化工分析人員具有其過硬的專業(yè)技能和工作經(jīng)驗的積累,另外還需要化工分析人員具有深厚的數(shù)學功底,至少構建數(shù)學模型所需要的基本的高等數(shù)學和線性代數(shù)以及一些概率論是必須要求的。身處21 世紀,很多產(chǎn)業(yè)和服務都搭上了互聯(lián)網(wǎng)這輛順風車,從此開始飛速的發(fā)展,可以說互聯(lián)網(wǎng)深深的改變了我們的生活,身為化工分析員,不僅要學會利用計算機快速性和準確性來為我們服務,也要學會利用計算機的大數(shù)據(jù)環(huán)境對我們的數(shù)據(jù)進行數(shù)據(jù)挖掘和數(shù)據(jù)分析。這一點尤為重要。因為化工分析早在很多年前就已經(jīng)存在了,那些資深的化工分析員都已經(jīng)有了很多的行業(yè)經(jīng)驗,但正因為如此,很多老化工分析員就會滿足于現(xiàn)狀,靠著自己幾十年的經(jīng)驗吃飯,這是不對的。
時代在發(fā)展,技術在進步,大數(shù)據(jù)和人工智能是未來的趨勢,所以我們也要學會使用大數(shù)據(jù)技術來為企業(yè)的化工分析提供服務。我們的第一個需求將實驗數(shù)據(jù)進行存儲,利用大數(shù)據(jù)平臺Hadoop,將數(shù)據(jù)存放在它的分布式文件系統(tǒng)HDFS 中,這樣好方便后面的計算服務。我們的第二個需求是大數(shù)據(jù)環(huán)境下,化工分析所需要的數(shù)據(jù)計算??梢允褂么髷?shù)據(jù)平臺Hadoop的MapReduce 進行計算,或者是通過大數(shù)據(jù)平臺Spark 代替Hadoop 的MapReduce 進行計算,因為Spark 是基于內(nèi)存的運算,比MapReduce 快上數(shù)百倍。最重要的是對數(shù)據(jù)進行數(shù)據(jù)建模和數(shù)據(jù)分析,使用機器學習的分類,回歸等算法。這兩個算法可以用來用來進行數(shù)學模型的耦合性的判斷和模擬,可以通過這些個算法并且通過我們化工企業(yè)以往的化工分析的一些數(shù)據(jù)集,然后通過一個或者幾個生產(chǎn)因素來直接預測我們的生產(chǎn)結果是怎么樣的[3]。還有就是在化工分析中可以對化工分析的數(shù)據(jù)進行分析,使用機器學習中的推薦算法和關聯(lián)算法Fpgrowth 等等,幫我們直接找到最合適的原材料之間的搭配比例。最后還需要化工分析相關人員要做的就是對實驗數(shù)據(jù)結果的圖形化繪制,我們往往需要使用R 語言對我們的實驗結果進行繪圖,以便結果通過圖形的方式表達出來。這在化工分析中是極其關鍵的。圖1 就是我們的化工數(shù)據(jù)分析之后的擬合度的數(shù)學模型的構建和R 語言的可視化,因為沒有具體的化工分析數(shù)據(jù),所以我們使用R 環(huán)境自帶的女性身高和體重的數(shù)據(jù)集進行模擬的圖形,原理一樣。
圖1 R語言對實驗結果的可視化繪圖
2016年開始,大數(shù)據(jù)和人工智能是未來的趨勢,我們的化工分析也應該搭乘一下大數(shù)據(jù)的順風車,通過大數(shù)據(jù)的一系列的專業(yè)的算法來對我們的化工數(shù)據(jù)進行分析和構建數(shù)學模型,以便更好的來指導我們企業(yè)的生產(chǎn)生活實踐,使得企業(yè)能夠在減小成本的情況下,同時也獲得更多的經(jīng)濟收入。