林濤 葛玉敏 安玳寧
摘 要:提出一種基于RBF神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘方法,將RBF神經(jīng)網(wǎng)絡(luò)應(yīng)用于數(shù)據(jù)挖掘的分類和預(yù)測中,解決鋼構(gòu)件過程中的性能預(yù)測問題。其中用黃金分割法確定基于RBF神經(jīng)網(wǎng)絡(luò)的隱層節(jié)點數(shù),減少該算法的計算復(fù)雜度,最終將其應(yīng)用于某鋼鐵企業(yè)質(zhì)量控制系統(tǒng)。構(gòu)建對鋼構(gòu)件質(zhì)量檢測的數(shù)據(jù)挖掘及質(zhì)量追溯平臺,該平臺是基于RBF神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘技術(shù)的。實際應(yīng)用證明,產(chǎn)品的質(zhì)量合格率可達(dá)到96.27%,符合國家相關(guān)的標(biāo)準(zhǔn)和技術(shù)指標(biāo)。
關(guān)鍵詞:數(shù)據(jù)挖掘;徑向基函數(shù)神經(jīng)網(wǎng)絡(luò);黃金分割法; 質(zhì)量追溯
中圖分類號:TP399 文獻(xiàn)標(biāo)識碼:A
Abstract:To solve the performance prediction problem in the steel production process, this paper presentsed an approach which is based on RBF neural network data mining method and uses RBF neural network in classification and prediction of data mining. The hidden layer nodes of the RBF neural network were determined by the golden section method to reduce the computational complexity of the algorithm, which were applied to a steel enterprise quality control system. Finally, a platform of data mining and quality retrospective, which is based on RBF neural network data mining technology,was constructed in product quality testing in steel companies. Practical application shows that the qualified rate of products can reach 96.27%, in line with national standards and technical specifications.
Key words:data mining; radial basis function neural network;golden section method; qualitytraceability
1 引 言
在國家“全面提高信息化水平,推進(jìn)信息化與工業(yè)化深度融合”的大環(huán)境下,有效的將信息技術(shù)、企業(yè)先進(jìn)制造技術(shù)與現(xiàn)代管理技術(shù)進(jìn)行結(jié)合,使得企業(yè)在生產(chǎn)經(jīng)營過程中產(chǎn)生了海量數(shù)據(jù)。激增的數(shù)據(jù)背后隱藏著許多重要的信息,如何從大量的數(shù)據(jù)中提取并找到有用的信息以指導(dǎo)決策,是迫切需要解決的問題[1,2]。
鋼構(gòu)件的生產(chǎn)、加工、成型及實際應(yīng)用的過程中涌現(xiàn)出企業(yè)決策的不確定性和不可預(yù)測性,大量結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),加劇了企業(yè)決策的風(fēng)險。如何有效地收集數(shù)據(jù)、洞察數(shù)據(jù),如何將數(shù)據(jù)轉(zhuǎn)化為知識、將知識付諸于行動,已經(jīng)日益成為企業(yè)經(jīng)營者難以把控的課題。
由于神經(jīng)網(wǎng)絡(luò)對噪聲數(shù)據(jù)的高承受能力和高容錯能力使得神經(jīng)網(wǎng)絡(luò)在數(shù)據(jù)挖掘領(lǐng)域的應(yīng)用得到人們的重視,但是具有結(jié)構(gòu)復(fù)雜、可解釋性差、訓(xùn)練時間長等缺點。針對這些問題本文介紹了基于RBF神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘技術(shù)構(gòu)建的鋼構(gòu)件企業(yè)成品質(zhì)量檢測的數(shù)據(jù)挖掘及質(zhì)量追溯平臺,并且應(yīng)用黃金分割法確定RBF神經(jīng)網(wǎng)絡(luò)的隱層節(jié)點數(shù),減少了該算法的計算復(fù)雜度,進(jìn)而簡化RBF神經(jīng)網(wǎng)絡(luò)算法,使其更能滿足大型企業(yè)數(shù)據(jù)挖掘的需求,提高工作效率。
2 數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘(DM: Data Mining.),也稱為數(shù)據(jù)庫中的知識發(fā)現(xiàn)KDD(Knowledge Discovery in Database),是源于大型零售商在面對決策支撐問題提出的,是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程[3]。它匯聚了數(shù)據(jù)庫、人工智能、機(jī)器學(xué)習(xí)、統(tǒng)計學(xué)、可視化技術(shù)、并行計算機(jī)等不同學(xué)科和領(lǐng)域的知識;借助了多年來數(shù)理統(tǒng)計技術(shù)及人工智能等領(lǐng)域研究成果構(gòu)建起自己的理論體系;利用了數(shù)據(jù)庫技術(shù)對數(shù)據(jù)進(jìn)行前端處理,應(yīng)用機(jī)器學(xué)習(xí)方法從處理后的數(shù)據(jù)中提取有用的知識,并對數(shù)據(jù)背后隱藏的特征和趨勢進(jìn)行分析,最終給出關(guān)于數(shù)據(jù)的總體特征和發(fā)展趨勢;運(yùn)用了可視化技術(shù)將人的觀察力和智能融入系統(tǒng),用直觀圖形將信息模式、數(shù)據(jù)的關(guān)聯(lián)或趨勢呈現(xiàn)給決策者,使用戶能交互式地分析數(shù)據(jù)。
數(shù)據(jù)挖掘大體分為三個步驟:目標(biāo)數(shù)據(jù)收集采樣、數(shù)據(jù)處理再加工和數(shù)據(jù)輸出與結(jié)果分析。數(shù)據(jù)挖掘就是尋找隱藏在數(shù)據(jù)中的如趨勢、模式及相關(guān)性的信息。數(shù)據(jù)挖掘?qū)儆跀?shù)據(jù)庫中的知識發(fā)現(xiàn)(KDD)的一部分。它的本質(zhì)就是學(xué)習(xí)過去經(jīng)驗的簡單過程。圖1是知識發(fā)現(xiàn)過程的簡單流程。
4 鋼構(gòu)件質(zhì)量檢測和追溯系統(tǒng)
現(xiàn)階段冶金行業(yè)的運(yùn)營特點趨向于嚴(yán)格的冶金產(chǎn)品質(zhì)量規(guī)范,產(chǎn)品要進(jìn)行全過程的質(zhì)量跟蹤和嚴(yán)格的質(zhì)量檢測,并為客戶開具質(zhì)量保證書??梢?,質(zhì)量管理在鋼鐵冶金行業(yè)中占據(jù)著越來越重要的地位。質(zhì)量檢測是實現(xiàn)質(zhì)量管理的核心環(huán)節(jié),只有精確地檢測并分析出產(chǎn)品判廢原因并進(jìn)行質(zhì)量追溯,才能把成品質(zhì)量控制在最佳水平。為了更精確、更智能的進(jìn)行質(zhì)量檢測工作,本文將RBF神經(jīng)網(wǎng)絡(luò)應(yīng)用于數(shù)據(jù)挖掘的分類和預(yù)測中,把二者結(jié)合起來解決鋼構(gòu)件生產(chǎn)過程中的性能預(yù)測問題,以此構(gòu)建了基于RBF神經(jīng)網(wǎng)絡(luò)的鋼構(gòu)件成品質(zhì)量檢測的數(shù)據(jù)挖掘及質(zhì)量追溯平臺,該平臺將某鋼鐵企業(yè)中鋼構(gòu)件生產(chǎn)過程中的數(shù)據(jù)采集和質(zhì)量控制系統(tǒng)歷史數(shù)據(jù)庫的海量數(shù)據(jù)作為目標(biāo)信息源,進(jìn)行數(shù)據(jù)清洗和相關(guān)性分析,減少數(shù)據(jù)噪聲、刪除與任務(wù)無相關(guān)的數(shù)據(jù),建立挖掘數(shù)據(jù)庫。而數(shù)據(jù)挖掘自動在數(shù)據(jù)庫中尋找預(yù)測性信息,迅速直接由數(shù)據(jù)本身得出結(jié)論。
目前的鋼構(gòu)件檢測技術(shù)基本上是將化學(xué)性能、物理性能、尺寸精度和表面質(zhì)量分開檢測,而化學(xué)性能和物理性能基本滿足單方向相關(guān)聯(lián)的關(guān)系,即產(chǎn)品的化學(xué)元素含量直接影響到產(chǎn)品的物理性能各項參數(shù)。因此,在對鋼構(gòu)件產(chǎn)品的物理性能檢測時,可利用成品的化學(xué)物理性能相關(guān)性,通過RBF神經(jīng)網(wǎng)絡(luò)對化學(xué)參數(shù)的處理后,預(yù)測該產(chǎn)品的物理性能,從而簡化了物理性能的檢測環(huán)節(jié),大量節(jié)省了人力物力并節(jié)約了檢測成本。然而,數(shù)據(jù)挖掘的結(jié)果是不確定的,要和專業(yè)知識相結(jié)合才能對其做出判斷,因此要結(jié)合質(zhì)量追溯對結(jié)果進(jìn)行深刻的分析,理解數(shù)據(jù),了解其過程,才能對數(shù)據(jù)挖掘的結(jié)果找出合理的解釋。因此對鋼構(gòu)件產(chǎn)品化學(xué)性能、物理性能、表面質(zhì)量、尺寸精度的數(shù)據(jù)挖掘可按照以下流程進(jìn)行:
依據(jù)上圖,僅以鋼構(gòu)件的化學(xué)成分為例進(jìn)行說明。對構(gòu)件鋼的化學(xué)分析用試樣取樣法以及成品化學(xué)成分允許偏差檢測采用GB222—84標(biāo)準(zhǔn)。鋼種產(chǎn)品牌號為Q295,A級鋼,抽取了200組型鋼產(chǎn)品的樣本進(jìn)行該平臺的測試,首先從目標(biāo)信息源即數(shù)據(jù)采集和質(zhì)量控制系統(tǒng)歷史數(shù)據(jù)庫的海量數(shù)據(jù)中獲型鋼的化學(xué)成分?jǐn)?shù)據(jù),具體如下表1。
然后采用RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)挖掘,將數(shù)據(jù)集分為兩組,一組用來訓(xùn)練RBF神經(jīng)網(wǎng)絡(luò),一組用來測試RBF神經(jīng)網(wǎng)絡(luò)。為很好考察網(wǎng)絡(luò)的泛化能力,要保證測試數(shù)據(jù)和訓(xùn)練數(shù)據(jù)無交集。此外,為了防止所有數(shù)據(jù)的數(shù)據(jù)沖突問題,將數(shù)據(jù)倉庫與挖掘數(shù)據(jù)庫分開設(shè)置。設(shè)置二級數(shù)據(jù)庫為數(shù)據(jù)倉庫,里面包含所有從生產(chǎn)線采集的數(shù)據(jù);數(shù)據(jù)挖掘庫為三級數(shù)據(jù)庫,它是數(shù)據(jù)倉庫邏輯上的一個子集,二級數(shù)據(jù)庫是三級數(shù)據(jù)庫的數(shù)據(jù)源,三級數(shù)據(jù)庫從二級數(shù)據(jù)庫挖掘篩選出需求數(shù)據(jù)。經(jīng)過RBF神經(jīng)網(wǎng)絡(luò)對38個化學(xué)參數(shù)的處理后,預(yù)測該產(chǎn)品的物理性能,最后對化學(xué)成分?jǐn)?shù)據(jù)、物理性能數(shù)據(jù)、尺寸精度數(shù)據(jù)和表面質(zhì)量參數(shù)進(jìn)行綜合判定后的判定結(jié)果進(jìn)行結(jié)果分析,判定結(jié)果以C#完成的界面人性化顯示如圖5.具體結(jié)果分析如表2。經(jīng)過此成品質(zhì)量檢測的數(shù)據(jù)挖掘及質(zhì)量追溯平臺來進(jìn)行產(chǎn)品質(zhì)量控制,鋼構(gòu)件產(chǎn)品的合格率可以達(dá)到96.27%。
5 結(jié) 論
本文將RBF神經(jīng)網(wǎng)絡(luò)應(yīng)用于數(shù)據(jù)挖掘的分類和預(yù)測中,把二者結(jié)合起來解決鋼構(gòu)件生產(chǎn)過程中的性能預(yù)測問題,并結(jié)合質(zhì)量追溯對數(shù)據(jù)挖掘結(jié)果進(jìn)行詳細(xì)分析解釋。其中,在預(yù)測網(wǎng)絡(luò)的選擇上綜合考慮鋼構(gòu)件企業(yè)產(chǎn)品性能特點,選用結(jié)構(gòu)相對簡單的RBF前饋神經(jīng)網(wǎng)絡(luò),同時對鋼構(gòu)件產(chǎn)品進(jìn)行預(yù)測和檢測兩項工作,將數(shù)據(jù)挖掘技術(shù)深入到企業(yè)生產(chǎn)過程中,最終構(gòu)建了成品質(zhì)量檢測的數(shù)據(jù)挖掘及質(zhì)量追溯平臺,經(jīng)過此對產(chǎn)品進(jìn)行質(zhì)量控制,使得鋼構(gòu)件產(chǎn)品的質(zhì)量符合國家相關(guān)的標(biāo)準(zhǔn)和技術(shù)指標(biāo)。
參考文獻(xiàn)
[1] Caiyan, Liu, and Sun Youfa. Application of data mining in production quality management[J].Proceedings of the 3rd international conference on Intelligent information technology application. IEEE Press, 2009.
[2] 儲兵, 吳陳, 楊習(xí)貝. 基于 RBF 神經(jīng)網(wǎng)絡(luò)與粗糙集的數(shù)據(jù)挖掘算法[J]. 計算機(jī)技術(shù)與發(fā)展, ISTIC, 2013. 23(7):50-58.
[3] 宮曉曼, 滕榮華.基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘在煤礦選煤中的應(yīng)用[J]. 煤炭技術(shù), 2013. 32(009):127-128.
[4] 趙婧宏,潘維民.人工神經(jīng)網(wǎng)絡(luò)算法在數(shù)據(jù)挖掘中的應(yīng)用[J].中國科技論文在線.
[5] 王行甫,覃啟賢,程用遠(yuǎn),等.一種改進(jìn)的徑向基神經(jīng)網(wǎng)絡(luò)預(yù)測算法[J].計算機(jī)系統(tǒng)應(yīng)用,2012,(21)8:2-4.
[6] 李勁松.數(shù)據(jù)挖掘技術(shù)在鋼企質(zhì)量成本管理中應(yīng)用研究[J].科技導(dǎo)報,2009.
[7] SPINOLA C., et al. "Image processing for surface quality control in stainless steel production lines." Imaging Systems and Techniques (IST)[J].2010 IEEE International Conference on. IEEE, 2010.
[8] 尉永青.數(shù)據(jù)挖掘技術(shù)在入侵檢測系統(tǒng)中的應(yīng)用研究[J].信息技術(shù)與信息化,2005:95-96.
[9] 林鋼.基于數(shù)據(jù)挖掘的前向型神經(jīng)網(wǎng)絡(luò)在交通流時序預(yù)測中的應(yīng)用[D].南京:東南大學(xué),2004.
[10]周濤,陸惠玲.數(shù)據(jù)挖掘中聚類算法研究進(jìn)展[J].計算機(jī)工程與應(yīng)用,2012,(48)12:40-46.
[11]Shen, Wei, et al.Forecasting stock indices using radial basis function neural networks optimized by artificial fish swarm algorithm[J].KnowledgeBased Systems 24.3 (2011): 378-385.
[12]Cios, Krzysztof J., Witold Pedrycz, and R. M. Swiniarsk.Data mining methods for knowledge discovery.Neural Networks[J].IEEE Transactions on 9.6 (1998): 1533-1534.
[13]Buchtala, Oliver, Manuel Klimek, and Bernhard Sick.Evolutionary optimization of radial basis function classifiers for data mining applications.Systems, Man, and Cybernetics, Part B: Cybernetics[J].IEEE Transactions on 35.5 (2005): 928-947.