吳榮強(qiáng),李晉宏
(北方工業(yè)大學(xué)計(jì)算機(jī)學(xué)院 知識(shí)工程研究所,北京 100144)
本文采用的陽(yáng)極壓降數(shù)據(jù)是某鋁廠利用新型的陽(yáng)極壓降信號(hào)采集裝置采集到的陽(yáng)極壓降。鋁電解槽中陽(yáng)極導(dǎo)桿分為A,B兩側(cè),A側(cè)和B側(cè)各有8塊陽(yáng)極。每個(gè)位置的陽(yáng)極導(dǎo)桿的壓降波動(dòng)情況都有所差異,每個(gè)位置的陽(yáng)極都要經(jīng)歷換極,換極的周期大致為28天左右,換極質(zhì)量的好壞會(huì)嚴(yán)重影響整個(gè)電解槽槽電壓的穩(wěn)定。對(duì)陽(yáng)極壓降進(jìn)行聚類分析,能夠合理分析電壓波動(dòng)情況,避免某次換極影響電解槽,并且對(duì)電解槽的有效生產(chǎn)和減少損耗有一定的益處[1-2]。
目前對(duì)電解槽陽(yáng)極壓降的研究已經(jīng)有了一些進(jìn)展。林立明等在文獻(xiàn)中[3]通過(guò)提取在同一個(gè)電解槽中不同陽(yáng)極導(dǎo)桿的電流的頻譜特征,分別利用功率譜估計(jì)方法和因子分析方法對(duì)其進(jìn)行分析,得到同一電解槽中 A,B兩側(cè)磁場(chǎng)呈現(xiàn)不同分布狀態(tài)。但是未對(duì)時(shí)間序列的陽(yáng)極電壓異常波動(dòng)和分布特性進(jìn)行挖掘。劉永強(qiáng)等在文獻(xiàn)中[4]分析了鋁電解槽在生產(chǎn)過(guò)程中陽(yáng)極炭塊在出現(xiàn)脫落,偏流和陽(yáng)極長(zhǎng)包等異常情況下,電壓的波動(dòng)狀態(tài),并且給出了相應(yīng)的異常處理方式。但這種方式只是發(fā)現(xiàn)異常情況下的電壓波動(dòng)情況,并未進(jìn)行陽(yáng)極換極周期性電壓波動(dòng)的分析。本文通過(guò)對(duì)電解槽A,B兩側(cè)16根陽(yáng)極周期數(shù)據(jù)進(jìn)行分析,提取陽(yáng)極換極后的上升期長(zhǎng)度,陽(yáng)極壓降速升次數(shù),速升平均幅度,速降次數(shù),速降平均幅度,以及影響因子特征,并利用聚類方法對(duì)這6維數(shù)據(jù)進(jìn)行聚類,挖掘不同位置陽(yáng)極相似的電壓波動(dòng)情況,在一定程度上對(duì)陽(yáng)極換極后的質(zhì)量進(jìn)行評(píng)估。
本文的數(shù)據(jù)來(lái)源于某鋁廠的4622號(hào)電解槽A,B兩側(cè)的陽(yáng)極導(dǎo)桿的壓降值,該數(shù)據(jù)是通過(guò)采集器每5s采集的一組數(shù)據(jù)。數(shù)據(jù)采集的頻率過(guò)高,隨著時(shí)間的增加,陽(yáng)極壓降的數(shù)據(jù)量巨大,直接對(duì)陽(yáng)極壓降原始數(shù)據(jù)進(jìn)行歐式距離計(jì)算復(fù)雜度較高,需要對(duì)原始數(shù)據(jù)進(jìn)行特征抽取,降低維度再進(jìn)行距離計(jì)算會(huì)大大降低復(fù)雜度[5-6]。原始數(shù)據(jù)如圖1所示。
圖1 陽(yáng)極壓降原始數(shù)據(jù)Fig.1 Anode voltage drop raw data
(1)陽(yáng)極換極上升期長(zhǎng)度
電解槽中每個(gè)陽(yáng)極都有一定的生命周期,一般是在 28天左右,每次換極電壓值會(huì)下降到 50 mv左右,再經(jīng)過(guò)一段時(shí)間的恢復(fù)期,電壓值會(huì)達(dá)到1500 mv左右的平穩(wěn)期。所以需要從原始數(shù)據(jù)中自動(dòng)獲取每次換極的時(shí)刻和到達(dá)平穩(wěn)期的時(shí)刻,從而計(jì)算出陽(yáng)極換極上升期跨度的時(shí)間值即長(zhǎng)度。利用滑動(dòng)窗口算法[7-9],每個(gè)窗口大小固定,每次滑動(dòng)一格即5s并計(jì)算該窗口內(nèi)電壓值的平均值將原始數(shù)據(jù)轉(zhuǎn)換為 ( C1, C2,...,Cm)。計(jì)算公式如下:
其中m表示窗口的大小,xk表示窗口中每個(gè)電壓值。得到降維后的數(shù)據(jù) ( C1, C2,… ,Cm),利用陽(yáng)極換極后的特性即換極時(shí)電壓下降至50 mv以下,平穩(wěn)期電壓為1500 mv左右這兩個(gè)閾值分別判斷換極開始時(shí)刻 tstart和電壓恢復(fù)至平穩(wěn)的時(shí)刻 tend,最后得到上升期長(zhǎng)度。
(2)陽(yáng)極壓降速升/速降次數(shù)
陽(yáng)極電壓速升/速降是指在平穩(wěn)期至下一次換極開始時(shí)這段時(shí)間內(nèi)陽(yáng)極電壓由 V1陡然上升/下降至 V2之后,并能夠保持上升/下降后的 V2值一段時(shí)間,這種情況就視作一次陽(yáng)極壓降的速升/速降。將該數(shù)據(jù)作為一維特征的目的是電解槽在生產(chǎn)過(guò)程中陽(yáng)極壓降會(huì)由于某些異常情況例如:陽(yáng)極長(zhǎng)包,偏流等導(dǎo)致電壓出現(xiàn)波動(dòng),但經(jīng)過(guò)處理后又保持穩(wěn)定。通過(guò)統(tǒng)計(jì)速升/速降的次數(shù)來(lái)判斷陽(yáng)極全周期內(nèi)電壓整體波動(dòng)情況。
(3)陽(yáng)極壓降速升/速降幅度
陽(yáng)極壓降速升/速降幅度是指陽(yáng)極每次發(fā)生速升/速降情況時(shí)都會(huì)產(chǎn)生一定的電壓差,統(tǒng)計(jì)這些壓降差并計(jì)算相應(yīng)的平均值就得到了速升/速降幅度。
(4)影響因子
影響因子是由日?qǐng)?bào)數(shù)據(jù)中的針振和擺動(dòng)所決定的。針振和擺動(dòng)是描述電解槽槽電壓是否平穩(wěn)的兩個(gè)物理量,當(dāng)某些陽(yáng)極在換極結(jié)束后,由于換極質(zhì)量較差會(huì)導(dǎo)致電解槽中電壓擺,使針振和擺動(dòng)過(guò)大。影響因子的產(chǎn)生式如下:
本文采用的數(shù)據(jù)集是4622號(hào)電解槽A,B兩側(cè)陽(yáng)極壓降的全周期數(shù)據(jù),可以將數(shù)據(jù)集表示為C = { c1, c2,… ,cm},而利用k-means聚類算法最終得到的簇集合為 D = { d1, d2,… ,dk}[10-12]。假設(shè)有樣本X = ( x1, x2,… ,xn),樣本 Y = ( y1, y2,… , yn),則樣本X和Y之間的距離計(jì)算公式為:
該距離度量方法是最常用的明可夫斯基距離(Minkowski distance),其中 1p≥ 。本文使用的是歐式距離即 2p= 。
k-means算法需要提前確定樣本需要聚類的數(shù)目 k,本文利用了輪廓系數(shù)來(lái)評(píng)價(jià)在 k取不同值時(shí)k-means聚類的效果,輪廓系數(shù)的計(jì)算公式如下:
公式中aj表示在同一個(gè)簇中樣本j到該簇中其他樣本的距離的平均值,bj表示樣本j到其它簇包含的樣本的距離的平均值,在這些平均值中取最大值。K-means聚類算法所要達(dá)到的效果是同一簇內(nèi)的樣本之間越緊密越好即距離越小越好,不同簇之間樣本的距離越大越好,這樣聚類出來(lái)的效果比較好。
本文中利用k-means算法對(duì)陽(yáng)極壓降特征聚類過(guò)程如下:
1)輸入數(shù)據(jù)集 C = {c1, c2,...,cm}, ci=(上升期長(zhǎng)度,速升次數(shù),速升平均幅度,速降次數(shù),速降平均幅度,影響因子),以及k;
2)為了防止陷入局部最優(yōu)情況,隨機(jī)初始化k個(gè)中心 Oi;
3)計(jì)算數(shù)據(jù)集中每個(gè)樣本 ci分別與這 k個(gè)中心 Oi的歐氏距離,將樣本 ci歸入到聚類最近的類別中去;
4)利用劃分好的樣本重新計(jì)算類中心,更新 Oi;
5)重復(fù)第3)和4)步,直到迭代的次數(shù)達(dá)到指定的最大值n或者是k個(gè)聚類中心值 Oi不再發(fā)生變化;
6)輸出結(jié)果為簇集合 D = { d1, d2,… ,dk};
本實(shí)驗(yàn)采用的數(shù)據(jù)是某鋁廠4622號(hào)電解槽A,B兩側(cè)16個(gè)位置陽(yáng)極壓降數(shù)據(jù),日期從2017年3月1日至2017年5月6日,每個(gè)位置取最后一次換極周期數(shù)據(jù)。并通過(guò)數(shù)據(jù)預(yù)處理得到每個(gè)位置陽(yáng)極的完整周期數(shù)據(jù),然后通過(guò)特征提取獲取陽(yáng)極換極后的上升期長(zhǎng)度,陽(yáng)極電壓速升次數(shù),速升平均幅度,速降次數(shù),速降平均幅度,以及影響因子特征,對(duì)這6維數(shù)據(jù)進(jìn)行聚類。
通過(guò)對(duì)6維特征進(jìn)行聚類,聚類的個(gè)數(shù)分別取2,3,4,5,7,而輪廓系數(shù)的取值范圍在[-1,1],越接近于1聚類效果越好。如表1中可以看出當(dāng)k=3時(shí)輪廓系數(shù)值最大,說(shuō)明當(dāng)類別確定為3時(shí),電解槽陽(yáng)極壓降數(shù)據(jù)聚類效果最好,表明4622號(hào)電解槽中陽(yáng)極壓降波動(dòng)的情況大致分為3類,而只需要觀察這三類的波動(dòng)情況就可以得出整個(gè)電解槽的電壓穩(wěn)定性情況。
表1 不同聚類類別k值下的輪廓系數(shù)對(duì)比Tab.1 Comparison of contour coefficients under different clustering category k values
本文通過(guò)對(duì)陽(yáng)極壓降的k-means聚類分析得出當(dāng)k=3時(shí)效果較好。聚類結(jié)果如圖2所示,相同形狀的為一類,圖中是類似于真實(shí)電解槽的示意圖。
不同類別下陽(yáng)極壓降的波動(dòng)情況如圖 3,4,5所示,可以看出類別1的陽(yáng)極換極之后上升期長(zhǎng)度在45小時(shí)左右,說(shuō)明電壓很快回升至平穩(wěn),電解槽的針振和擺動(dòng)幅度會(huì)相對(duì)較小;類別2的上升期為200小時(shí)左右,時(shí)間跨度很大因此會(huì)在很大程度上會(huì)影響整個(gè)電解槽的槽電壓,也會(huì)較大程度上增大針振和擺動(dòng);類別 3中陽(yáng)極換極之后電壓變化較平穩(wěn),上升期為120小時(shí)左右。電解槽中每個(gè)陽(yáng)極換極的質(zhì)量好壞直接影響電壓的波動(dòng)情況從而導(dǎo)致整個(gè)電解槽的槽電壓不平衡,增大能耗,影響生產(chǎn)效益。
鋁電解槽中陽(yáng)極每次換極質(zhì)量的好壞都會(huì)或多或少的影響整個(gè)槽的槽電壓,槽電壓過(guò)高或是過(guò)低一方面會(huì)增大能耗,減少電解槽的使用壽命[13];另一方面會(huì)降低出鋁量,進(jìn)而影響生產(chǎn)效益[14-15]。通過(guò)對(duì)陽(yáng)極壓降原始分布數(shù)據(jù)進(jìn)行預(yù)處理,得到陽(yáng)極周期數(shù)據(jù),并對(duì)陽(yáng)極周期數(shù)據(jù)進(jìn)行聚類劃分,得到不同換極質(zhì)量下陽(yáng)極壓降的波動(dòng)狀態(tài)。從而明確關(guān)鍵陽(yáng)極,并有針對(duì)性地在換極過(guò)程中進(jìn)行精細(xì)化作業(yè),提高換極質(zhì)量并對(duì)班組進(jìn)行換極評(píng)價(jià),考核,確保鋁電解槽穩(wěn)定生產(chǎn)。
圖2 聚類結(jié)果示意圖Fig.2 Clustering results of the schematic
圖3 類別1陽(yáng)極壓降波動(dòng)曲線Fig.3 Category 1 anode voltage drop fluctuation curve
圖4 類別2陽(yáng)極壓降波動(dòng)曲線Fig.4 Category 2 anode voltage drop fluctuation curve
圖5 類別3陽(yáng)極壓降波動(dòng)曲線Fig.5 Category 3 anode voltage drop fluctuation curve
[1] 田慶紅. 合理利用鋁電解槽工作電壓[J]. 輕金屬, 2008.
[2] 田官官, 石良生. 淺析預(yù)焙陽(yáng)極質(zhì)量對(duì)鋁電解生產(chǎn)的影響及應(yīng)對(duì)措施[J]. 世界有色金屬, 2014.
[3] 趙仁濤, 林立明, 張志芳等. 鋁電解槽陽(yáng)極數(shù)據(jù)分析[J].有色金屬(冶煉部分), 2014.
[4] 劉永強(qiáng), 李釗, 姬鳳武等. 鋁電解生產(chǎn)中陽(yáng)極工作狀態(tài)的分析[J]. 云南冶金, 2011.
[5] 肖瑞, 劉國(guó)華, 陳愛(ài)東, 宋轉(zhuǎn). 不確定時(shí)間序列統(tǒng)計(jì)降維方法[J]. 計(jì)算機(jī)科學(xué), 2014.
[6] 謝福鼎, 李迎, 孫巖, 張永. 改進(jìn)的符號(hào)化時(shí)間序列處理方法[J]. 計(jì)算機(jī)工程與設(shè)計(jì), 2012.
[7] 余宇峰, 朱躍龍, 萬(wàn)定生等. 基于滑動(dòng)窗口預(yù)測(cè)的水文時(shí)間序列異常檢測(cè)[J]. 計(jì)算機(jī)應(yīng)用, 2014, 34(5): 2217-2220,2226.
[8] 李峰, 肖建華. 在時(shí)間序列相似性問(wèn)題中滑動(dòng)窗口的確定[J]. 計(jì)算機(jī)應(yīng)用, 2008.
[9] 翁小清, 沈鈞毅. 基于滑動(dòng)窗口的多變量時(shí)間序列異常數(shù)據(jù)的挖掘[J]. 計(jì)算機(jī)工程, 2007, 33(12): 102-104.
[10] Cao Ge, Cheng Yuhu.K-means Clustering Algorithm Based on Initial Clustering Centre Selection and Points Division[J].The Journal of New Industrialization, 2011, 1(5): 90-94. [曹戈, 程玉虎. 基于初始聚類中心選取和數(shù)據(jù)點(diǎn)劃分的K均值聚類算法[J]. 新型工業(yè)化, 2011, 1(5): 90-94]
[11] XU Buyun, NI He.Comparative analysis of SOM and K-means clustering[J]. The Journal of New Industrialization,2014, 4(7): 63-65. [徐步云, 倪禾. 自組織神經(jīng)網(wǎng)絡(luò)和K-means 聚類算法的比較分析[J]. 新型工業(yè)化, 2014, 4(7):63-69]
[12] Zhang Xiaohua, Wang Le.Change detection based on multiscale and clustering[J]. The Journal of New Industrialization. 2011,1(3): 72-79. [張小華, 王樂(lè). 一種多尺度和聚類分析的變化檢測(cè)[J]. 新型工業(yè)化, 2011, 1(3): 72-79]
[13] 張報(bào)清, 雷霆, 余宇楠. 預(yù)焙槽陽(yáng)極壓降影響因素研究[J].礦冶,2015.
[14] 單淑秀. 我國(guó)電解鋁工業(yè)的現(xiàn)狀及發(fā)展方向[J]. 輕金屬,2008(8): 3-6.
[15] 閆紹勇. 預(yù)焙陽(yáng)極鋁電解技術(shù)研發(fā)進(jìn)展[J]. 輕金屬, 2013.