沈大農(nóng)
上海華誼信息技術有限公司 (上海 200025)
多噴嘴水煤漿氣化爐具有大型化、高效率等技術優(yōu)勢,目前在全國范圍內有著廣泛的應用。同時,氣化生產(chǎn)系統(tǒng)目前還存在氣化產(chǎn)品產(chǎn)量不穩(wěn)定的問題,并且面臨著亟待實現(xiàn)的降低生產(chǎn)能耗、降本增效、提高智能化水平的考驗。氣化生產(chǎn)的穩(wěn)定性已越來越成為整個化工生產(chǎn)系統(tǒng)能否保持良好運行的關鍵。然而,通過傳統(tǒng)方法或利用現(xiàn)有的局限于氣化生產(chǎn)內部數(shù)據(jù)的專家系統(tǒng)改進生產(chǎn)工藝,已經(jīng)經(jīng)過了多年的嘗試,并沒有找到有效解決問題的方法。
隨著大數(shù)據(jù)和智能化等技術的發(fā)展,化工產(chǎn)業(yè)正在嘗試建立“以數(shù)據(jù)為驅動”的生產(chǎn)優(yōu)化模型和成本控制模型,從數(shù)據(jù)分析挖掘和智能模型的角度提升生產(chǎn)過程的穩(wěn)定性和效率,逐步向智能化的目標發(fā)展。本文以多噴嘴水煤漿氣化爐的爐溫軟測量為例,闡述大數(shù)據(jù)在氣化爐工藝優(yōu)化中的應用。
隨著云時代的來臨,大數(shù)據(jù)(Big data)也吸引了越來越多的關注。大數(shù)據(jù)通常用來形容一個公司創(chuàng)造的大量非結構化和半結構化數(shù)據(jù),這些數(shù)據(jù)在下載到關系型數(shù)據(jù)庫用于分析時會花費過多時間和金錢。大數(shù)據(jù)分析常和云計算聯(lián)系在一起,因為實時的大型數(shù)據(jù)集分析需要像MapReduce一樣的框架來向數(shù)十、數(shù)百甚至數(shù)千的電腦分配工作。隨著前所未有的巨量數(shù)據(jù)信息的聚集,“大數(shù)據(jù)”已經(jīng)成為國家的戰(zhàn)略資源。大數(shù)據(jù)技術的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對這些具有意義的數(shù)據(jù)進行專業(yè)化處理。換言之,如果把大數(shù)據(jù)比作一種產(chǎn)業(yè),那么這種產(chǎn)業(yè)實現(xiàn)盈利的關鍵在于提高對數(shù)據(jù)的“加工能力”,通過“加工”實現(xiàn)數(shù)據(jù)的“增值”。
大力投入信息化建設,實現(xiàn)工業(yè)化與信息化的“兩化”融合,成為能源化工行業(yè)實現(xiàn)轉型升級的重要推動力。隨著管理層思想的轉變,以及全球化經(jīng)濟危機的壓力,很多企業(yè)都在積極轉型,目前大多數(shù)企業(yè)的信息化建設已初具規(guī)模。隨著能化企業(yè)信息化程度的不斷提高,產(chǎn)生了海量的數(shù)據(jù),對這些數(shù)據(jù)的獲取、管理、分析與提煉的能力,將直接決定企業(yè)能否在激烈的市場競爭中保持領先優(yōu)勢。
能化企業(yè)往常大多通過人工經(jīng)驗來進行決策,但是如今不單單只能通過人工經(jīng)驗來進行精益生產(chǎn)了??茖W決策不能脫離數(shù)據(jù)的支持,從原材料采購到生產(chǎn)組織,從銷售策略到庫存優(yōu)化,從資金使用到財務平衡等,企業(yè)運行的許多重大問題都需要科學準確的量化決策來實現(xiàn)。從大量的數(shù)據(jù)中獲得的有用的規(guī)則,可以為決策服務提供關鍵的特征、預警和預測。隨著計算機技術和網(wǎng)絡技術的發(fā)展,能化行業(yè)積累的數(shù)據(jù)量越來越大。20世紀90年代興起的大數(shù)據(jù)、云計算和人工智能等技術代表著信息存儲和信息分析技術的重大進展,已成為人類處理和分析海量信息的有力工具。目前能化行業(yè)的生產(chǎn)分析一般采用人工經(jīng)驗或通過傳統(tǒng)的統(tǒng)計分析方法來實現(xiàn),較難滿足實際業(yè)務的需要;如何依靠大數(shù)據(jù)技術來幫助企業(yè)實現(xiàn)科學生產(chǎn),將多種不同類型的數(shù)據(jù)放在一起進行分析提煉,找出它們之間的關系,以圖、表或文宇的形式展現(xiàn)挖掘結果,為業(yè)務人員提供決策輔助,是能化行業(yè)面臨的共同問題。
上海華誼能化公司與經(jīng)營、生產(chǎn)有關的應用系統(tǒng)很多,各種數(shù)據(jù)庫及數(shù)據(jù)類型各異,所有這些基礎數(shù)據(jù)必須經(jīng)過梳理、整合、清洗等,導入到華誼工業(yè)大數(shù)據(jù)分析平臺。
從華誼工業(yè)大數(shù)據(jù)分析平臺的應用層考慮,數(shù)據(jù)的分布主要受以下因素的影響:
(1)數(shù)據(jù)需要盡量均勻地分布到集群中各節(jié)點,以保持負載均衡;
(2)Hadoop集群中節(jié)點故障被視為一種常態(tài),優(yōu)化數(shù)據(jù)分布時需要考慮節(jié)點失效問題;
(3)為保證數(shù)據(jù)的可靠性及查詢處理效率,需要采取多副本冗余方案;
(4)Hadoop運行環(huán)境下,網(wǎng)絡傳輸及磁盤I/O操作是影響整體性能的重要因素,如果能減少數(shù)據(jù)的通信量,將會有效減少數(shù)據(jù)處理時間。
目前華誼工業(yè)大數(shù)據(jù)平臺采用的方式是將同一設備的數(shù)據(jù)盡量存儲在相同節(jié)點上,并且在映射階段完成連接操作,省去約減階段的數(shù)據(jù)通信,從而使整體執(zhí)行效率得到提高。
在進行數(shù)據(jù)讀取時,名字節(jié)點(NameNode)會根據(jù)數(shù)據(jù)節(jié)點與客戶端(Client)之間的距離對多個數(shù)據(jù)節(jié)點進行排序后返回給客戶端,以便從最近的節(jié)點讀取數(shù)據(jù)。Hadoop中網(wǎng)絡節(jié)點呈樹狀結構,其中每棵子樹的根節(jié)點通常是連接計算機的交換節(jié)點(交換機),兩個節(jié)點之間的距離定義為一個節(jié)點到達另一個節(jié)點所經(jīng)過的跳數(shù)。Hadoop的默認配置認為所有的節(jié)點均在一個機架中,因此需要根據(jù)實際集群的配置情況,將集群節(jié)點的網(wǎng)絡拓撲傳遞給Hadoop,才能使Hadoop調度器選擇合理的數(shù)據(jù)節(jié)點進行數(shù)據(jù)讀取和寫入。
在華誼工業(yè)大數(shù)據(jù)平臺的數(shù)據(jù)架構中,Hadoop是處理復雜數(shù)據(jù)流的核心。數(shù)據(jù)往往是從許多分散的系統(tǒng)中收集而來,并導入Hadoop分布式文件系統(tǒng)(HDFS)中,然后通過 MapReduce或者其他基于MapReduce封裝的語言(如Hive,Pig和 Cascading等)進行處理,最后將這些已經(jīng)過濾、轉換和聚合的結果導出到一個或多個外部系統(tǒng)中,具體流程如圖1所示。
圖1 Hadoop數(shù)據(jù)處理流程
在水煤漿的氣化生產(chǎn)中,氣化爐的爐溫是表征氣化爐運行狀況、影響相關控制操作、關系到合成效率和生產(chǎn)安全穩(wěn)定性的重要指標。目前,爐溫的實時監(jiān)控測量主要依賴于高溫熱電偶;然而,在現(xiàn)場高溫高壓、強腐蝕強氣流的作用下,熱電偶的工作壽命很短。受限于生產(chǎn)現(xiàn)場復雜的工況與環(huán)境,熱電偶在損耗后,難以頻繁更換,僅在大修期間有更換的機會。在實際生產(chǎn)中,爐膛溫度一般保持在煤渣熔融溫度的-50~100℃范圍內。若溫度低于該范圍,將直接影響氣化爐的排渣容暢度,導致可能出現(xiàn)堵塞現(xiàn)象;若溫度高于該范圍,則會導致耐火磚壽命下降,合成氣體中有效氣比率下降。綜上所述,生產(chǎn)中氣化爐的爐膛溫度必須保持在一定范圍內,這就對爐膛溫度的實時監(jiān)測提出了較高要求。
在實際的生產(chǎn)經(jīng)驗中,安裝的熱電偶的讀數(shù)僅在氣化爐開車初期是有效的,而在熱電偶讀數(shù)失效后,需要使用軟件模型代替?zhèn)鹘y(tǒng)意義上的傳感器。選取相關的輔助變量建立模型,根據(jù)模型變量的樣本觀測數(shù)據(jù)求出樣本估計式,進而根據(jù)該式推算出該變量的值,這是爐溫軟測量的基本思想。侍洪波等采用基于神經(jīng)網(wǎng)絡等方法建立了氣化爐爐溫軟測量模型并應用于工程實現(xiàn),取得了較好的現(xiàn)場生產(chǎn)運行效果。然而,神經(jīng)網(wǎng)絡等黑箱算法的可解釋性較差,并且不同氣化爐的工藝和實際運行工況相差較大,需要針對具體的氣化爐建立相對應的軟測量模型。
爐溫軟測量是大數(shù)據(jù)技術在氣化爐工藝優(yōu)化領域落地實現(xiàn)的應用之一,一般認為爐膛內壁的溫度分布較均勻,因此,建立爐溫軟測量模型的具體步驟包括數(shù)據(jù)采集與預處理、模型擬合與模型驗證。
爐膛溫度為模型的因變量,所以要采集熱電偶運行較為可靠穩(wěn)定的時間范圍內的數(shù)據(jù)。本文以某化工企業(yè)的多噴嘴水煤漿氣化爐在2017年9月的分鐘級數(shù)據(jù)為取值范圍,采集處理與爐膛溫度有關聯(lián)的數(shù)據(jù)。與爐膛溫度相關的數(shù)據(jù)有很多,包括煤漿濃度、氧氣量、氫氣含量、甲烷含量、一氧化碳含量等幾十個自變量參數(shù),涉及水煤漿制備、氣化反應等多個環(huán)節(jié)。在取值后,需要將這幾十個參數(shù)進行篩選降維,以提高模型的可靠性。
相關系數(shù)法是變量選擇較為常用的方法,該方法通過相關系數(shù)計算獲得兩個變量之間的相關性,從而得出與目標變量相關性較大的操作變量。相關系數(shù)可以分為弱相關性、顯著相關性、高強度相關性三個等級。在工業(yè)實際生產(chǎn)中:采集工業(yè)裝置歷史操作數(shù)據(jù)如煤漿濃度、氧氣流量等作為操作變量,爐膛溫度歷史數(shù)據(jù)作為目標變量,分別計算它們的相關系數(shù),然后以設定的閾值初步篩選出操作變量;考慮到自變量之間存在的自相關問題,結合業(yè)務邏輯,將自相關系數(shù)較高的幾套系數(shù)降維,僅保留其中最具代表性的特征參數(shù),經(jīng)此步驟后,模型的自變量參數(shù)可降至數(shù)個。
模型的目標變量為氣化爐在正常測溫期間的高溫熱電偶數(shù)據(jù),模型的自變量為該期間內的經(jīng)上一步驟篩選過后的數(shù)個相關變量。以時間為標準,將采集數(shù)據(jù)的中前部(約80%)作為訓練集,以擬合爐溫軟測量模型。將采集數(shù)據(jù)中剩余的部分(約20%)作為驗證集,對擬合出的爐溫軟測量模型進行驗證。若精度滿足預定標準要求,則說明模型有較高的指導意義。
經(jīng)過不同的算法模型(例如回歸分析、神經(jīng)網(wǎng)絡等)測試,并比較其精度,本文選取多元線性回歸算法進行了爐溫軟測量模型的建模工作。多元線性回歸模型是指用多個影響因素作為自變量來線性地解釋因變量的變化。設 Y 為因變量,X1,X2,...,Xn為自變量,則多元線性回歸模型為:
其中:c 為常數(shù)項,b1,b2...,bn為回歸系數(shù)。
運用訓練集中的數(shù)據(jù),通過回歸模型擬合,計算出了爐溫軟測量模型的常數(shù)項與回歸系數(shù)。
將上一步驟所獲得的回歸模型應用于驗證集中的數(shù)據(jù),通過比較熱電偶實際讀數(shù)與爐溫軟測量模型的預測值(見圖2),可對軟測量模型的效果進行評價。
圖2 熱電偶讀數(shù)與爐溫軟測量模型預測值比較
由圖2可知,基于多元線性回歸方法的氣化爐爐溫軟測量模型擬合精度較好,其回歸模型的輸出值與熱電偶讀數(shù)真實值之間的相對誤差較小,趨勢跟蹤較為吻合,基本能夠滿足實際工業(yè)生產(chǎn)要求。
從滿足工藝要求的模型,到可以實時顯示現(xiàn)場操作人員能直觀理解的操作參數(shù)、操作建議和實際運行效果,需要借助于一個直觀的展示平臺。
隨著大數(shù)據(jù)和智能化等技術的發(fā)展,化工產(chǎn)業(yè)正在嘗試建立“以數(shù)據(jù)為驅動”的生產(chǎn)優(yōu)化模型和成本控制模型。從數(shù)據(jù)分析挖掘和智能模型的角度提升生產(chǎn)過程的穩(wěn)定性和效率,逐步向智能化的目標發(fā)展。華誼工業(yè)大數(shù)據(jù)分析平臺主要包含煤漿優(yōu)化、爐溫預測、有效氣優(yōu)化三大模塊,更加直觀地展示工業(yè)大數(shù)據(jù)經(jīng)過建模處理后的效果。
5.2.1 煤漿優(yōu)化模塊——煤漿實際濃度圖
煤漿實際濃度圖所展示的內容為各類煤漿的實際濃度值,如圖3所示,數(shù)據(jù)主要來源于生產(chǎn)檢驗數(shù)據(jù)庫。圖形下方滾動條可以自由縮放,以方便數(shù)據(jù)的檢查和校驗。圖形右邊的按鈕可以實現(xiàn)圖形形態(tài)的轉換和下載。
圖3 煤漿實際濃度圖
5.2.2 爐溫軟測量模塊——爐溫軟測量效果圖
通過對實時數(shù)據(jù)庫系統(tǒng)的相關數(shù)據(jù)進行分析,可通過模型計算出爐溫的軟測量數(shù)值,效果如圖4所示。圖中線條分別為從數(shù)據(jù)庫讀取的爐溫實際值與經(jīng)過模型計算分析處理后得出的爐溫軟測量值,可以看出計算值與實際值的擬合程度較高,說明模型計算效果明顯。圖形下方滾動條可以自由縮放,方便數(shù)據(jù)的檢查和校驗。圖形右邊的按鈕可以實現(xiàn)圖形形態(tài)的轉換和下載。
5.2.3 有效氣優(yōu)化模塊——有效氣產(chǎn)量值
有效氣的產(chǎn)量值是通過一系列的相關性指標計算得到的,如圖5所示。圖形下方滾動條可以自由縮放,方便數(shù)據(jù)的檢查和校驗。圖形右邊的按鈕可以實現(xiàn)圖形形態(tài)的轉換和下載,展示更加靈活。
圖4 爐溫預測效果圖
圖5 有效氣產(chǎn)量值
借助大數(shù)據(jù)技術能夠快速處理生產(chǎn)數(shù)據(jù),并利用歷史生產(chǎn)、實驗數(shù)據(jù)對氣化生產(chǎn)工藝中產(chǎn)生的數(shù)據(jù)進行分析建模,最終建立爐溫軟測量模型。大數(shù)據(jù)技術在氣化工藝中的實現(xiàn)是一項先進技術與傳統(tǒng)工藝結合的應用,該項目對生產(chǎn)實踐具有明顯的指導作用,它以科學的算法計算結果代替操作人員的經(jīng)驗,可以降低相關人員的工作強度,提高生產(chǎn)的安全性。利用算法與大數(shù)據(jù)的優(yōu)勢可以穩(wěn)定生產(chǎn)、提高產(chǎn)量,實現(xiàn)數(shù)據(jù)化管理。
參考文獻(略)