侯士超(昆侖數(shù)智科技有限責(zé)任公司,北京 102206)
在大數(shù)據(jù)時代背景中,數(shù)字化正在改變著流程工業(yè)對業(yè)務(wù)和技術(shù)的傳統(tǒng)認(rèn)知,數(shù)據(jù)即資產(chǎn)?;诖髷?shù)據(jù)在工業(yè)裝置上的應(yīng)用是石化企業(yè)未來生存和發(fā)展的根基,一切生產(chǎn)活動都將依賴于數(shù)據(jù)應(yīng)用和服務(wù)。未來誰能做到“有據(jù)可依”“智能分析”,掌握“數(shù)據(jù)變現(xiàn)”,才能真正實現(xiàn)工業(yè)應(yīng)用的智能分析?;跀?shù)據(jù)的智慧分析應(yīng)用將是發(fā)展實現(xiàn)“數(shù)據(jù)變現(xiàn)”的有力手段。
利用不同的大數(shù)據(jù)分析方法,應(yīng)用到實際生產(chǎn)中去,通過數(shù)據(jù)挖掘與探索分析,發(fā)現(xiàn)數(shù)據(jù)特征及規(guī)律,作為數(shù)據(jù)建模輸入的依據(jù)。常見的數(shù)據(jù)特征分析方法有數(shù)據(jù)特征描述、相關(guān)性分析、主成分分析等。數(shù)據(jù)首先要轉(zhuǎn)換成適合于挖掘的形式,即統(tǒng)一數(shù)據(jù)的量綱及數(shù)量級,稱為數(shù)據(jù)標(biāo)準(zhǔn)化。常用的方法有數(shù)據(jù)泛化、標(biāo)準(zhǔn)化、屬性構(gòu)造等。
數(shù)據(jù)轉(zhuǎn)換主要包括以下幾種方法:
(1)基期標(biāo)準(zhǔn)化法
選擇數(shù)據(jù)系列的第一個時期作為參照,各期標(biāo)準(zhǔn)化數(shù)據(jù)=各期數(shù)據(jù)/基期數(shù)據(jù)。
(2)直線法
①極值法:
②z-score法:
(3)折線法
(4)曲線法
①Log函數(shù)法:x′=log(xi)/log(max(xi));
②Arctan函數(shù)法:x′=arctan(xi)×2/π。
綜上所述,在起搏器間歇性感知功能字符異常的臨床診斷中采用動態(tài)心電圖檢測展示良好效果,存在比較高的檢出幾率,檢出準(zhǔn)確性比較好。
通過以上幾種方法進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化轉(zhuǎn)換,實現(xiàn)數(shù)據(jù)分析的基礎(chǔ)。下一步進(jìn)行數(shù)據(jù)分析,建立分析模型,形成解決工業(yè)裝置實際問題的方案,在分析中主要有以下幾種方法:
(1)回歸分析(趨勢研判)
進(jìn)行回歸分析之前有兩個準(zhǔn)備工作,第一確定變量的數(shù)量。第二確定自變量和因變量。只有一個變量X與因變量Y有關(guān),使用一元回歸;分析多個變量與因變量Y的關(guān)系,使用多元回歸。
(2)聚類分析(發(fā)生概率)
K-Means聚類算法。主要思想是:首先將各個聚類子集內(nèi)的所有數(shù)據(jù)樣本的均值作為該聚類的代表點,然后把每個數(shù)據(jù)點劃分到最近的類別中,使得評價聚類性能的準(zhǔn)則函數(shù)達(dá)到最優(yōu),從而使同一個類中的對象相似度較高,而不同類之間的對象的相似度較小[1]。
(3) EM算法(關(guān)聯(lián)關(guān)系)
通過EM算法建立關(guān)鍵性參數(shù)與大量操作數(shù)據(jù)、原料性質(zhì)數(shù)據(jù)、裝置數(shù)據(jù)等工業(yè)數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系網(wǎng)。最大期望算法經(jīng)過兩個步驟交替進(jìn)行計算,第一步是計算期望(E);第二步是最大化(M)。M步上找到的參數(shù)估計值被用于下一個E步計算中,這個過程不斷交替進(jìn)行,也就是迭代使用EM步驟,直至收斂。
本文通過嘗試,各方法都有缺點,在方法選擇中根據(jù)數(shù)據(jù)特征確定分析方法,如:聚類分析、關(guān)聯(lián)分析等常用直線法;而綜合評價則折線和曲線方法用得較多。
在分析方法的選擇上,本文主要用到的算法如表1所示。
表1 大數(shù)據(jù)分析算法
催化裂化裝置作為煉油廠生產(chǎn)汽、柴油的主要裝置,其加工工藝最復(fù)雜、操作控制難度大,在各類主裝置非計劃停工中占比最高[2]。目前,大部分煉化企業(yè)裝置運(yùn)行周期只有3年,裝置運(yùn)行周期還有很大的提升空間。在大多數(shù)煉廠中,催化裝置主要存在以下三個問題:一是報警占比高,運(yùn)行不平穩(wěn)等;二是催化裝置非計劃停工占停工總數(shù)的大部分,其中結(jié)焦是主要原因,結(jié)焦問題表現(xiàn)在結(jié)焦量難以預(yù)測;三是運(yùn)行工況的不同造成汽油收率高低差異較大[3]。因此,催化裂化裝置生產(chǎn)中出現(xiàn)的問題需要重點解決。本文是基于海量的運(yùn)行數(shù)據(jù)和分析化驗數(shù)據(jù),通過對催化裂化裝置進(jìn)行大數(shù)據(jù)分析研究,嘗試對報警、結(jié)焦和收率建立算法模型,提出提高裝置運(yùn)行的“安穩(wěn)長滿優(yōu)”、優(yōu)化產(chǎn)品結(jié)構(gòu)、提升裝置經(jīng)濟(jì)效益的建議方案。
造成非計劃停車經(jīng)過統(tǒng)計,催化裝置報警占比高,運(yùn)行不平穩(wěn)。通過大數(shù)據(jù)分析得到的關(guān)鍵報警位點的根原因,與專家經(jīng)驗分析的結(jié)果存在很大程度的重合性,表明大數(shù)據(jù)分析結(jié)果可信度高。發(fā)現(xiàn)新的報警根原因,以再生滑閥壓降為例,如圖1所示,利用大數(shù)據(jù)分析發(fā)現(xiàn)了其根原因“待生斜管滑閥閥位”。經(jīng)過工業(yè)驗證,證明待生斜管滑閥閥位對再生滑閥壓降存在反向影響,分析結(jié)果正確,這是僅憑以往經(jīng)驗發(fā)現(xiàn)不了的。
圖1 大數(shù)據(jù)報警原因分析
通過分析挖掘催化裂化裝置報警規(guī)律,基于大量歷史數(shù)據(jù)計算各位點間的相關(guān)性,形成因果鏈路圖,暴露引發(fā)報警的源頭,進(jìn)行重點監(jiān)測和控制,以因果鏈路知識庫為基礎(chǔ),建立預(yù)警模型,形成對關(guān)鍵報警位點的預(yù)警機(jī)制,以輔助操作人員及時做出判斷和調(diào)整。從實際案例分析,如圖2所示,曲線為過程數(shù)據(jù),黑粗線為預(yù)測值,生產(chǎn)過程中利用大數(shù)據(jù)分析建立預(yù)警算法,在報警發(fā)生前提前預(yù)警,預(yù)警模型判斷2 min后“二再密相溫度”將出現(xiàn)報警,預(yù)警發(fā)出時,技術(shù)人員可以收到反饋,及時采取工藝調(diào)整等措施,為裝置非停爭取到寶貴時間。
圖2 大數(shù)據(jù)報警預(yù)測
基于大數(shù)據(jù)分析回歸方法,建設(shè)生焦率的預(yù)測模型,采集有效樣本數(shù)萬組,測算了催化長時間的結(jié)焦量,并進(jìn)行了現(xiàn)場的工業(yè)驗證。模型的預(yù)測值較為準(zhǔn)確,解決了結(jié)焦這個不可測變量的定量化問題。每天估算沉降器內(nèi)的結(jié)焦總量,為操作提供參考,為催化裝置的長周期運(yùn)行提供支持。如圖3所示,每天估算沉降器中關(guān)鍵部位的結(jié)焦量。
圖3 結(jié)焦累計分析
依據(jù)相關(guān)性分析篩選出來的影響因素,從大量生產(chǎn)數(shù)據(jù)中分析對汽油收率影響較大的工藝因素。如圖4所示,結(jié)合裝置現(xiàn)場條件確定可調(diào)操作變量,并以汽油收率最大化為目標(biāo)尋優(yōu)可調(diào)操作變量。建立大數(shù)據(jù)分析模型,采用神經(jīng)網(wǎng)絡(luò)技術(shù)建立的汽油收率模型,從而實現(xiàn)實時提供汽油收率最大化的生產(chǎn)操作方案。
圖4 汽油收率最大優(yōu)化方案
隨著本次大數(shù)據(jù)應(yīng)用的研究,可以得出:通過大數(shù)據(jù)分析報警應(yīng)用,可有效減少裝置報警次數(shù),提高裝置平穩(wěn)運(yùn)行率;通過本次研究可以有效減少報警次數(shù)50%以上;通過對催化裝置結(jié)焦大數(shù)據(jù)分析應(yīng)用,有效延緩裝置結(jié)焦,提高裝置運(yùn)行周期,實現(xiàn)催化裝置結(jié)焦?fàn)顩r的即時評估,減少催化裝置因結(jié)焦造成的非計劃停工次數(shù);通過裝置汽油收率研究,有效提高催化裝置目的產(chǎn)品收率,催化裝置汽油收率提升1個百分點左右。
對于煉化企業(yè)來說,以真實的運(yùn)行數(shù)據(jù)預(yù)測未來趨勢,以便做出正確的生產(chǎn)或經(jīng)營決策,如何對生產(chǎn)運(yùn)行安全性預(yù)測預(yù)警落實到裝置粒度等,生產(chǎn)及經(jīng)營數(shù)據(jù)如何有效關(guān)聯(lián)和挖掘,提升認(rèn)知,深化應(yīng)用,成為企業(yè)迫切需求。因此,對數(shù)據(jù)的分析方向在流程工業(yè)的應(yīng)用,應(yīng)該以信息化和智能化手段,通過大數(shù)據(jù)分析技術(shù),從統(tǒng)計分析向預(yù)測分析轉(zhuǎn)變,從被動分析向主動分析轉(zhuǎn)變,真正解決企業(yè)業(yè)務(wù)痛點,為企業(yè)創(chuàng)造經(jīng)濟(jì)效益。