高偉華
(國家電網(wǎng)大慶供電公司客戶服務中心 大慶 163300)
人工智能經(jīng)過數(shù)十年發(fā)展,已經(jīng)廣泛應用于工業(yè)生產(chǎn)輔助決策、故障診斷及工程監(jiān)測的各領域,并發(fā)揮著極大的作用,如CM-BOSS系統(tǒng)[1],PCRC生產(chǎn)預警監(jiān)測系統(tǒng)[2]等。隨著企業(yè)及工業(yè)生產(chǎn)規(guī)模不斷擴大,對故障診斷和異常分析的精細化程度逐步提高,伴隨知識體系的不斷完善,單一智能方法已經(jīng)無法滿足當前對智能化故障診斷的實際需求[3]。于是,采用多種智能技術,合理設計生產(chǎn)異常故障診斷方法,提供切實可用的輔助分析方案成為提高智能化應用準確率和有效性的關鍵[4]。
領域決策者和專家的經(jīng)驗及思維方式對于智能化應用至關重要。雖然通過知識發(fā)現(xiàn)、不確定性推理等手段可以很好地發(fā)現(xiàn)異常發(fā)生規(guī)律,較好地解決相關領域內的故障認定,風險評價,措施優(yōu)選等問題,但是依舊存在以下缺陷:1)針對生產(chǎn)異常故障診斷的知識準確率不高,自學習和自適應能力較差;2)故障診斷知識可復用性差,導致推理過程運算冗余較大,響應時間較長;3)工程預警、異常診斷等推理存在故障并發(fā)、復合異常等情況,傾向性和置信度計算不夠準確。
針對上述問題,研究基于混合智能技術的抽油機電力故障診斷方法,定義生產(chǎn)異常規(guī)則結構,構建BP神經(jīng)網(wǎng)絡,實現(xiàn)知識發(fā)現(xiàn)及自適應自校正過程;采用多級框架結構構建知識庫,降低知識推理過程的復雜性;引入論據(jù)累積的貝葉斯方法,提高復合異常的推理能力,并最終形成基于混合智能技術的抽油機電力故障診斷方法,以達到精確描述抽油機電力故障原因,擴展知識表達方式,提高故障診斷速度和準確率的目的。
專家組對于領域內與事務相關的知識界定和分類較為準確,知識的結構具有一定通用性[4~5]。將知識的表達轉化為抽象的邏輯表示形式是實現(xiàn)高效推理的基礎。
規(guī)則結構是知識依據(jù)相同算法聚類抽象形成的閉包[6],由結構主體 Rc和擴展集 RE組成,其中Rc算法實體由D-Ag算法庫提供。以n位專家組成的專家組,領域內存在某事務W,給出與事務W相關的規(guī)則結構一般表述形式為
定義導向函數(shù)T(n),給出案例主體Rc的一般表述形式為
其中ID反應該規(guī)則唯一性,標準表達結構如式(1)所示
Desc表示該規(guī)則結構的自然語言描述;門類T(Frame)包括環(huán)切型和值切型;T(An)表示映射算法實體;權值T(Value)表示該隸屬程度,反應該滿足結論的程度;Ot表示規(guī)則結論。
擴展集RE由描述支持規(guī)則推理和擬合運算的參數(shù)集合構成。參數(shù)集以數(shù)據(jù)實例形式存儲,并以鏈表形式反應參數(shù)間關系。
擴展集包括必備線性因素和非必備線性因素。定義規(guī)則導向函數(shù)F(n),給出其一般表示形式為
ID與Rc存在唯一映射關系;F(kind)標注擴展類型,反應擴展集遞推方法;F(order)表示擴展集的指針序列;F(Value)表示規(guī)則槽值;F(desc)表示規(guī)則的自然語言描述。
于是,在一個規(guī)則內,Rc與RE的對應關系可描述為
其中U(RE|n)表示n維 RE子集(n>1);對應關系表達式滿足T(Rcn)=U(RE|n);運算復雜度如式(2)所示。
知識作為規(guī)則的實例化[7],除繼承FC規(guī)則閉包的全部元素外,包括事務類型Wk,框架對象Fr及用于計算槽值隸屬度的G,給出知識的一般表示形式如下
其中,事務類型Wk包括反應事務發(fā)生類型及發(fā)生定級;框架對象Fr反應該知識所隸屬框架對象;槽值隸屬度的G用于計算框架匹配程度及規(guī)則滿意度,用以進一步計算該知識滿足推理后件的概率。
BP網(wǎng)絡是按層次結構構造[8~9],包括一個輸入層,一個輸出層和一個(或多個)隱含層,一層內的節(jié)點(神經(jīng)元)只和該層緊鄰的下一層的各節(jié)點連接。
定義:wi,j表示上一層單元i到本層單元j的連接權。表示單元j的偏置。On表示單元n的輸出。
1)提供訓練集,輸入數(shù)據(jù)向量為x1,x2…xn輸入層節(jié)點j的輸出為xj1=f(xj),為了使BP網(wǎng)絡隱含層的輸入規(guī)范化,定義歸一函數(shù)如式(4)所示:
其中 Xmin為節(jié)點輸入的(2)隱含層及輸出層的輸入如式(5)所示:
偏置θj用來充當閾值,改變單元的活性。
2)將激活函數(shù)作用于輸入向量逐級計算輸出值。激活函數(shù)選用了S型函數(shù)對于節(jié)點J輸出如式(6)所示。
3)BP網(wǎng)絡的權值調整基于實際輸出與期望輸出的最小均方差如式(7)所示:
C表示輸出層單元數(shù);Tk表示輸出層單元k的期望輸出。
4)為了使學習以盡可能減小誤差均方差的方式進行,因此,采用使E沿梯度方向下降的方式進行調整:
對于中間隱層,則采用遞歸的方法從輸出節(jié)點K返回到中間隱層。
5)權重,單元偏置的修改公式為
用步驟5)多次修改網(wǎng)絡權值,直到達到精度要求或網(wǎng)絡不收斂。
由上式可知:當前一次的校正量過調時,慣性項與本次誤差校正項符號相反,使得本次實際校正量減小,起到減振蕩的作用;當前次校正量欠調時,慣性項與本次誤差校正項符號相同,起到加速校正的作用。另外,動量因子還可以防止學習過程在錯誤表面上的表層局部最小化時終止。
不確定性知識庫(UnM)采用多級框架-產(chǎn)生式結構[10]??蚣芟到y(tǒng)反應業(yè)務分類情況,產(chǎn)生式系統(tǒng)直接參與知識推理過程。
多級框架由多個單體框架構成。單體框架反應領域內與事務相關的推理描述;基本邏輯結構由槽集Kn、社會性關系Cm及行為信息U(f)組成。給出一般描述形式如下:
槽集Kn由多個槽構成。單體槽由知識K、槽值Kv、默認槽值 Kv'和槽值域Km?{0,1}組成,知識由RK-PS知識庫提供,反應不同斜面的傾向度。
行為信息,也稱為守護程序,表示在槽值未指定時,指向的修改動作,通常以WHEN CHANGED形式記錄。
多級框架結構的級聯(lián)關系由單體框架的社會性關系Cm描述。Cm反映框架本體與其他框架的子父類情況,標識其在多級框架的位置。定義單體框架Fm,其社會性關系Cm的一般表述形式如下:
其中,son_Fm表示Fm的子框架,定義標記變量sfn,則反映Fm在多級框架的位置標記方式如下:
P_Fm表示Fm的父類框架,用于校驗子框架son_Fm的表述完整性,由于多級框架采用1-N映射,所以count(P_Fm)=1。
Is_End反映框架終結情況,也是區(qū)分框架實體行為發(fā)生標準。當Is_End=0,則繼續(xù)索引子框架;當Is_End=1,執(zhí)行守護程序WC。
F_Level描述框架的級別位置。F_Level與框架遍歷算法的復雜度o(n)的關系如式(8)所示:
由此可知,通常情況下,F(xiàn)_Level≤4;同時,對于高階高級框架系統(tǒng)可以采用經(jīng)驗分解法EMD或聚類算法拆解,降低其計算復雜度。
不確定性推理方法(UnMF方法)以UnM知識庫為基礎,引入隸屬度和槽值作為確信因子,采用正向推理方式,分析高幅變化數(shù)據(jù),對可能框架實施推理并計算最優(yōu)解。主要推理算法如下描述:
Start:遞歸父類框架;
S1.獲取高幅變化案例,遞歸子框架;
S2.遍歷分析終結框架Fz;
S3.獲取槽集知識前件;
S4.反向定位父類規(guī)則集R;
S5.反射推理,定位匹配算法;
S6.計算規(guī)則R符合程度;
S7.計算框架滿意度;
S8.判斷事務發(fā)生概率;
S9.返回S2;
Result:給出超閾的框架U(Fz),分析觸發(fā)原因。
最終,返回域U(Fz)即為框架的匹配結果。其中,通過反射推理方法定位匹配算法是實現(xiàn)觸發(fā)式運算實體主動運算的關鍵。
擬合算法或函數(shù)是規(guī)則R前件條件匹配計算的主體內容。通過規(guī)則R內描述的擬合算法,在算法庫中搜索算法實體并實施條件匹配,是知識推理的關鍵步驟。反射推理方法是實現(xiàn)這一關鍵步驟的核心技術。
反射推理方法的作用對象是元數(shù)據(jù),本質是一種定位、捕獲和使用元數(shù)據(jù)的方法。元數(shù)據(jù)由算法庫內算法實體構成。支持反射推理的組件由輸入接口、定位模塊、反射執(zhí)行模型和校驗模塊組成。
以規(guī)則前件的條件匹配過程為例,反射推理具體執(zhí)行步驟如下:
Start.基于算法描述獲取目標算法;
S1.分析并獲取算法的類型信息及參數(shù)定義;
S2.動態(tài)創(chuàng)建反射對象Rf;
S3.索引內搜索并定位目標算法實體P;
S4.創(chuàng)建實例 P′,賦值Rf;
S5.校驗Rf,執(zhí)行 P′;
End.返回計算結果。
最終返回結果將作為規(guī)則R的置信度,反射推理方法的知識推理過程存在并發(fā)沖突及不確定性界定問題。并發(fā)沖突可采用論據(jù)累積的貝葉斯方法解決,不確定性界定可通過確信因子計算判定。
定義知識k的事實論據(jù) pH,隸屬概率G(k),權值V(k→r),建立三者聯(lián)系如式(9)所示
r表示知識k的隸屬規(guī)則。定義事件E,H分別表示不同知識闡述的事實,H表示假設,事件關系為OR,重寫貝葉斯公式如式(10)所示:
其中:p(H)為事件H發(fā)生的先驗概率;p(E|H)為事件H發(fā)生后的論據(jù)E概率;p(﹁H)是事件H不發(fā)生的先驗概率;p(E|﹁H)是事件H不發(fā)生時候論據(jù)E的概率。
由貝葉斯方法衍生,累計計算事實論據(jù)E下的非單一假設H1-Hi的發(fā)生概率;或給定多事實論據(jù)E1-En,反向推廣假設H的發(fā)生概率。
假設事實H1-Hi、E1-En相互獨立且完備,則H1-Hi|E的情況如式(11)描述:
對于H1-Hi|En的情況如式(12)描述:
由于所有組合條件的概率計算難度較大,所以忽略微小論據(jù)差異,并假設條件獨立,式(13)描述了論據(jù)累計的貝葉斯方法。
在獲取不確定性多級框架滿意度結果后,需要校驗其可信度。設定單體框架誤差精度λ0,依據(jù)距離偏移誤差公式得:
其中ψps表示在槽值點Tps,預期結果F(Tps)與實際值dkps的偏移差;計算平均誤差率
及最大誤差率
當 λmax<λ時,認為框架匹配度較高;當λ<λmax,λ_<λ時,認為框架結果發(fā)生局部偏差,將進行局部重新計算。當 λ<λmax,λ< λ_時,認為該框架結果需要進行重新計算或舍棄。
以HimF方法為理論基礎,設計抽油機電力故障診斷模型,通過分析計算油井單井抽油機生產(chǎn)狀態(tài)中的電力檢測數(shù)據(jù)[11],結合油藏地質學理論知識和生產(chǎn)經(jīng)驗,獲取電力故障原因分析,實現(xiàn)故障推理診斷,并應用在大慶油田某采油廠地質大隊、作業(yè)大隊等相關單位。為了縮小地質師和作業(yè)工程師的初次界定范圍,規(guī)避客觀環(huán)境影響,通過與油藏學家及上游生產(chǎn)信息系統(tǒng)(PCEDM)設計師的反復交流和推敲[12],建立電力故障診斷知識庫,并定義抽油機電力故障原因代碼對應關系,如表1所示。
表1 抽油機電力故障原因代碼表
抽取了310個訓練樣本,100個正常樣本,不平衡、斷脫、偏磨各70個樣本,每個樣本都包括38個輸入?yún)?shù)(32個采樣點,6個特征值),所有樣本均經(jīng)過歸一化處理。選用三層BP神經(jīng)網(wǎng)絡結構,其中,輸入層有38個節(jié)點,隱層有15個節(jié)點,輸出層有4個節(jié)點。
網(wǎng)絡的初始權值和閾值:輸入層至隱層的連接權wij、隱層至輸出層的連接權vjk、隱層各單元的輸出閾值θj、輸出層各單元的輸出閾值γj,都選取為(-1,1)之間的隨機數(shù),網(wǎng)絡隱層的傳遞函數(shù)和輸出的傳遞函數(shù)均采用S(sigmoid)型函數(shù),利用動量BP算法,替代原BP算法中的梯度下降法訓練神經(jīng)網(wǎng)絡,求出最佳網(wǎng)絡連接權值和閾值。所建立的神經(jīng)網(wǎng)絡結構如圖1所示。
圖1 三層BP網(wǎng)絡結構
利用選取的數(shù)據(jù)樣本作為網(wǎng)絡訓練的原始樣本,確定初始連接值和閾值后利用Delphi編程,訓練的速度為0.1,訓練誤差精度為0.001,網(wǎng)絡訓練直到滿足精度要求為止,得出最終的各個連接權值和閾值,訓練結束,性能曲線見圖2。
圖2 訓練性能曲線
使用20個校驗樣本,用校驗數(shù)據(jù)對網(wǎng)絡進行檢驗,檢驗結果如表2所示。
表2 校驗結果
由實驗數(shù)據(jù)可以看出,根據(jù)故障代碼和檢驗結果,輸出節(jié)點1的輸出值為0.9214,已經(jīng)比較接近1,可以判斷為正常狀態(tài);不平衡狀態(tài)時,輸出點2的輸出值是0.8687,也可以作出判斷;其他狀態(tài)所對應的輸出點的輸出值都在0.85以上,診斷結果與實測值具有良好的一致性,診斷誤差滿足要求,能夠與實際的檢驗樣本狀態(tài)相吻合,可見該BP神經(jīng)網(wǎng)絡完全可以滿足抽油機常見電力故障的診斷要求。
定義KM2表示抽油桿斷脫斷電框架,框架內槽可用KM2C1-KM2C6表示。將KM2框架內的知識歸結為表3所示規(guī)則。
表3 規(guī)則及知識表達實例
其中對象A表示槽的數(shù)據(jù)實體;KM2C2(電壓驟減)是規(guī)則(對象A環(huán)比下降)中閾值參數(shù)等于0的特殊情況,KM2C4(電流值極?。┦且?guī)則中閾值參數(shù)等于參數(shù)本身的特殊情況。給出槽(C)的權值(v)如下表示
為進行并發(fā)測試,同時選用電壓波動和電流曲線失衡異常作為并發(fā)測試條件[13]。給出單次周期內產(chǎn)量擬合實驗離散點分布如圖3所示。
圖3 產(chǎn)油量離散點分布圖
篩選某采油廠北六區(qū)塊108口油井異常井,計算所有井的框架隸屬程度。定義隸屬程度閾值為55%。給出與真實情況的對比及與常規(guī)方法的數(shù)據(jù)對比分析如表4所示。
表4 多方法診斷結果數(shù)據(jù)對比
由表2、表4可得到以下結論:
1)基于改進的動量法BP神經(jīng)網(wǎng)絡的故障診斷結果與實測值具有良好的一致性,正確率可達86%以上,但需要足夠典型的原始故障樣本。
2)傳統(tǒng)方法的并發(fā)誤差率較大,處理單電機電力異常診斷同樣存在誤差,對于復雜因素的分析能力較差。
3)HimF方法準確率明顯好于傳統(tǒng)方法,但在曲線失衡和電機高速等多映射原因分析過程中依舊存在誤差。
4)真實現(xiàn)場分析過程準確率較高,但成本消耗高,實時性較差。
以HimF方法為基礎開發(fā)的抽油機電力故障診斷及預警系統(tǒng),電力設備異常診斷輔助分析系統(tǒng)已經(jīng)正常工作,因其對專家意見的深度合理分析,較好的自適應性和相對簡單的應用過程受到了應用單位的較好評價。
論文提出了一種基于混合智能技術的定義生產(chǎn)異常規(guī)則結構(PAC結構),設計基于的動量法BP神經(jīng)網(wǎng)絡實現(xiàn)對特征變化趨勢和規(guī)律的描述;其次,采用規(guī)則-知識衍生方式,設計抽油機電力故障知識庫結構;最后,采用正向推理方式,提出逆向定位算法,應用論據(jù)累積的貝葉斯方法實現(xiàn)沖突消解,完成基于混合智能技術的抽油機電力故障診斷方法(HimF方法)的研究,以此達到精確描述抽油機電力故障原因,擴展知識表達方式,提高故障診斷速度和準確率的目的。