張可佳 ,李春生 ,王 梅
(東北石油大學(xué)a.計(jì)算機(jī)與信息技術(shù)學(xué)院;b.現(xiàn)代教育技術(shù)中心,黑龍江 大慶163318)
人工智能發(fā)展至今,各種混合智能方法層出不窮,如InterBay 方法[1]、不確定推理下的混合智能圖像分割方法[2]等。由于知識(shí)是多數(shù)智能方法實(shí)現(xiàn)中最基本的組成元素,能夠描述業(yè)務(wù)邏輯的表達(dá)內(nèi)容,因此在智能化應(yīng)用過程中起到?jīng)Q定性因素之一的依舊是知識(shí)[3]。模糊概念的提出解決了某些定性化知識(shí)無法定量轉(zhuǎn)化的問題,降低了知識(shí)推理的唯一性限制,拓寬了知識(shí)應(yīng)用領(lǐng)域,使知識(shí)推理的并發(fā)性和概率性更具意義[4]。以領(lǐng)域決策者和專家為代表的知識(shí)人對(duì)于知識(shí)的重要性體會(huì)頗深。雖然現(xiàn)在通過知識(shí)推理或模式匹配等智能化方法可以很好地解決領(lǐng)域內(nèi)的故障診斷、危險(xiǎn)評(píng)估、作業(yè)方案優(yōu)選等問題,但是依舊或多或少地存在以下缺陷:(1)由專家組成的決策群體對(duì)于知識(shí)單體具有相同的判別傾向,但傾向程度會(huì)有不同,傾向程度反映了專家對(duì)于知識(shí)的深度認(rèn)識(shí)和潛在經(jīng)驗(yàn),這對(duì)于模糊集下提高精細(xì)化計(jì)算至關(guān)重要[5],現(xiàn)有的多數(shù)知識(shí)結(jié)構(gòu)往往忽略如何科學(xué)合理地統(tǒng)一專家傾向程度。(2)技術(shù)的快速發(fā)展導(dǎo)致知識(shí)自學(xué)習(xí)訓(xùn)練過程中影響因子繁多[6],計(jì)算過程復(fù)雜,對(duì)于知識(shí)自適應(yīng)調(diào)整的因素考慮過于離散并依賴專業(yè)知識(shí),導(dǎo)致很多專家系統(tǒng)的智能化自適應(yīng)機(jī)制復(fù)雜,應(yīng)用性較差。
針對(duì)上述問題,本文通過C-E 模型設(shè)計(jì)基于語義限制的模糊規(guī)則,改進(jìn)有限集語義限制表達(dá)方法[6],將專家傾向進(jìn)行定量化描述,作為知識(shí)結(jié)構(gòu)的重要因素。采用非線性擬合、均方差收斂等數(shù)學(xué)手段實(shí)現(xiàn)規(guī)則自適應(yīng)過程,以屏蔽自適應(yīng)調(diào)整過程中復(fù)雜的專業(yè)因素,并由規(guī)則對(duì)象組成條件組構(gòu)成基于類框架的知識(shí)結(jié)構(gòu),實(shí)現(xiàn)降低領(lǐng)域影響因子的影響、提高模糊知識(shí)的精細(xì)化準(zhǔn)確程度、深度挖掘知識(shí)人與知識(shí)潛在關(guān)聯(lián)的目的。
規(guī)則是知識(shí)的重要組成部分。將類型相同的規(guī)則進(jìn)行聚類抽象得到C-E 模型。具體定義如下:
定義規(guī)則R可由表示支持其隸屬度計(jì)算的屬性及相關(guān)方法的集合C(核心集)與表示其他表征意義的屬性及相關(guān)方法的集合E(擴(kuò)展集)表示。其一般形式如下所示:
其中,R表示模糊規(guī)則;C表示直接參與隸屬度計(jì)算的參數(shù)、函數(shù)及控制行為的集合,也稱核心集合,C不為空;E表示描述R的其他屬性及行為的集合,也稱擴(kuò)展集。聲明間接參與隸屬度計(jì)算、輔助非線性擬合過程的訓(xùn)練樣本也屬于E集。
C-E 模型將涉及隸屬度計(jì)算的核心屬性及行為抽象統(tǒng)一,與其他屬性及方法分開,能夠清晰地表述某抽象理論的實(shí)例化模型,提高結(jié)構(gòu)的松散度,易于理解和深入研究。
通常由專家組對(duì)于某規(guī)則的結(jié)論判別具有相同的傾向,但是傾向程度不同。例如:?模糊規(guī)則R,描述為X隸屬度為V。專家們對(duì)于R的判斷均可能為真,但會(huì)出現(xiàn)不同的判斷傾向程度[7],于是引入語義限制進(jìn)行判斷傾向程度描述。
很多人工智能方法試圖引入語義限制進(jìn)行傾向性描述,在自然語言學(xué)的原型中,對(duì)于語義限制進(jìn)行過定量化分析,但是分析結(jié)果僅為有限的非連續(xù)映射點(diǎn)集,對(duì)于準(zhǔn)確度存在一定影響。針對(duì)這一問題,提出一種語義限制的描述方法,以連續(xù)有界的非線性函數(shù)描述語言變量的傾向程度,稱該函數(shù)為語義限制函數(shù)。
以上文所述C-E 模型作為模糊規(guī)則的載體,設(shè)計(jì)基于語義限制的模糊規(guī)則結(jié)構(gòu),表示如下:
其中,C是C-E 模型中的核心集;X表示需要進(jìn)行隸屬度計(jì)算的隸屬因子;μc(X)表示計(jì)算規(guī)則隸屬度的特征函數(shù);t表示語言變量;ξc(t)表示計(jì)算該隸屬度傾向程度的語義限制函數(shù),語義限制變量t的取值范圍為[0,1]。規(guī)則默認(rèn)類型為模式匹配。
定義初始狀態(tài)的原始語言變量集Go={t}來自于專家組的不同傾向度,表示為有限集Gexis={t1,t2,…},根據(jù)枚舉的邊界性得到Gexis∈[min(t),max(t)],t∈[0,1],Gexis的邊界一定落在[0,1]區(qū)間,根據(jù)專家的分析特點(diǎn),?相對(duì)狹小區(qū)域Glim,滿足Gexis?Glim,Gexis是語義限制函數(shù)初始化過程的重要組成部分。
通常特征函數(shù)μc(X)∈[0,1],為了保證取值范圍不會(huì)過小,遞增率保持較低,令規(guī)則采用冪函數(shù)法表達(dá)。取模糊規(guī)則R的核心集C,規(guī)則的匹配度PR的表達(dá)式如式(1)所示:
令μc(X)≠0,公式可變形為:
式(2)表示了規(guī)則R的核心集內(nèi)元素的相互關(guān)聯(lián)關(guān)系。實(shí)現(xiàn)用語義限制函數(shù)對(duì)規(guī)則的匹配度進(jìn)行衡量。值得注意的是,當(dāng)令t≡u(píng),u為常數(shù)時(shí),規(guī)則R的匹配度將不再受語義限制影響。
語義限制函數(shù)ξc(t)用來描述語言變量的傾向程度,通過分析大量事實(shí)數(shù)據(jù)可知,在規(guī)則前項(xiàng)一定時(shí),t與PR構(gòu)成的點(diǎn)集分布相對(duì)趨近于正態(tài)分布,且Gexis為有限集,可以不予考慮ξc(t)的不定積分形態(tài),所以采用高斯函數(shù)的標(biāo)準(zhǔn)形式作為ξc(t)的表達(dá)式,并將其引入語義限制函數(shù),可表示為式(3):
將式(2)帶入后得到式(4):
當(dāng)假設(shè)a=0,μc(X)=1 時(shí),規(guī)則R將可以表示為經(jīng)典(清晰)規(guī)則。當(dāng)令c2=2 時(shí),高斯函數(shù)變?yōu)楦道锶~變換的特征函數(shù)[8],可以考慮引入量子計(jì)算方法進(jìn)行深入研究。而用于擬合的函數(shù)形態(tài)也可以根據(jù)實(shí)際環(huán)境擇情選取。
3.2.1 擬合過程
擬合過程包括初態(tài)擬合和測試擬合,前文已述輔助非線性擬合過程的訓(xùn)練樣本存在E集中,在規(guī)則被定制時(shí)收集原始訓(xùn)練樣本Gexis及Iexis,Gexis為初始語言變量t的集合,Iexis為在初始語言變量t作用下專家評(píng)估的規(guī)則匹配度PR的集合,μc(X)作為計(jì)算涉及領(lǐng)域影響因子的模糊隸屬度可視為已知量,做Gexis與Iexis的映射關(guān)系,獲取初態(tài)訓(xùn)練樣本M:M={(t1,PR1),(t2,PR2),…,(tn,PRn) |tn∈Gexis,PRn∈Iexis}通過M對(duì)語義限制函數(shù)ξc(t)進(jìn)行擬合的過程稱為初態(tài)擬合,也稱為規(guī)則的初始化。考慮原始訓(xùn)練樣本與擬合函數(shù)間的可能關(guān)系如圖1 表示。
圖1 原始訓(xùn)練樣板的散落形態(tài)圖
A,B,C描述的3 種表征,對(duì)于表征B,C在曲線擬合后取區(qū)間的ξc(max(Gexis)),ξc(min(Gexis))為最優(yōu)值解,對(duì)于表征A需要在測試訓(xùn)練過程中經(jīng)過不斷校正獲取最優(yōu)(峰值)解。考慮有限集Gexis的實(shí)際狀態(tài)會(huì)出現(xiàn)污染點(diǎn),為了提高擬合精度,根據(jù)亞像素邊緣檢測算法[9]進(jìn)行Gexis校正和擬合,根據(jù)函數(shù)取亞像素值η=b/2a,詳細(xì)過程不做贅述。
在規(guī)則被選用并進(jìn)行匹配的過程中,取以往所有訓(xùn)練樣本集合G,I。其中,G={t}表示訓(xùn)練樣本中t的集合,令Gexis?G,I={PR}表示訓(xùn)練樣本中t值下規(guī)則R的最終匹配度,令I(lǐng)exis?I,做G與I的映射關(guān)系,獲取測試訓(xùn)練樣本N并進(jìn)行擬合的過程稱為測試擬合,測試擬合過程本質(zhì)上是對(duì)專家綜合意見的校正。
3.2.2 自適應(yīng)機(jī)制
在規(guī)則的匹配過程中,應(yīng)用系統(tǒng)希望規(guī)則可以自行進(jìn)行細(xì)微的誤差調(diào)整,實(shí)現(xiàn)自適應(yīng)和自校正的過程[10]。以可自適應(yīng)調(diào)整的模糊規(guī)則結(jié)構(gòu)為基礎(chǔ),提出一種自適應(yīng)機(jī)制。具體過程如下:
Begin 當(dāng)規(guī)則進(jìn)行匹配時(shí)觸發(fā):
Step 1計(jì)算命題:當(dāng)前ξc(tn+1)計(jì)算與上次結(jié)果微分差極小,當(dāng)命題為假時(shí)以tn帶入原ξc(t)進(jìn)行規(guī)則匹配。
Step 2若Step 1 命題為真,計(jì)算下一次語義變量tn+1。
Step 3若Step 1 命題為真,重新擬合修正語義限制函數(shù)ξc(t)。
Step 4若Step 1 命題為真,將tn+1帶入修正后的ξc(t)中進(jìn)行規(guī)則匹配度計(jì)算。
在上述過程中,通過擬合重新計(jì)算ξc(t)過程。tn+1的獲取方法如下:將已進(jìn)行n次訓(xùn)練的集合G={t}中的t均值的表達(dá)式表述為:
根據(jù)均方差收斂法則,樣本個(gè)數(shù)n足夠大時(shí),t將逐漸收斂為接近恒定數(shù)值,于是采用標(biāo)準(zhǔn)差作為誤差距離測定方法??紤]每次實(shí)際P′R與PR的差距P′R-PR過小,于是用平方放縮法進(jìn)行差值干擾,進(jìn)行tn+1描述表示為:
在式(6)中,下次語言變量tn+1的取值與歷次訓(xùn)練的語言變量及匹配度差P′R-PR有關(guān)。取ξc(tn)的最優(yōu)解,考慮ξc(t)函數(shù)歷次變形后臨近兩點(diǎn)的變化率近似為0,于是當(dāng)滿足條件:ξ′c(n)(tn) -ξ′c(n-1)(tn-1)=Δs,Δs→0 時(shí),自適應(yīng)過程終止。
框架作為一種知識(shí)表達(dá)技術(shù)具有結(jié)構(gòu)化清晰、表達(dá)簡化的優(yōu)點(diǎn),采用框架表示法的思想設(shè)計(jì)知識(shí)的結(jié)構(gòu),定義類框架FC表示知識(shí),FC內(nèi)包含一組用于計(jì)算知識(shí)吻合度的條件,條件包括條件因子及界定條件因子影響程度的影響權(quán)重。采用規(guī)則的實(shí)例化對(duì)象表示條件因子,定義實(shí)數(shù)v作為條件因子的影響權(quán)重,于是有:
其中,(Rn,vn)用于描述條件單體;基于語義限制的模糊規(guī)則的實(shí)例化對(duì)象Rn表示條件因子;vn表示在Rn作用下的影響權(quán)重。條件因子間相對(duì)獨(dú)立,且滿足
默認(rèn)基于語義限制的模糊規(guī)則知識(shí)結(jié)構(gòu)中FC的條件關(guān)系為And,根據(jù)知識(shí)表達(dá)式有:
其中,wFC表示某基于語義限制的模糊規(guī)則知識(shí)的最終吻合度;cf為計(jì)算公式;Rnvn為算子,根據(jù)類框架FC關(guān)系可建立最終吻合度與算子的關(guān)系:
根據(jù)條件因子的獨(dú)立性及定量統(tǒng)計(jì)法原理得到吻合度計(jì)算公式:
式(7)也稱為充分性吻合度公式,可以直觀描述所屬知識(shí)與事實(shí)的吻合度情況。根據(jù)論據(jù)累積的Bayes 思想[11],也可以采用式(8)描述吻合度情況:
式(8)也稱為必要性吻合度公式,計(jì)算結(jié)果可作為在知識(shí)推理過程的咨詢解釋參考標(biāo)準(zhǔn)之一。
以基于語義限制的模糊規(guī)則結(jié)構(gòu)為基礎(chǔ),設(shè)計(jì)故障診斷專家系統(tǒng)模型,通過模式匹配進(jìn)行異常井原因診斷分析,應(yīng)用在某采油廠地質(zhì)大隊(duì)。為了避免地質(zhì)師的初次理解障礙,通過與語言專家交流和反復(fù)推敲,對(duì)50 余種常規(guī)自然語義限制詞定量化,通過此方法讓專家們理解應(yīng)用過程,如表1 所示。
表1 語義限定詞的定量化映射
在表1 中,t表示在專家理解后可忽略自然語義限制根據(jù)實(shí)際情況按需粒度化細(xì)分。
以某異常井故障病癥,即抽油機(jī)長期停轉(zhuǎn)為例[12]。對(duì)應(yīng)自然描述為油井月生產(chǎn)時(shí)間正常的情況下,冬天寒冷時(shí),含油飽和度適中,但產(chǎn)油量下降嚴(yán)重,井壁溫度低,認(rèn)為可能發(fā)生抽油機(jī)長期停轉(zhuǎn)。通過油藏?cái)?shù)值、抽油機(jī)技術(shù)等知識(shí)結(jié)合專家對(duì)該知識(shí)進(jìn)行模型構(gòu)造,如圖2 所示。
圖2 描述抽油機(jī)長期停轉(zhuǎn)的模型結(jié)構(gòu)
為了節(jié)約篇幅,以R3 進(jìn)行詳細(xì)分析:取樣15 名不同礦區(qū)及廠級(jí)地質(zhì)師依據(jù)以往的不同環(huán)境下的實(shí)際經(jīng)濟(jì),結(jié)合主井內(nèi)壁溫度低的影響程度與低溫程度進(jìn)行分析,在背景2 影響下各井所處地表環(huán)境溫度幾乎相同,各井位處同一大地質(zhì)層,外因因素影響差別極其微弱,同時(shí)由于地表低溫影響導(dǎo)致內(nèi)壁溫度散熱快,時(shí)間軸表達(dá)較為清晰,分析結(jié)果的差異性較為明顯。根據(jù)領(lǐng)域知識(shí),獲取時(shí)間與溫度的特征函數(shù)T(x),取15 位專家在同業(yè)務(wù)環(huán)境下相互獨(dú)立的意見,如表2 所示。其中,t,p為專家初始提供的語言變量和匹配度數(shù)據(jù);t′,p′為經(jīng)過數(shù)據(jù)清洗和整理后獲得的數(shù)據(jù)。
表2 專家意見定量化結(jié)果
將數(shù)據(jù)進(jìn)行分布后,得到如圖3 所示的結(jié)果。
圖3 針對(duì)專家意見的曲線擬合結(jié)果
經(jīng)過初始化擬合得a=2.8,b=2.5。在測試訓(xùn)練中,根據(jù)x的取值進(jìn)行特征函數(shù)計(jì)算,取業(yè)務(wù)特征函數(shù)T(x)的隸屬度為0.8,初次將帶入得到ξc(t)=2.1,于是有總的匹配度為PR=(0.8)2.1≈0.626,專家意見經(jīng)過擬合后初始規(guī)則的匹配度為0.626,匹配權(quán)重為PRvR=0.626 ×0.5=0.313。表3 表示通過對(duì)葡萄花油層南2 區(qū)多口異常井診斷的實(shí)際測試訓(xùn)練后的結(jié)果。
經(jīng)過上述分析統(tǒng)計(jì)可知,誤差精度差約5%,同時(shí)可以發(fā)現(xiàn),壁溫影響的概率越高,誤差精度越小,所以,基于語義限制的模糊規(guī)則結(jié)構(gòu)表達(dá)高匹配度規(guī)則的效果更好。
矯正后得到t=0.631 時(shí),該規(guī)則的匹配度將最大,同理對(duì)R1,R2 進(jìn)行訓(xùn)練。最終評(píng)估某井N2-4-216,計(jì)算最終結(jié)果為:
即有73.2% 的可能該井發(fā)生抽油機(jī)長期停轉(zhuǎn)。經(jīng)過作業(yè)大隊(duì)的檢修,確定該井抽油機(jī)已經(jīng)停轉(zhuǎn)42 h,根據(jù)該型號(hào)抽油機(jī)故障參數(shù)評(píng)估,認(rèn)為該井已屬于長期停轉(zhuǎn)范疇,同時(shí)由歷史檢修數(shù)據(jù)記錄,該井區(qū)同期檢修28 次,發(fā)生抽停20 次,抽停概率約為71.4% 。
表3 針對(duì)抽油機(jī)長期停轉(zhuǎn)的測試訓(xùn)練對(duì)比結(jié)果
根據(jù)基于語義限制的模糊規(guī)則模型開發(fā)的故障診斷系統(tǒng),動(dòng)態(tài)分析輔助系統(tǒng)已經(jīng)正常工作,因?yàn)槠鋵?duì)專家意見的深度合理分析、較好的自適應(yīng)性和相對(duì)簡單的應(yīng)用過程受到了應(yīng)用單位的較好評(píng)價(jià)。
本文提出的基于語義限制的模糊規(guī)則知識(shí)結(jié)構(gòu),以C-E 模型構(gòu)建規(guī)則結(jié)構(gòu),引入并改進(jìn)語義限制方法表達(dá)模糊規(guī)則,并將規(guī)則實(shí)例化為條件。結(jié)合知識(shí)的框架表達(dá)方式和條件組概念清晰明了地描述知識(shí)的結(jié)構(gòu),同時(shí)經(jīng)過數(shù)據(jù)提取和分析給出科學(xué)合理的計(jì)算方法,更加符合當(dāng)前專家知識(shí)的獲取模式,達(dá)到深度挖掘知識(shí)人與知識(shí)的關(guān)聯(lián)關(guān)系、提高精細(xì)程度的目的。
[1]吳立輝,顏丙生,張 潔.一種混合智能的InterBay 系統(tǒng)調(diào)度方法[J].計(jì)算機(jī)工程,2012,38(22):228-231.
[2]Negnevitsky M.人工智能智能系統(tǒng)指南[M].陳 薇,譯.北京:機(jī)械工業(yè)出版社,2012.
[3]何新貴.知識(shí)處理與專家系統(tǒng)[M].北京:國防工業(yè)出版社,1990.
[4]向 艷,王洪元.基于模糊推理模型的專家系統(tǒng)的研究與應(yīng)用[J].計(jì)算機(jī)工程,2005,31(10):179-182.
[5]潘正華.模糊知識(shí)的三種否定及其集合基礎(chǔ)[J].計(jì)算機(jī)學(xué)報(bào),2012,35(7):1421-1423.
[6]高雅田,李春生,富 宇.基于關(guān)系數(shù)據(jù)分析的知識(shí)服務(wù)模型[J].計(jì)算機(jī)工程,2011,37(5):56-59.
[7]曾文雄.模糊限制語的語言學(xué)理論與應(yīng)用研究[J].外語教學(xué),2005,26(5):27-30.
[8]趙學(xué)智,陳文戈,林 穎,等.基于高斯函數(shù)的小波系及其快速算法[J].華南理工大學(xué)學(xué)報(bào):自然科學(xué)版,2001,29(1):94-97.
[9]尚雅層,陳 靜,田軍委.高斯擬合亞像素邊緣檢測算法[J].計(jì)算機(jī)應(yīng)用,2011,31(1):179-180.
[10]王亞南.專家系統(tǒng)中推理機(jī)制的研究與應(yīng)用[D].武漢:武漢理工大學(xué),2006.
[11]Alavi M,Leidner D E.Knowledge Management and Knowledge Systems:Conceptual Foundation and Research Issues[J].Management Information System Quarterly,2001,25(1):107-136.
[12]李春生,高雅田.基于主詞網(wǎng)的油田施工方案輔助設(shè)計(jì)模型[J].東北石油大學(xué)學(xué)報(bào),2010,34(5):138-144.