劉 琪 劉曉青
(周口師范學(xué)院物理與電子工程系,河南 周口 466001)
正態(tài)云隸屬度函數(shù)確定的FSM方法
劉 琪 劉曉青
(周口師范學(xué)院物理與電子工程系,河南 周口 466001)
隸屬度函數(shù)及其確定方法的研究具有重要意義。采用正態(tài)云模型表示的隸屬度函數(shù)綜合了模糊性和隨機(jī)性,具有普適性;提出了確定隸屬度函數(shù)的模糊減法均值聚類(FSM)方法,得到了最優(yōu)聚類中心和數(shù)據(jù)的隸屬度。實(shí)例仿真表明,采用該方法確定了石油鉆井中總體積的正態(tài)云隸屬度函數(shù),解決了隸屬度函數(shù)難以客觀描述和難以確定的問題。
正態(tài)云模型 隸屬度函數(shù) 不確定性 模糊減法均值聚類 石油鉆井
在客觀世界的不確定性中,特別是在人類思維和認(rèn)知載體的語(yǔ)言中,隨機(jī)性和模糊性存在極大的關(guān)聯(lián)性[1-3]。李德毅在隨機(jī)數(shù)學(xué)和模糊數(shù)學(xué)的基礎(chǔ)上,提出用正態(tài)云模型來描述不確定性現(xiàn)象與事物的隨機(jī)性、模糊性及其關(guān)聯(lián)性[4]。然而隸屬度函數(shù)的確定方法一直沒有得到根本解決。在不確定性推理過程中,隸屬度函數(shù)往往是被主觀取值“硬化”成區(qū)間[0,1]中的精確數(shù)值表達(dá),不考慮隨機(jī)性,且不具有模糊性和可靠性。
本文采用正態(tài)云模型表示隸屬度函數(shù),提出了模糊減法均值聚類(fuzzy subtractive means clustering,F(xiàn)SM)方法,確定了石油鉆井中總體積變化量的正態(tài)云隸屬度函數(shù)[5],解決了隸屬度函數(shù)難以客觀描述和難以確定的問題。
正態(tài)云模型是定性概念與定量表示之間的不確定性轉(zhuǎn)換模型,它表征了知識(shí)表示中的模糊性(邊界亦此亦彼)和隨機(jī)性(發(fā)生的概率)。
定義1[1]設(shè)U為一個(gè)用精確數(shù)值表示的定量論域,C為U上的定性概念,若定量值x∈U,且x是定性概念C的一次隨機(jī)實(shí)現(xiàn),x對(duì) C的隸屬度 μ(x)∈[0,1]是有穩(wěn)定傾向的隨機(jī)數(shù),則稱μ(x)在U上的分布為云模型。設(shè)N(A,B)表示服從正態(tài)分布的隨機(jī)函數(shù),其中A為期望值,B為標(biāo)準(zhǔn)差,則有:
式中:Ex為期望值;En為熵;He為超熵。式(1)~式(3)表示變量μi與xi之間的函數(shù)關(guān)系。滿足式(1)~式(3)的數(shù)據(jù)對(duì) drop(xi,μi)(i=1,2,…)構(gòu)成的云模型稱為正態(tài)云模型,記為(Ex,En,He),正態(tài)云模型的數(shù)學(xué)特征和貢獻(xiàn)如圖1所示。
圖1 數(shù)學(xué)特征和貢獻(xiàn)Fig.1 Mathematical characteristics and contribution
正態(tài)云模型分為期望值Ex、熵En、超熵He這幾個(gè)數(shù)學(xué)特征值。
期望值Ex是指概念在論域中的中心值,其在論域空間中最能夠代表定性概念。期望值Ex隸屬于定性概念。
熵En是指定性概念模糊度的度量,代表一個(gè)定性概念的可度量粒度,即在論域中可被概念所接受的數(shù)值范圍,通常熵越大,概念所接受的數(shù)值范圍也越大,概念越模糊。熵En體現(xiàn)了定性概念亦此亦彼的裕度。
超熵He是指熵En的熵,反映了云滴的離散程度,是熵的不確定性的度量。超熵越大,隸屬度的隨機(jī)性越大,云的厚度越大。超熵He反映了定性概念值的樣本出現(xiàn)的隨機(jī)性,揭示了模糊性和隨機(jī)性的關(guān)聯(lián)。當(dāng)He=0時(shí),正態(tài)云模型退化為其期望曲線:
定義2[6]云中的任一區(qū)間 x∈[a,b]上元素對(duì)定性概念~A的貢獻(xiàn)C為:
由此可知:①對(duì)于整個(gè)論域x∈(-∞,+∞),C=1,全部元素對(duì)定性概念~A的貢獻(xiàn)為100%;②對(duì)于x∈[Ex-0.67En,Ex+0.67En],C=0.5,這部分元素對(duì)定性概念的貢獻(xiàn)~A為總貢獻(xiàn)的一半,稱為“骨干元素”;③對(duì)于x∈[Ex-En,Ex+En],C=0.683,這部分元素對(duì)定性概念的貢獻(xiàn)~A為總貢獻(xiàn)的68.3%,稱為“基本元素”。
隨機(jī)變量y的概率密度函數(shù)為:
隨機(jī)變量y的概率密度同云的三個(gè)數(shù)學(xué)特征無關(guān)。這說明對(duì)于定性概念,云滴有確定的統(tǒng)計(jì)分布,其不確定性中仍然包含確定的規(guī)律性,反映了人們對(duì)知識(shí)表示定性概念的共同性。
正態(tài)云模型綜合表征了不確定性的模糊性和隨機(jī)性,是定性概念與定量表示之間的不確定性轉(zhuǎn)換模型,具有普適性。采用正態(tài)云模型的隸屬度函數(shù)具有以下特點(diǎn)。
①云由大量的云滴組成,一個(gè)云滴是定性概念在數(shù)量上的一次實(shí)現(xiàn),云的整體形狀反映了隸屬度函數(shù)的基本特征,云滴數(shù)目表示了云對(duì)定性概念的貢獻(xiàn)。
②云的厚度是不均勻的,其在腰部最分散、厚度最大,而頂部和底部的匯聚性好、厚度小。云的厚度反映了隸屬度隨機(jī)性的大小,越靠近概念中心或遠(yuǎn)離概念中心的隸屬度,其隨機(jī)性越小,與人的主觀感受一致。
③所有x∈U到區(qū)間[0,1]的映射均為一對(duì)多,隸屬度是正態(tài)概率分布,隸屬度的細(xì)微變化產(chǎn)生了云。
模糊聚類分析是許多分類和系統(tǒng)建模的基礎(chǔ)[7]。聚類的目的是從大量的數(shù)據(jù)中抽取固有的特征,以獲得系統(tǒng)行為的簡(jiǎn)潔表示。Bezdek提出的用隸屬度確定數(shù)據(jù)點(diǎn)屬于某個(gè)聚類程度的模糊C均值聚類(fuzzy c-means clustering,F(xiàn)CM)方法[8-9],其適應(yīng)性強(qiáng),是目前比較成熟的模糊聚類方法;但FCM方法要求首先提供聚類中心個(gè)數(shù),且嚴(yán)重依賴隨機(jī)生成的初始聚類中心。
對(duì)于 X={x1,x2,…,xn}?RS的樣本點(diǎn)集合,模糊減法均值聚類(FSM)方法如下。
① 設(shè)定聚類參數(shù),包括鄰域半徑ra、比例參數(shù)δ、模糊指數(shù)m和容許誤差Emax,計(jì)算每一個(gè)點(diǎn)xi的密度指標(biāo) Di。
②對(duì)每個(gè)數(shù)據(jù)點(diǎn)的密度指標(biāo)進(jìn)行修正。
式中:rb為密度指標(biāo)函數(shù)顯著減小的鄰域半徑,一般為rb=1.2ra,取最高的q個(gè)密度指標(biāo)點(diǎn)xck+1作為新的聚類中心 wk(l),其中,l=1;k=1,2,…,q。
③判斷。
判斷式(9)是否成立,若不成立,返回步驟②。
④ 計(jì)算xi對(duì)wk(l)的隸屬度uik。
⑤調(diào)整聚類中心。
⑥ 計(jì)算價(jià)值函數(shù)J(l)和誤差δ:
如果δ<Emax,結(jié)束迭代,并輸出聚類結(jié)果;否則l=l+1,返回步驟④。
通過模糊減法均值聚類(FSM)方法,可以得到聚類中心和每個(gè)數(shù)據(jù)點(diǎn)對(duì)聚類中心的隸屬度,這些參數(shù)可以確定正態(tài)云隸屬度函數(shù)。本文的實(shí)例選用鄂北石油鉆井現(xiàn)場(chǎng)總體積數(shù)據(jù)EB_Da51中的200個(gè)數(shù)據(jù)[10],其分布如圖2所示。
圖2 石油鉆井中的總體積Fig.2 Total volume of petroleum drilling
采用FSM方法確定總體積變化量的正態(tài)云隸屬度函數(shù),其具體步驟如下。
①數(shù)據(jù)統(tǒng)一論域,求解總體積的變化量并將其映射到統(tǒng)一論域空間。
②模糊減法均值聚類(FSM),求解聚類中心wk、聚類中心個(gè)數(shù)q和數(shù)據(jù)對(duì)聚類中心的隸屬度uik。
③確定語(yǔ)言值和每個(gè)語(yǔ)言值的期望值Exk(1≤k≤q)。本實(shí)例中q=4,取無、小、中、大四個(gè)語(yǔ)言值,通過FSM方法得到的聚類中心即為每個(gè)語(yǔ)言值對(duì)應(yīng)的正態(tài)云模型的期望值Exk。
④確定每個(gè)語(yǔ)言值的熵Enk(1≤k≤q),用正態(tài)云模型的期望曲線逼近200個(gè)樣本點(diǎn)的隸屬度uik構(gòu)成的曲線,即求解滿足式(14)的目標(biāo)函數(shù)最小的Enk。
⑤確定每個(gè)語(yǔ)言值的超熵Hek。超熵Hek的確定比較困難,一般由專家根據(jù)具體情況而定,本文給出一種近似求法。
采用上述方法得到的總體積變化量的q個(gè)語(yǔ)言值的Ex、En和He如表1所示。
表1 總體積變化量的數(shù)學(xué)特征Tab.1 Membership function of the variable quantity of the total volume
根據(jù)表1中的語(yǔ)言值參數(shù),可得到總體積變化量的正態(tài)云隸屬度函數(shù),如圖3所示。
實(shí)例研究表明,模糊減法均值聚類方法迭代次數(shù)少、收斂速度快、運(yùn)算穩(wěn)定,避免了模糊C均值聚類方法需要首先確定聚類中心個(gè)數(shù)的盲目性和陷入局部極小點(diǎn)的可能性。采用FSM方法確定的正態(tài)云隸屬度函數(shù)綜合表征了數(shù)據(jù)的模糊性和隨機(jī)性,解決了隸屬度函數(shù)難以客觀描述和難以確定的難題。
[1]李德毅.知識(shí)表示中的不確定性[J].中國(guó)工程科學(xué),2000,10(2):73-79.
[2]Fred A.Applications of AI and soft computing for challenging problems in the oil industry[J].Journal of Petroleum Science and Engineering,2005,47(1-2):5-14.
[3]陸建江,張亞非,宋自林.模糊關(guān)聯(lián)規(guī)則的研究與應(yīng)用[M].北京:科學(xué)出版社,2008:43-51.
[4]李德毅,孟海軍,史雪梅.隸屬云和隸屬云發(fā)生器[J].計(jì)算機(jī)研究與發(fā)展,1995,32(6):51-20.
[5]王杰,陳東海,朱曉東,等.基于分層模糊系統(tǒng)的石油鉆井事故預(yù)警系統(tǒng)[P].中國(guó),200710055178.6,2007-9-18.
[6]羅自強(qiáng),張光衛(wèi),李德毅.一維正態(tài)云的概率統(tǒng)計(jì)分析[J].信息與控制,2007(8):471-475.
[7]陳鐵梅.模糊聚類在數(shù)據(jù)預(yù)處理中的應(yīng)用研究[J].自動(dòng)化儀表,2008,29(5):36-37,41.
[8]劉琪,張鴻輝,黃貞貞.基于模糊C-均值聚類方法的石油鉆井工作狀態(tài)分析[J].周口師范學(xué)院學(xué)報(bào),2009(5):47-49.
[9]張勇,張鳳登,陳小榮.客流統(tǒng)計(jì)系統(tǒng)中的FCM算法研究[J].自動(dòng)化儀表,2010,31(3):26-28.
[10]劉琪,王少輝.非線性隸屬度函數(shù)確定的單次聚類方法[J].周口師范學(xué)院學(xué)報(bào),2011(2):41-42.
Membership Function of the Normal Cloud Determined by FSM Method
The research on membership function and its determination method has great significance.The membership function presented by adopting normal cloud integrates fuzzy and random performances,and possesses common adaptability.The method of fuzzy subtractive means clustering(FSM)is proposed for determining the membership function for obtaining optimal clustering center and membership degree of data.In practical simulation,the membership function of normal cloud for the total volume in petroleum drilling is determined and the difficulty of describing and determining the membership function has been solved.
Normal cloud modelMembership function Uncertainty Fuzzy subtractive means clustering(FSM)Petroleum drilling
TP181
A
河南省教育廳自然科學(xué)研究計(jì)劃基金資助項(xiàng)目(編號(hào):2011B510021);
周口師范學(xué)院教學(xué)改革研究基金資助項(xiàng)目(編號(hào):J2010072)。
修改稿收到日期:2011-01-17。
劉琪(1983-),男,2010年畢業(yè)于鄭州大學(xué)控制理論與控制工程專業(yè),獲碩士學(xué)位,講師;主要從事控制理論與應(yīng)用、智能控制與模式識(shí)別方面的研究。