史運(yùn)美 蔣夢雪 袁藝林 王超亞 秦瑜華
(河南師范大學(xué),河南 新鄉(xiāng) 453002)
在日常生活中,一些模糊概念經(jīng)常會(huì)出現(xiàn)在我們的自然語言中,如果想用定量的數(shù)據(jù)來表示,卻發(fā)現(xiàn)很困難。而云模型[1]恰能實(shí)現(xiàn)從定性概念到定量數(shù)據(jù)間的轉(zhuǎn)化,它通過期望Ex、熵En、超熵He 三個(gè)數(shù)值來完成這些模糊概念到具體數(shù)據(jù)之間的轉(zhuǎn)換,并以云圖表現(xiàn)出來,與傳統(tǒng)的處理模糊概念的方法相比,更加直觀、具體;云模型對于日常生活中的不確定性概念有很好的表達(dá)能力。目前,傳統(tǒng)的模糊數(shù)學(xué)在很多領(lǐng)域已經(jīng)不能夠滿足模糊研究的需要,而云模型憑借其處理模糊度和隨機(jī)性的優(yōu)勢越來越頻繁的應(yīng)用到各個(gè)領(lǐng)域。為了完善模糊研究中的存在的不足,本文對云模型的理論和應(yīng)用的發(fā)展進(jìn)行了探討和總結(jié)。
與此同時(shí)許多不確定性或信息不安全的問題也體現(xiàn)在生活各處,僅用點(diǎn)值描述很難表達(dá)其準(zhǔn)確的含義,而如果用區(qū)間集[2]來描述卻可以有效的表達(dá)語義。將信息合理有效地區(qū)間分段,可以減少局部區(qū)間的波動(dòng),保證了結(jié)果的科學(xué)性和合理性,降低了結(jié)果分析的失誤率,因此,區(qū)間集被廣泛的應(yīng)用于人工智能的控制、神經(jīng)網(wǎng)絡(luò)等領(lǐng)域中。區(qū)間集不僅能夠反映邏輯推理的模糊性,而且符合人類推理模糊信息的習(xí)慣。故此,區(qū)間集本文研究的對象,并在區(qū)間集的基礎(chǔ)上引出高斯云模型。
在國內(nèi)外不乏單一的對云模型及區(qū)間集進(jìn)行深入研究的學(xué)者,但將兩者結(jié)合卻寥寥無幾,本文即是將兩者結(jié)合的研究,即基于區(qū)間集的云模型研究。
本文首先在區(qū)間集上對2013 年統(tǒng)計(jì)得到的中國科學(xué)院院士的年齡分布情況進(jìn)行統(tǒng)計(jì)分析,可以發(fā)現(xiàn)在40-60、60-100 歲上各年齡段的人數(shù)在總體呈正態(tài)趨勢,同時(shí)在各年齡階段范圍內(nèi)呈現(xiàn)局部正態(tài)函數(shù)的趨勢。然后運(yùn)用高斯函數(shù)對所有年齡段總體分析和計(jì)算,繼而擬合出高斯云的回歸方程。
科學(xué)家年齡及其結(jié)構(gòu)是科學(xué)社會(huì)學(xué)研究中一個(gè)不可忽略的問題。但是,在研究的過程中,以什么方式研究對結(jié)果的產(chǎn)生在一定的程度上會(huì)有影響。本文通過采集2013 年中國科學(xué)院全部院士的年齡數(shù)據(jù),基于區(qū)間集對其整體結(jié)構(gòu)進(jìn)行分析。
表1 院士年齡統(tǒng)計(jì)
從表1[3]數(shù)據(jù)可以得出在40-60 歲、60-100 歲的不同年齡區(qū)間局部年齡趨勢呈正態(tài)分布,而且以上兩個(gè)大年齡段的區(qū)間集上離散點(diǎn)的總體趨勢也幾近于正態(tài)分布,故可在此區(qū)間集上運(yùn)用云模型加以研究。
從圖1 可以看出院士年齡整體偏高,偏高的院士當(dāng)選年齡和偏高的院士平均年齡不利于國家的科技創(chuàng)新與科技進(jìn)步。要綜合運(yùn)用科學(xué)哲學(xué)、科學(xué)社會(huì)學(xué)等多種理論和知識(shí),準(zhǔn)確把握科學(xué)家群體的特殊屬性及要求,完善院士選拔制度、調(diào)整院士的年齡結(jié)構(gòu),使大多數(shù)當(dāng)選院士處在科學(xué)創(chuàng)造力和生產(chǎn)力的最佳年齡段。
圖1 不同年齡的分布
由圖1 發(fā)現(xiàn)年齡所構(gòu)成的圖形與高斯云分布[4]的圖形在一定的程度上是相似的。因此,借助高斯函數(shù)對采集的數(shù)據(jù)進(jìn)行擬合,以此引申為對科學(xué)家年齡的研究分析。
運(yùn)用高斯云的數(shù)字特征[5]對表1 中60-100 年齡區(qū)間上的數(shù)據(jù)進(jìn)行分析計(jì)算,得到不同區(qū)間集上利用高斯云的數(shù)字特征擬合后的數(shù)據(jù)。高斯云的數(shù)字特征如下:
1)高斯云分布的期望E{}X =Ex。
一個(gè)云滴[6]是定性概念,在數(shù)量上一次實(shí)現(xiàn),大量云滴組成云。盡管在不同的時(shí)刻產(chǎn)生的云滴不同,但是云的數(shù)字特征決定的云的整體形態(tài)基本不變。云的數(shù)字特征由期望Ex,熵En,超熵He 三個(gè)數(shù)值來表示,他們反映了定性概念上的定量特征。
期望Ex:是在數(shù)值域空間中最能體現(xiàn)定性概念的點(diǎn)值,是將定性概念數(shù)值化的最佳樣本點(diǎn)。在云圖中體現(xiàn)為云的峰值所處的位置,反應(yīng)了這個(gè)概念的云滴群的云重心。
熵En:用來綜合度量定性概念的模糊度和概率,即被定性概念接受的取值范圍大小,反應(yīng)了定性概念的不確定性。在云圖中體現(xiàn)為云的寬度,熵值越大,概念越宏觀,其模糊度和隨機(jī)性也就越大。
超熵He:熵的不確定性的度量,反應(yīng)云滴的離散程度,代表云滴出現(xiàn)的隨機(jī)性,揭示了模糊性和隨機(jī)性的關(guān)聯(lián)。超熵越大,云滴離散程度越大,云圖中的云厚度也就越大。
根據(jù)回歸曲線的定義,高斯云的回歸曲線形成過程為:對于給定的 xi,對應(yīng)確定度μi的期望值為 Eμi,不同的 xi對應(yīng)的 Eμi擬合形成回歸曲線。高斯云的回歸曲線為
其解析形式難以求出,但可通過線性逼近的方法近似求得。
與回歸曲線不同,高斯云曲線[7]的每一點(diǎn)是投影到該點(diǎn)的所有點(diǎn)的期望值。云主曲線的解析形式也難以給出,但同樣可以通過線性逼近的方法近似求得。
先繪制中國科學(xué)院全體院士的年齡分布折線圖,如下從圖2 中可以看出,已分段后的年齡在局部范圍內(nèi)在不同程度的達(dá)到了峰值,因此,截取60 歲之后的數(shù)據(jù),共579 個(gè),以年齡段分組,作為研究之用。
利用MATLAB,直接對所采集的數(shù)據(jù)進(jìn)行擬合。經(jīng)過擬合之后,發(fā)現(xiàn)只有當(dāng)套用高斯公式時(shí),圖形的貼近率最高。可得擬合之后的公式和圖形分別為:
圖3
在基于區(qū)間集的云模型研究中,利用區(qū)間集的不確定概念不但可以得到語義解釋,更能考慮到其計(jì)算性,一舉兩得。云模型利用期望、熵和超熵這三個(gè)數(shù)字特征來定量描述一個(gè)不確定性概念,通過正向云發(fā)生器[8]實(shí)現(xiàn)從概念的內(nèi)涵向其外延進(jìn)行轉(zhuǎn)化,通過逆向云發(fā)生器實(shí)現(xiàn)從概念的內(nèi)涵向其內(nèi)延進(jìn)行轉(zhuǎn)化,較好地刻畫了概念內(nèi)涵與外延之間的雙向認(rèn)知變換過程,同時(shí)也解釋了客觀對象具有的模糊性和隨機(jī)性。這種研究使云模型在更廣泛的領(lǐng)域上得以應(yīng)用。
[1]李德毅,劉常昱.論正態(tài)云模型的普適性[J].中國工程科學(xué),2004,6(8):28-34.
[2]李德毅,杜.不確定性人工智能[M].北京:國防工業(yè)出版社,2005.
[3]劉禹,李德毅,張光衛(wèi),等.云模型霧化特性及在進(jìn)化算法中的應(yīng)用[J].電子學(xué)報(bào),2009,37(8):1651-1658.
[4]劉玉超,李德毅.基于云模型的粒計(jì)算[J].
[5]苗奪謙,李德毅,姚一豫,等.不確定性與粒計(jì)算[M].北京:科學(xué)出版社,2011:1-23.
[6]劉禹,李德毅.正態(tài)云模型霧化性質(zhì)統(tǒng)計(jì)分析[M].北京:航空航天大學(xué)學(xué)報(bào),2010,36(11):1320-1324.
[7]邱東.模糊分析中的若干問題及與粗糙集理論的結(jié)合研究[D].電子科技大學(xué),2009.
[8]張虹.模糊關(guān)系下的粗糙近似算子及相關(guān)屬性的約簡理論[D].昆明理工大學(xué).2005.