劉玉鋒,孫文鑫
1.重慶城市科技學(xué)院,重慶402160
2.重慶水利電力職業(yè)技術(shù)學(xué)院,重慶402160
粗糙集[1]是一種用來進(jìn)行數(shù)據(jù)挖掘和規(guī)則提取的數(shù)學(xué)工具。它在數(shù)據(jù)信息的處理中有獨到的方法和手段,能準(zhǔn)確地刻畫對象。目前,粗糙集的研究主要體現(xiàn)在模型的應(yīng)用和推廣中[2-3]。例如:有些將等價劃分中的粗糙集推廣到區(qū)間值信息系統(tǒng)、序信息系統(tǒng)等[3-5];有些將粗糙集和其他理論相結(jié)合建立了新的粗糙集模型[6-10];有些將單論域的粗糙集推廣到雙論域中[11-13]。
多粒度粗糙集[14]是粗糙集的一種推廣,它最早由Qian在2010年提出。它是運用粒計算的知識將單個關(guān)系劃分的類看成一個粒,進(jìn)而定義由多個關(guān)系劃分(多個粒)時的粗糙集上下近似算子。近年來,多粒度粗糙集理論的研究成果也是碩果累累[15-20]。
軟粗糙集模型是粗糙集模型的一種推廣,軟下近似是建立在函數(shù)F(a)完全包含于被刻畫概念X中的。近幾年,軟粗糙集模型的推廣也有很多成果[21-28],比如:多粒度軟粗糙集和程度多粒度軟粗糙集模型等[29-30]。其中,樂觀多粒度軟粗糙集的下近似要求至少存在一個粒滿足函數(shù)F(a)完全包含于被刻畫概念X中,悲觀多粒度軟粗糙集的下近似則要求所有粒滿足函數(shù)F(a)完全包含于被刻畫概念X中,程度多粒度軟粗糙集的下近似要求部分滿足函數(shù)F(a)完全包含于被刻畫概念X中,這些模型的下近似定義都是建立在函數(shù)F(a)完全包含于被刻畫概念X中的。在實際應(yīng)用中,數(shù)據(jù)誤差對概念刻畫會產(chǎn)生誤差,不能完全正確地描述概念,從而降低上述模型在實際應(yīng)用中的適應(yīng)性。
為了解決此類問題,本文通過定義含參數(shù)α的計數(shù)函數(shù)構(gòu)建一種具有知識容錯能力,能夠適應(yīng)帶有數(shù)據(jù)誤差情形的一般多粒度量化軟粗糙集模型,并討論了一般多粒度量化軟粗糙的度量及其性質(zhì)。最后,通過案例進(jìn)行分析和說明。
定義1[31]設(shè)非空集U、E,對于任意的A?E,如果存在集值映射F:A→P(U),則稱S=(F,A)為U上的軟集。
注意:對于任意的a∈A,在S=(F,A)中,F(xiàn)(a)可能為空集。
定義2[23]設(shè)S=(F,E)是U上的軟集,A?E,那么P=(U,S)稱為軟近似空間。對于任意的集合X?U,定義軟下、上近似分別為:
定義3[29]設(shè)S=(F,E)是U上的軟集,(F,A i)(i=1,2,…,m)是論域U中的軟子集(A i?E)。對于任意的X?U,定義樂觀多粒度軟下近似和上近似分別為:
定義悲觀多粒度軟下近似和上近似分別為:
文獻(xiàn)[30]研究了多粒度軟粗糙集模型下近似的結(jié)構(gòu),在此基礎(chǔ)上考慮粒度的選取,進(jìn)而提出了程度多粒度軟粗糙集模型,并將多粒度軟粗糙集模型下近似統(tǒng)一到程度多粒度軟粗糙集模型中。
定義4[30]設(shè)S=(F,E)是U上的軟集,其中(F,A i)(i=1,2,…,m)為U上的m個不同軟集(A i?E),對于任意X?U,x?U,則定義元素x在屬性A i下關(guān)于X的計數(shù)函數(shù)
定義5[30]設(shè)S=(F,E)是U上的軟集,其中(F,A i)(i=1,2,…,m)是U上的m個不同軟集(A i?E),對于任意的集合X?U,β∈(0,1],定義程度多粒度軟下、上近似分別為:
程度多粒度粗糙集模型中下近似考慮了在一定數(shù)目粒度下“?a∈A i,x∈F(a)且F(a)?X”,在實際應(yīng)用中不一定完全滿足F(a)?X,需要具備一定容錯能力的粗糙集模型,為解決此類問題,下面通過量化F(a)與X間的包含程度引入計數(shù)函數(shù),構(gòu)建了一種量化軟粗糙集模型。
定義6設(shè)S=(F,E)是U上的軟集,其中(F,A i)(i=1,2,…,m)是U上的m個不同軟集(A i?E),對于任意的集合X?U,參數(shù)α∈(0,1],且F(a)≠?時,記
性質(zhì)1設(shè)S=(F,E)是U上的軟集,其中(F,A i)(i=1,2,…,m)為U上的m個不同軟集(A i?E),對于任意的集合X、Y?U,參數(shù)α,λ∈(0,1],且F(a)≠?時,則量化計數(shù)函數(shù)有以下性質(zhì)成立:
(2)如果X?Y,則
(5)如果α≤λ,則有,特別的,當(dāng)λ=1時,
證明下面依次給出以上性質(zhì)的證明過程。
(1)對任意的x?U,假設(shè),則存在a∈矛盾,因此
定義7設(shè)S=(F,E)是U上的一個軟集,(F,A i)(i=1,2,…,m)是論域U上的m個不同的軟集(A i?A),對于任意的X?U,α,β∈(0,1],定義一般多粒度量化軟下、上近似分別為:
根據(jù)一般多粒度量化軟粗糙集的定義,可以得到其正域、負(fù)域、下邊界域,上邊界域分別為:
根據(jù)一般多粒度量化軟粗糙集的定義,有下面性質(zhì)成立。
性質(zhì)2設(shè)S=(F,E)是U上的一個軟集,(F,A i)(i=1,2,…,m)是U上的m個不同軟集,對于任意的集合X,Y?U,α,β∈(0,1],則有以下性質(zhì)成立:
證明接下來,依次給出以上性質(zhì)的證明過程。
(7)根據(jù)性質(zhì)(3)和性質(zhì)(5)可得。
(8)根據(jù)性質(zhì)(4)和性質(zhì)(6)可得。
定義8[23]設(shè)S=(F,E)是U上的軟集,如果則稱S是U上的滿軟集。
性質(zhì)3設(shè)S=(F,E)是U上的滿軟集,(F,A i)(i=1,2,…,m)是U上的m個不同滿軟集A i?E,對于任意的集合X,Y?U,參數(shù)α,β,λ∈(0,1],則有以下性質(zhì)成立:
不確定性度量是粗糙集中的重要部分,下面討論一般多粒度量化軟粗糙集的不確定性度量。
定義9設(shè)S=(F,E)是U上的一個軟集,(F,A i)(i=1,2,…,m)是U上的m個不同軟子集,對于任意的集合X?U,α,β∈(0,1],定義一般多粒度量化軟粗糙集的精確度和粗糙度為:
由一般多粒度量化軟粗糙集精確度和粗糙度的定義可以得到以下性質(zhì)成立。
定理5設(shè)S=(F,E)是U上的一個軟集,(F,A i)(i=1,2,…,m)是U上的m個不同軟子集,對于任意的集合X?U,α,β,λ∈(0,1],如果α≤λ,有:
隨著環(huán)境的改變,各種傳染病如SARS病毒、新型冠狀病毒等通過各種渠道侵犯著人們的身體。為了避免交叉感染,各地各單位都采取了隔離等措施,然而如何將感染的人群隔離開成了一個關(guān)鍵問題。有些病人已經(jīng)感染病毒,卻無法得到確診。這給醫(yī)護(hù)人員的工作開展帶來了很大的困擾。無法確診的疑似感染人員也給自身和社會帶來了巨大的恐慌。被感染的患者大都有以下癥狀:發(fā)熱、頭痛、呼吸困難、惡心、干咳、鼻塞、四肢無力、畏寒等記為V={a1,a2,…,a8}。在某城市有一批人疑似感染病毒的群體設(shè)為U={x1,x2,…,x10},這些人中多少有感染的癥狀具體觀察記錄情況見表1。經(jīng)過一段時間的觀察他們中某些人被確診為感染了病毒設(shè)為X={x4,x5,x7,x9,x10}?,F(xiàn)一批來自不同地方的專家進(jìn)行聯(lián)合會診,一批針對發(fā)熱、頭痛、鼻塞癥狀A(yù)1={a1,a2,a6}人群進(jìn)行會診,一批針對呼吸困難、惡心、干咳癥狀A(yù)2={a3,a4,a5}人群進(jìn)行會診,一批針對發(fā)熱、四肢無力、畏寒癥狀A(yù)3={a1,a7,a8}人群進(jìn)行會診。根據(jù)表1可得:
表1 某城市疑似感染病毒群體癥狀記錄表
在α=0.6,時,由參數(shù)α量化計數(shù)函數(shù)計算得表2,再根據(jù)一般多粒度量化軟粗糙集模型可以計算得:
表2 疑似感染病毒群體的癥狀在α=0.6時的計數(shù)函數(shù)
根據(jù)一般多粒度量化軟粗糙集下、上近似算子的計算結(jié)果可以看出,患者x5,x7,x9,x10是確診病人中病情比較嚴(yán)重的;患者x4雖然被確診但是有望康復(fù)的概率是很大的;患者x2雖未確診但染病的概率極大;患者x1,x3,x6,x8未確診但有染病的風(fēng)險;患者x1,x3,x8被感染的可能較低,應(yīng)該分開隔離以避免交叉感染(此處α和β取值可以根據(jù)不同地區(qū)感染的嚴(yán)重程度和醫(yī)院的情況設(shè)置)。根據(jù)上述分析,在傳染病盛行的時候,患者人群最好分四類進(jìn)行觀察管理,這樣有助于將患者進(jìn)行分區(qū)觀察,也能很好地分配醫(yī)護(hù)人員,有助于醫(yī)護(hù)人員工作的開展。
在α=0.8,時,由參數(shù)α量化計數(shù)函數(shù)計算得表3,再據(jù)一般多粒度量化軟粗糙集模型可以計算得:
表3 疑似感染病毒群體的癥狀在α=0.8時的計數(shù)函數(shù)
由上述結(jié)果可知,下近似隨著α增大而增大,上近似隨著α增大而減少。在實際應(yīng)用中應(yīng)該根據(jù)對疾病的掌握情況適當(dāng)?shù)卦O(shè)置α取值,以防止因數(shù)據(jù)誤差而導(dǎo)致診斷失誤,從而加大傳染病傳播的可能性。因此一般多粒度量化軟粗糙集模型的數(shù)據(jù)分析方法更具有實際意義,它在決策過程中能夠解決因數(shù)據(jù)誤差可能帶來的決策失誤。
軟粗糙集理論的研究已近成為當(dāng)今學(xué)術(shù)界熱門的研究課題之一。本文通過定義α計數(shù)函數(shù)將多粒度軟粗糙集和量化粗糙集結(jié)合起來建立了一般多粒度量化軟粗糙集。此外,為了突出模型的優(yōu)勢和劣勢,定義了一般多粒度量化軟粗糙集的精確度和粗糙度。一般多粒度量化軟粗糙集模型的建立完善了多粒度軟粗糙集理論,為軟粗糙集的數(shù)據(jù)挖掘和規(guī)則提取奠定了理論基礎(chǔ)。