粗糙集正域在心理健康測量中的應用
張燕
(陜西理工學院 數(shù)學與計算機科學學院,陜西 漢中 723001)
摘要:分析粗糙集正域的相關理論,提出一種基于粗糙集正域的決策表約簡算法,用屬性重要度的大小來判斷屬性是否被約簡.通過對心理健康量表數(shù)據(jù)實例驗證,該算法在約簡后得到影響測量結果的重要屬性,為構建更為科學、合理的測評量表提供理論依據(jù),具有一定的實用價值.
關鍵詞:粗糙集;正域;心理健康;屬性
中圖分類號:TP18文獻標志碼:A
文章編號:1008-5564(2015)03-0039-03
收稿日期:2015-04-05
基金項目:陜西職業(yè)技術學院校本課題項目 (Y1403)
作者簡介:王紅喜(1981—),男,山西大同人,陜西職業(yè)技術學院計算機系講師,主要從事小波分析及圖像處理研究.
Application of Positive Region of Rough Sets inPsychological Health Measuring
ZHANG Yan
(School of Mathematics and Computer Science, Shaanxi University of Technology, Hanzhong 723001, China)
Abstract:A decision table reduction algorithm based on the positive region of rough set was proposed by analyzing the related theories of the positive region of rough set, and the importance of attribute was used to judge whether the attribute should be reduced. By the testing example of the mental health scale data, the algorithm can obtain more important attributes which affect the measuring results after reduction, and the algorithm has a certain practical value and provides a theoretical basis for constructing more scientific, reasonable evaluation table.
Key words:rough sets; positive region; psychological health; attribute
近年來,隨著社會各界對心理健康問題越來越重視,心理測量的概念和技術也得到了推廣和普及.對比較常用的心理測量量表,通常以各種情緒、人際關系、適應性等作為指標來評價[1],從而最終判斷心理健康狀況.然而,每一個評價指標的重要度在評價結果中不同,甚至有些指標對評價結果影響甚微,會干擾人們作出正確而簡潔的決策.所以,在不改變評價結果的基礎上,盡可能少的選取評價指標,構建測評量表,可以更科學、合理的簡化心理測評的過程.本文用粗糙集屬性約簡理論來實現(xiàn)心理健康量表的屬性約簡[2],構建更為客觀、合理的量表.
Rough集(Rough Sets,也稱粗糙集)[3]理論是由波蘭華沙理工大學Pawlak教授于20世紀80年代提出的一種處理含糊和不精確問題的數(shù)學工具[4].屬性約簡是粗糙集理論研究的核心內容之一,它是在保持知識庫分類能力不變的條件下,刪除其中不相關或不重要的屬性.通過屬性約簡可以從特征信息中提取有用的信息,簡化知識處理過程.人們往往期望找到具有最少條件屬性的約簡,即最小約簡.[5]然而,已經(jīng)證明了找出一個決策表最小約簡是NP-hard問題.[6]
1粗糙集相關概念
粗糙集理論的研究對象是信息表[7],通過指定對象的屬性和它們的屬性值來描述.
定義2在信息表S=(U,R,V,f)中,對于每個屬性子集B?R,可以定義一個不可分辨二元關系IND(B),IND(B)={(x,y)|(x,y)∈U2,?b∈B(b(x)=b(y))},IND(B)是一個等價關系.
定義3設X?U是任一子集,R是U上的等價關系,則有
R-(X)=∪{Y∈U/R:Y?X}
(1)
R-(X)=∪{Y∈U/R:Y∩X≠?}
(2)
分別稱式(1)和(2)為X的R下近似和R上近似,Y是U是按等價關系R分成的等價類.X的R正區(qū)域為POSR(X)= R-(X).
在信息系統(tǒng)中,冗余屬性的存在[10],一方面是對資源的浪費,另一方面干擾人們做出正確而簡潔的決策.人們希望找出具有最少條件屬性的約簡,即最小約簡,核是所有約簡的子集.
定義4設U為一個論域,P和Q都是U上的等價關系簇,如果POSP(Q)=U,則稱論域U是P上相對于Q一致的.[11]
定義5設U為一個論域,P和Q都是U上的等價關系簇,若P的Q獨立子集S?P有POSS(Q)=POSP(Q),則稱S為P的Q約簡.
定義6決策表S=(U,R,V,f),?a∈C,R?C,定義a相對于R的屬性重要度[12]為Sign=(a,R,D)=|POSR(D)|-|POSR-{a}(D)|.如果Sign=0,則屬性a是相對于決策屬性D不必要的,從決策表中刪除屬性a;如果Sign>0,則屬性a是相對于決策屬性D必要的,不能刪除.
2基于粗糙集正域屬性約簡算法
輸入:決策表S=(U,C∪D,V,f),其中U是論域,C是條件屬性集合,D是決策屬性集合.
輸出:決策表S的一個約簡T.
步驟1:在決策表S=(U,C∪D,V,f)中,計算U/IND(C),U/IND(D),計算出條件屬性集C相對于決策屬性D的正域POSC(D).
步驟2:將條件屬性集C賦值給R,R=C;T=?;
步驟3:計算U/IND(C{ai})、正域POS(C{ai}),ai的屬性重要度Sign=(ai,C,D)=|POSC(D)|-|POSC-{ai} (D)|;
步驟4:if Sign>0,T=T∪{ai},R=R-{ai+1};
步驟5:R≠?,轉向步驟3執(zhí)行,否則,輸出C相對于D的一個相對約簡T.
3心理健康測量實例應用
本次實驗用到的數(shù)據(jù)是針對某銀行40名職員的心理健康測評結果,主要測量的是受測者近期有無不健康的心理狀態(tài),其中包含9個測量因子,如表1所示.
經(jīng)過對原始測評數(shù)據(jù)的預處理,刪除重復的行,經(jīng)過離散化,用0表示正常,1表示異常,得到如表2所示的測評數(shù)據(jù).其中論域U={1,2,3,4,5,6,7,8,9,10,11,12,13,14,15}表示15個樣本,條件屬性集C={a1,a2,a3,a4,a5,a6,a7,a8,a9},決策屬性集D=djfpzrz.
表1 某銀行員工心理健康測量因子
表2 銀行員工心理健康癥狀況測評數(shù)據(jù)
根據(jù)本文運用的算法,條件屬性集C對于U的等價劃分為:
IND(C)={{1},{2},{3},{4},{5},{6},{7},{8},{9},{10},{11},{12},{13},{14},{15}},
決策屬性集D對于U的等價劃分為:IND(D)={{1,3,4,6,8,11,12,15},{2,5,7,9,10,13,14}},
POSC(D)={{1},{2},{3},{4},{5},{6},{7},{8},{9},{10},{11},{12},{13},{14},{15}}=U.
因此,論域U是C上相對于D一致的,說明該決策表是完全確定的決策表,決策表中不包含不一致信息.
計算屬性a1的重要度,Sign=(a1,C,D)=|POSC(D)|- |POSC-{a1} (D)|;先從條件屬性集C中去掉屬性a1,得條件屬性集C{a1}對于U的等價劃分為:
IND(C{a1})={{1},{2},{3},{4},{5,9},{6},{7},{8},{10},{11},{12},{13},{14},{15}},
POSC-{a1} (D)= {{1},{2},{3},{4},{5},{6},{7},{8},{9},{10},{11},{12},{13},{14},{15}},
Sign=(a1,C,D)=|POSC(D)|- |POSC-{a1} (D)|=0.
同理得a2,a5,a6,a7,a9的重要度均為0,而a3、a4、a8的重要度為Sign=(a3,C,D)=2,Sign=(a4,C,D)=2,Sign=(a8,C,D)=2.
由定義5可知,屬性a3、a4、a8重要度Sign大于0,相對于決策屬性D必要的,不能刪除,T={a3、a4、a8}是決策表的一個相對約簡.
由上述粗糙集正域約簡算法對心理健康測量決策表約簡結果得出,受測者近期有無不健康的心理狀態(tài),主要取決于近期是否在人際交往上有不自在、不適應的問題(a3)、是否情緒不安,處于焦慮狀態(tài)中(a4)、是否具有一些偏執(zhí)性的思維特征,例如固執(zhí)己見、多疑敏感、好斗記仇等(a8).
4結語
本文探討了基于粗糙集正域模型下心理健康測量決策表的約簡方法,通過分析粗糙集正域的相關理論,提出一種基于粗糙集正域的決策表約簡算法.實驗研究表明,該算法在約簡后得到影響測量結果的重要屬性,為構建更為科學、合理的測評量表提供理論依據(jù),具有一定的實用價值.但是,該研究一方面還需要對現(xiàn)有數(shù)據(jù)進一步從多個角度來深入分析和挖掘,另一方面也需要粗糙集領域相關算法研究的支持.
[參考文獻]
[1]王國胤.Rough集理論與知識獲取[M].西安:西安交通大學出版社,2001.
[2]張文修,吳偉志,梁吉業(yè),等.粗糙集理論與方法[M].北京:科學出版社,2003.
[3]劉清.Rough集及Rough推理[M].北京:科學出版社,2001.
[4]楊傳健,葛浩,汪志圣.基于粗糙集的屬性約簡方法研究綜述[J].計算機應用研究,2012,29(1):215-219.
[5]余嘉元.粗糙集和神經(jīng)網(wǎng)絡在心理測量中的應用[J].心理學報,2008,40(8):939-946.
[6]徐章艷,舒文豪,錢文彬,等.基于序關系的快速計算正區(qū)域核的算法[J].計算機科學,2010,37(7):102-106.
[7]TENG S H,ZHOU S L,SUN J X,et al.Attribute reduction algorithm based on conditional entropy under incomplete information system[J].J NUDT,2010,32(1):90-94.
[8]張賢勇,熊方,莫智文,等.變精度上近似與程度下近似粗糙集模型的正域及其算法[J].計算機科學,2012,39(1):111-115.
[9]唐朝輝,陳玉明.基于粗糙集正域的醫(yī)療決策表約簡算法[J].宜春學院學報,2012,34(8):76-80.
[10]馮林,羅芬,方丹,等.基于改進擴展正域的屬性核與屬性約簡方法[J].山東大學學報,2012,47(1):26-31.
[11]李洪,向永生,陳曦.一種基于正域的決策表增量求核算法[J].微計算機信息,2010,26(11):82-85.
[12]馮林.一種擴展正域的屬性約簡方法[J].計算機工程,2010,36(21):62-64.
[責任編輯王新奇]
Vol.18No.3Jul.2015