張 帆,李其深,劉 穎
(1西南石油大學(xué) 理學(xué)院,四川 成都 610500;2中南民族大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)學(xué)院,湖北 武漢 430074)
粗糙集理論在師范生培養(yǎng)質(zhì)量分析中的應(yīng)用
張 帆1,李其深1,劉 穎2
(1西南石油大學(xué) 理學(xué)院,四川 成都 610500;2中南民族大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)學(xué)院,湖北 武漢 430074)
師范生教育是高等本科教育體系的一部分,為初等教育培養(yǎng)高水平教育工作者和管理人才?;诖植诩碚撚懻搸煼渡呐囵B(yǎng)質(zhì)量問(wèn)題。首先確定評(píng)價(jià)指標(biāo)并隨機(jī)抽取一定數(shù)量的數(shù)據(jù),根據(jù)粗糙集的重要度對(duì)數(shù)據(jù)進(jìn)行屬性約簡(jiǎn),通過(guò)約簡(jiǎn)表提取規(guī)則,對(duì)師范生培養(yǎng)質(zhì)量進(jìn)行客觀評(píng)價(jià)分析,為以后的師范生培養(yǎng)提供參考。
粗糙集;屬性約簡(jiǎn);重要度;師范生;培養(yǎng)質(zhì)量
師范生教育是科教興國(guó)和人才強(qiáng)國(guó)戰(zhàn)略的重要內(nèi)容。我國(guó)師范院校眾多,以“德高為師,身正為范”為標(biāo)準(zhǔn)培養(yǎng)一代又一代的教育工作者。本文從評(píng)價(jià)的基本理論著手,將師范生的培養(yǎng)質(zhì)量作為對(duì)象,構(gòu)建師范生培養(yǎng)質(zhì)量的評(píng)價(jià)體系,加強(qiáng)對(duì)師范生培養(yǎng)理論層次的認(rèn)識(shí)。從實(shí)踐操作的角度來(lái)看,建立科學(xué)高效的師范生培養(yǎng)質(zhì)量評(píng)價(jià)體系可以推進(jìn)我國(guó)師范生培養(yǎng)的規(guī)范發(fā)展和持續(xù)改進(jìn)。對(duì)于師范生培養(yǎng)質(zhì)量的討論能夠在一定程度上幫助教育系統(tǒng)從上而下整體地提高辦學(xué)水平。
粗糙集理論[1-2]是一種用來(lái)處理不精確、不確定和不完全數(shù)據(jù)的非經(jīng)典數(shù)學(xué)理論。粗糙集理論可以從大量的數(shù)據(jù)中挖掘潛在的、有利用價(jià)值的知識(shí)。粗糙集理論將知識(shí)理解成為“區(qū)分事物的能力”,將論域上的知識(shí)進(jìn)行劃分,通過(guò)論域上的等價(jià)關(guān)系來(lái)表示知識(shí)。對(duì)知識(shí)的這種特殊理解方式?jīng)Q定了它與傳統(tǒng)的處理不確定性問(wèn)題理論的方法存在著本質(zhì)的區(qū)別。粗糙集理論不需要已知數(shù)據(jù)外的其他先驗(yàn)知識(shí),通過(guò)對(duì)知識(shí)的簡(jiǎn)化和知識(shí)的依賴(lài)性分析,完全可以由已知的數(shù)據(jù)導(dǎo)出決策規(guī)則。由于粗糙集理論一般只能處理離散數(shù)據(jù),所以當(dāng)要處理連續(xù)屬性值數(shù)據(jù)時(shí),一般先要對(duì)數(shù)據(jù)離散化[3]。本文嘗試借助粗糙集的理論與方法,對(duì)師范生的培養(yǎng)質(zhì)量進(jìn)行客觀的數(shù)學(xué)理論方法的分析研究,并給出相應(yīng)的決策規(guī)則,幫助高校在人才培養(yǎng)過(guò)程中更清晰地對(duì)師范生進(jìn)行考核與教育。
1.1粗糙集理論基礎(chǔ)
粗糙集理論由波蘭科學(xué)家Z.Pawlak于1982年提出,它是繼概率論、模糊集、證據(jù)理論之后又一新的處理模糊和不確定性知識(shí)的數(shù)學(xué)工具[4]。粗糙集理論認(rèn)為知識(shí)本身就應(yīng)該具有對(duì)對(duì)象的分類(lèi)能力,并提供嚴(yán)格的數(shù)學(xué)理論方法,使得知識(shí)有一個(gè)清晰定義的數(shù)學(xué)意義,并且可使用數(shù)學(xué)方法來(lái)分析處理。運(yùn)用粗糙集理論能處理定量、定性的因素,有效分析不完整的、不一致的、不精確的等各種不完備的信息,能對(duì)數(shù)據(jù)進(jìn)行分析推理,發(fā)現(xiàn)其中隱含的規(guī)律。其主要思想就是在保持知識(shí)分類(lèi)能力不變的前提下,通過(guò)知識(shí)約簡(jiǎn)來(lái)導(dǎo)出問(wèn)題的決策或分類(lèi)規(guī)則。目前,粗糙集理論已經(jīng)被成功地應(yīng)用于過(guò)程控制、決策分析、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘與模式識(shí)別等領(lǐng)域。
定義2 若P?R,且P≠Φ,則P中全部等價(jià)關(guān)系的交集稱(chēng)為P上的不可分辨關(guān)系,記為ind(p):ind(P)={(x,y)∈U×U|?q∈P,f(x,q)=f(y,q)}。
定義3 設(shè)S=(U,A,V,f)為一知識(shí)表達(dá)系統(tǒng),A=C∪D,C∩D=Φ,C稱(chēng)為條件屬性集,D稱(chēng)為決策屬性集。具有條件屬性和決策屬性的知識(shí)表達(dá)系統(tǒng)稱(chēng)為決策表。
定義4 設(shè)S=(U,A,V,f)為一個(gè)信息系統(tǒng),a∈A,如果ind(A-{a})=ind(A),則稱(chēng)a在A中是不必要的,否則稱(chēng)a在A中是必要的。
定義5 設(shè)S=(U,A,V,f)為一個(gè)信息系統(tǒng),如果?a∈A在A中都是必要的,則稱(chēng)屬性集A是獨(dú)立的,否則稱(chēng)A是相關(guān)的。
定理1 如果A是獨(dú)立的,P?A,則P也是獨(dú)立的。
定義6 設(shè)S=(U,A,V,f)為一個(gè)信息系統(tǒng),P?A,如果P是獨(dú)立的,且ind(P)=ind(A),則稱(chēng)P是A的一個(gè)約簡(jiǎn)。
定義7 設(shè)S=(U,A,V,f)為一個(gè)信息系統(tǒng),A中所有必要屬性組成的集合稱(chēng)為屬性集A的核,記為core(A)。
定理2core(A)=∩red(A),其中red(A)表示A的所有約簡(jiǎn)。
定義8 對(duì)于決策表S=(U,C∪D,V,f)中的條件屬性集X?C,W?U,X的支持子集是SX(W)=W(U/X)-=∪V∈U/X,V?WV。
1.2指標(biāo)體系的建立與數(shù)據(jù)離散化
師范生的培養(yǎng)質(zhì)量主要通過(guò)師范生個(gè)體反映出來(lái),作為培養(yǎng)師范生的高校,所采用的數(shù)字計(jì)劃會(huì)對(duì)師范生培養(yǎng)質(zhì)量有直接的影響[6-7]。學(xué)生的各項(xiàng)指標(biāo)數(shù)據(jù)就是師范生培養(yǎng)質(zhì)量?jī)?yōu)劣的具體表現(xiàn),也是師范生培養(yǎng)質(zhì)量的重點(diǎn)考核標(biāo)準(zhǔn)。本文根據(jù)師范生的教育目標(biāo)和師范生的本質(zhì)特點(diǎn),考察和剖析師范生培養(yǎng)形成的全過(guò)程,建立以政治思想素質(zhì)、專(zhuān)業(yè)課程學(xué)習(xí)、外國(guó)語(yǔ)水平、計(jì)算機(jī)水平、教學(xué)實(shí)踐、學(xué)位論文為評(píng)價(jià)指標(biāo)的評(píng)價(jià)體系。
在對(duì)學(xué)生指標(biāo)數(shù)據(jù)離散化的過(guò)程中,指標(biāo)的評(píng)價(jià)數(shù)據(jù)往往帶有某種語(yǔ)義偏好,對(duì)于帶有偏好的有關(guān)語(yǔ)言值評(píng)語(yǔ)集釆用等級(jí)制進(jìn)行分類(lèi),并進(jìn)行數(shù)值化。對(duì)于語(yǔ)義偏好由低到高,依次建立多個(gè)評(píng)價(jià)等級(jí)。語(yǔ)言值評(píng)語(yǔ)集的數(shù)值化表如表1所示。
表1 語(yǔ)言值評(píng)語(yǔ)集的數(shù)值化表
指標(biāo)數(shù)據(jù)也常常帶有連續(xù)數(shù)值,對(duì)于這種帶有連續(xù)數(shù)值的指標(biāo)數(shù)據(jù),需要進(jìn)行離散化。具體的方法是:將連續(xù)數(shù)值的整個(gè)區(qū)間按照劃分的完整性依次分為4個(gè)區(qū)間,并對(duì)這4個(gè)區(qū)間的數(shù)值偏好關(guān)系進(jìn)行離散化、數(shù)值化。連續(xù)數(shù)值的離散化表如表2所示。
表2 連續(xù)數(shù)值的離散化表
首先建立關(guān)于師范生培養(yǎng)的信息系統(tǒng),即S=(U,C∪D,V,f),其中,U={u1,u2,…,un},ui表示第i名學(xué)生,共有n名;以師范生培養(yǎng)影響指標(biāo)作為條件屬性C={aj,j=1,2,3,4,5,6},a1表示政治思想素質(zhì),a2表示專(zhuān)業(yè)課程學(xué)習(xí),a3表示外語(yǔ)水平,a4表示計(jì)算機(jī)水平,a5表示教學(xué)實(shí)踐,a6表示學(xué)位論文。將培養(yǎng)質(zhì)量作為決策屬性,記為d,D=yw2qkq8,d的取值為1、2、3、4,分別代表差、中等、良好、優(yōu)秀;d的值由各班主任及專(zhuān)業(yè)教授主觀給出。隨機(jī)抽取學(xué)生原始數(shù)據(jù)如表3所示。
表3 隨機(jī)抽取學(xué)生原始數(shù)據(jù)
按照表2中離散化數(shù)值表將決策表進(jìn)行離散化后得到離散化處理后各指標(biāo)數(shù)據(jù)如表4所示。
表4 離散化處理后各指標(biāo)數(shù)據(jù)
基于屬性重要度對(duì)以上決策表進(jìn)行屬性約簡(jiǎn),該算法的具體步驟如下所示[8]:
1)求核算法。
輸入:信息系統(tǒng)S=(U,C∪D,V,f)
輸出:屬性集合C的核core(C)
Step1:設(shè)置1→i;
Step3:令xi∈core(C),轉(zhuǎn)Step4;
Step4:如果i=|X|,則算法完成,core(C)即為屬性集合C的核。如果i<|X|,轉(zhuǎn)Step5;
Step5:令i+1→i,轉(zhuǎn)Step2。
2)屬性約簡(jiǎn)算法。
輸入:信息系統(tǒng)S=(U,C∪D,V,f)
輸出:屬性集合C的核約簡(jiǎn)red(C)
Step1:根據(jù)求核算法求出core(C);
Step2:令B=core(C),如果ind(B)=ind(C),轉(zhuǎn)Step5;
Step3:?a∈CB,計(jì)算它們相對(duì)于core(C)的屬性重要度,取屬性重要度最大的屬性am,如果這樣的屬性有多個(gè),則選取在論域上形成的劃分個(gè)數(shù)最少的那個(gè),把它加入B中,即B∪{am}?B;
Step4:如果ind(B)≠ind(C),轉(zhuǎn)Step3,否則轉(zhuǎn)Step5;
Step5:輸出B∈red(C),算法結(jié)束。
通過(guò)算法進(jìn)行數(shù)據(jù)處理得到的核是{a2,a6},約簡(jiǎn)結(jié)果{a1,a2,a6}與{a2,a3,a6}與{a2,a4,a6}。對(duì)于約簡(jiǎn){a1,a2,a6}得到屬性約簡(jiǎn)表如表5所示。
表5 屬性約簡(jiǎn)表
規(guī)則提取得到:
a1(2)anda2(2)anda6(3)?d(3)
a1(3)anda2(2)anda6(2)?d(2)
a1(2)anda2(2)anda6(2)?d(2)
a1(1)anda2(2)anda6(2)?d(2)
a1(3)anda2(1)anda6(2)?d(2)
a1(2)anda2(1)anda6(2)?d(1)
a1(1)anda2(1)anda6(2)?d(1)
a1(1)anda2(1)anda6(1)?d(0)
a1(1)anda2(0)anda6(1)?d(0)
從此約簡(jiǎn)得到的規(guī)則中可以得到以下信息:如果一個(gè)學(xué)生政治思想素質(zhì)與專(zhuān)業(yè)課程學(xué)習(xí)良好、學(xué)位論文優(yōu)秀,那么這個(gè)學(xué)生的培養(yǎng)質(zhì)量是優(yōu)秀的;如果一個(gè)學(xué)生政治思想素質(zhì)不差、專(zhuān)業(yè)課程學(xué)習(xí)與學(xué)位論文良好,那么這個(gè)學(xué)生的培養(yǎng)質(zhì)量是良好的;如果一個(gè)學(xué)生政治思想素質(zhì)優(yōu)秀、專(zhuān)業(yè)課程學(xué)習(xí)中等、學(xué)位論文良好,那么這個(gè)學(xué)生的培養(yǎng)質(zhì)量是良好的;如果一個(gè)學(xué)生政治思想素質(zhì)中等或者良好、專(zhuān)業(yè)課程學(xué)習(xí)中等、學(xué)位論文良好,那么這個(gè)學(xué)生的培養(yǎng)質(zhì)量是中等的;如果一個(gè)學(xué)生政治思想素質(zhì)與學(xué)位論文中等、專(zhuān)業(yè)課程學(xué)習(xí)較差或者中等,那么這個(gè)學(xué)生的培養(yǎng)質(zhì)量是差的。對(duì)于其他約簡(jiǎn)表也可以提取相應(yīng)的規(guī)則并得到培養(yǎng)質(zhì)量的分析和參考。
對(duì)于師范類(lèi)學(xué)生來(lái)說(shuō),屬性集{政治思想素質(zhì),專(zhuān)業(yè)課程學(xué)習(xí),外國(guó)語(yǔ)水平,教學(xué)實(shí)踐,學(xué)位論文}的約簡(jiǎn)為{政治思想素質(zhì),專(zhuān)業(yè)課程學(xué)習(xí),學(xué)位論文},{專(zhuān)業(yè)課程學(xué)習(xí),外國(guó)語(yǔ)水平,學(xué)位論文},{專(zhuān)業(yè)課程學(xué)習(xí),計(jì)算機(jī)水平,學(xué)位論文},屬性集的核為{專(zhuān)業(yè)課程學(xué)習(xí),學(xué)位論文}。說(shuō)明專(zhuān)業(yè)課程學(xué)習(xí)、學(xué)位論文基本上可以反映出對(duì)學(xué)生的培養(yǎng)質(zhì)量水平,而師范生特有的教學(xué)實(shí)踐由于評(píng)價(jià)由所在實(shí)踐單位給出,一般得到的評(píng)價(jià)都是優(yōu)秀,沒(méi)有客觀反映實(shí)際教學(xué)效果,故從數(shù)據(jù)上得不到參考。通過(guò)規(guī)則表可以發(fā)現(xiàn),培養(yǎng)一名優(yōu)秀或者良好的師范生需要在哪些方面加強(qiáng)教育,在實(shí)際的教育培養(yǎng)過(guò)程中可以更清晰地了解他們的發(fā)展趨勢(shì)并使他們變得更加優(yōu)秀。
[1] Pawlak Z.Rough sets[J].International Journal of Computer and Information Sciences,1982,11:341-356.
[2] 張文修,吳偉志,梁吉業(yè),等.粗糙集理論與方法[M].北京:科學(xué)出版社,2001:1-39.
[3] 王彪,段禪倫,吳昊,等.粗糙集與模糊集的研究及應(yīng)用[M].北京:電子工業(yè)出版社,2008:1-32.
[4] 董婷.碩士研究生教育質(zhì)量評(píng)價(jià)的研究[D].武漢:武漢理工大學(xué),2005.
[5] 賀衛(wèi)紅,劉志輝,鐘嘉鳴.基于粗糙集的教育網(wǎng)站綜合評(píng)價(jià)研究[J].計(jì)算機(jī)應(yīng)用與軟件,2009(26):57-61.
[6] 王麗娜.基于粗糙集的數(shù)據(jù)挖掘改進(jìn)的屬性約簡(jiǎn)算法研究[D].成都:電子科技大學(xué),2012.
[7] 麥宏元.基于粗糙集的高職院校學(xué)生綜合測(cè)評(píng)模式的應(yīng)用研究[D].南寧:廣西大學(xué),2012.
[8] 張巖,秦克云,宋軍智.基于粗糙集理論的研究生教育質(zhì)量評(píng)價(jià)方法[J].文教資料,2012(3月下旬刊):136-138.
(責(zé)任編輯桂堤)
Application of Rough Set Theory in Analysis of Normal Students' Cultivation Quality
ZhangFan1,LiQishen1,LiuYing2
(1School of Science,Southwest Petroleum University,Chengdu Sichuan 610500;2School of Mathematics and Statistics,South-Central University for Nationalities,Wuhan Hubei 430074)
Normal education is a part of the higher undergraduate education system,which can train high-level educators and management personnels for primary education.This paper discusses the cultivation quality of normal stuednts based on Rough Set Theory.Firstly,the evaluation indexes and a certain amount of random data should be chosen.Then the data attribute reduction can be carried out according to the importance degree of rough sets.By using reduction table to extract certain rules, the training quality of normal students are evaluated and analyzed objectively,which provides a reference for the future training.
rough set;attribute reduction;significance;normal students;cultivation quality
2014-05-09
張帆(1990— ),男,碩士生。
10.3969/j.issn.2095-4565.2014.04.010
TP18
A
2095-4565(2014)04-0036-05