劉娟,唐玄
(蚌埠學(xué)院 計(jì)算機(jī)科學(xué)與技術(shù)系,安徽 蚌埠 233000)
在高等院校的計(jì)算機(jī)教學(xué)中,計(jì)算機(jī)文化基礎(chǔ)課程是非常重要的一門必修課程.它是計(jì)算機(jī)專業(yè)和非專業(yè)的基礎(chǔ)課程,是其他計(jì)算機(jī)相關(guān)課程的重要前導(dǎo)課程.由于該門課程關(guān)系到學(xué)生升學(xué)或就業(yè)以后能迅速而熟練地使用計(jì)算機(jī)相關(guān)的專業(yè)和非專業(yè)軟件,高等院校非常重視學(xué)生對(duì)計(jì)算機(jī)文化基礎(chǔ)課程的學(xué)習(xí),通常會(huì)要求學(xué)生在學(xué)習(xí)該門課程后統(tǒng)一參加省級(jí)計(jì)算機(jī)一級(jí)考試.通過(guò)參加等級(jí)考試,可以促進(jìn)學(xué)生對(duì)計(jì)算機(jī)文化基礎(chǔ)的學(xué)習(xí),增強(qiáng)學(xué)生學(xué)習(xí)計(jì)算機(jī)文化基礎(chǔ)的動(dòng)力,提高學(xué)生操作計(jì)算機(jī)的技能.為了提高學(xué)生的計(jì)算機(jī)文化基礎(chǔ)理論知識(shí)和實(shí)踐能力,本文將采用基于粗糙集的數(shù)據(jù)挖掘方法對(duì)安徽省計(jì)算機(jī)一級(jí)考試成績(jī)進(jìn)行分析,獲取有益于教學(xué)與學(xué)習(xí)的相關(guān)數(shù)據(jù)信息,從而提高學(xué)生計(jì)算機(jī)水平,還可以為進(jìn)一步研究粗糙集打下堅(jiān)實(shí)的理論與實(shí)踐基礎(chǔ).
1982年,波蘭學(xué)者Z.Pawlak 提出了一種用來(lái)處理不確定數(shù)據(jù)信息的理論.該理論在不需要事先提供相關(guān)附加知識(shí)的前提下對(duì)原始數(shù)據(jù)集進(jìn)行分析,直接從給定的數(shù)據(jù)集合中找出隱含的知識(shí),并提供與要解決的問(wèn)題有關(guān)的結(jié)論.
粗糙集通常被定義為一個(gè)四元組:S=(U,A,V,f).U 被定義為包含所有數(shù)據(jù)對(duì)象的對(duì)象集,有U={x1,x2,...,xn},也被稱作論域;A 為屬性集,包含條件屬性集C 和決策屬性集D,有A=C∪D={a1,a2,...,an},并且C∩D=Φ,其中C 通常為屬性集,而D 通常為單屬性集;V 為屬性集A的值域;f 被定義為論域S 中數(shù)據(jù)對(duì)象的屬性集A 到值域V的映射函數(shù).該四元組可簡(jiǎn)寫為S=(U,A),S 也被稱為信息系統(tǒng)或決策表.D的C 正域被記為POS(C,D)=∪{C_(X):X ∈U/D},表示肯定屬于D的對(duì)象所組成的最大的集合.C 相對(duì)于D的屬性依賴度定義為γ(C,D)=|POS(C,D)|/|U|.屬性重要性被定義為σ(C,D,C')=γ(C,D)-γ(C-C',D),某屬性重要性越大,則該屬性對(duì)D 影響越大,即其取值對(duì)決策結(jié)果的影響就越大.
從某班級(jí)學(xué)生進(jìn)行的一次模擬考試中獲取數(shù)據(jù)庫(kù)表,對(duì)其整理可得表1.
表1 部分原始數(shù)據(jù)
等級(jí)考試中,單項(xiàng)選擇題總分30分,多項(xiàng)選擇題總分10分,打字題10分,Windows 操作題8分,Word 操作題18分,Excel操作題14分,PowerPoint 操作題10分,總分100分.
首先,對(duì)各個(gè)題型的成績(jī)進(jìn)行離散化處理.可以將各個(gè)題型的成績(jī)除以相應(yīng)題型總分再乘以100.再按照[0,59]、[60-84]、[85-100]三個(gè)成績(jī)區(qū)間將各個(gè)題型成績(jī)及總分劃分為“不及格”、“及格”、“優(yōu)秀”三個(gè)等級(jí),并設(shè)置其值分別為1、2、3.
為方便書寫,特對(duì)表中各個(gè)屬性名稱進(jìn)行更改,使用A1-A7 代表各題型,使用T 代表總分.離散化后的數(shù)據(jù)結(jié)果為表2.
表2 離散化后的部分?jǐn)?shù)據(jù)
根據(jù)粗糙集的定義,可得出:
根據(jù)公式計(jì)算可得每種題型屬性重要性分別為:
通過(guò)上面對(duì)給定的模擬考試數(shù)據(jù)集進(jìn)行分析,表明單選題、多選題及Excel 操作題對(duì)學(xué)生成績(jī)影響比較大,打字題、Word題影響相對(duì)較小,Windows 操作題和PowerPoint 操作題影響基本可以忽略不計(jì).再通過(guò)日常教學(xué)活動(dòng)可知,學(xué)生由于對(duì)選擇題里的涉及的概念理解不深,對(duì)Excel的函數(shù)運(yùn)用較為生疏,從而導(dǎo)致這兩種題型容易失分.而學(xué)生在日常上機(jī)和生活中,已經(jīng)熟悉與打字題、Windows 操作題、Word 操作題、PowerPoint 操作題相關(guān)的操作,所以這些題型分?jǐn)?shù)相對(duì)較高.因此,應(yīng)促使學(xué)生在日常學(xué)習(xí)中加強(qiáng)理論知識(shí)的理解,多多練習(xí)Excel的函數(shù)運(yùn)用,增強(qiáng)程序設(shè)計(jì)能力,才能提高計(jì)算機(jī)操作水平,并為以后學(xué)習(xí)程序設(shè)計(jì)課程或其他計(jì)算機(jī)相關(guān)課程打下基礎(chǔ).
本文通過(guò)粗糙集模型對(duì)安徽省一級(jí)計(jì)算機(jī)等級(jí)考試進(jìn)行了分析,為計(jì)算機(jī)文化基礎(chǔ)教學(xué)提供了指導(dǎo)方向,也為更進(jìn)一步地研究粗糙集提供了實(shí)踐基礎(chǔ).由于本文所獲取的原始數(shù)據(jù)量較少且數(shù)據(jù)信息完整,不能體現(xiàn)大數(shù)據(jù)量、數(shù)據(jù)集不完備情況下使用粗糙集進(jìn)行數(shù)據(jù)挖掘的優(yōu)點(diǎn),希望下一次能進(jìn)行改進(jìn).
[1]苗奪謙,王玨.粗糙集理論中概念與運(yùn)算的信息表示[J].軟件學(xué)報(bào),1999,10(2):113-116.
[2]張文修,吳偉志.粗糙集理論介紹和研究綜述[J].模糊系統(tǒng)與數(shù)學(xué),2000,14(4):1-12.DOI:10.3969/j.issn.1001-7402.2000.04.001.
[3]韓禎祥,張琦,文福拴,等.粗糙集理論及其應(yīng)用綜述[J].控制理論與應(yīng)用,1999,16(2):153-157.DOI:10.3969/j.issn.1000-8152.1999.02.001.
[4]胡可云,陸玉昌,石純一,等.粗糙集理論及其應(yīng)用進(jìn)展[J].清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2001,41(1):64-68.
[5]李永敏,朱善君,陳湘暉,等.基于粗糙集理論的數(shù)據(jù)挖掘模型[J].清華大學(xué)學(xué)報(bào)(自然科學(xué)版),1999,39(1):110-113.
[6]梁吉業(yè),曲開(kāi)社,徐宗本,等.信息系統(tǒng)的屬性約簡(jiǎn)[J].系統(tǒng)工程理論與實(shí)踐,2001,21(12):76-80.
[7]韓禎祥,張琦,文福拴,等.粗糙集理論及其應(yīng)用[J].信息與控制,1998,27(1):37-45.DOI:10.3969/j.issn.1002-0411.1998.01.008.
[8]侯利娟,王國(guó)胤,聶能,等.粗糙集理論中的離散化問(wèn)題[J].計(jì)算機(jī)科學(xué),2000,27(12):89-94.DOI:10.3969/j.issn.1002-137X.2000.12.023.
[9]王光宏,蔣平.數(shù)據(jù)挖掘綜述[J].同濟(jì)大學(xué)學(xué)報(bào)(自然科學(xué)版),2004,32(2):246-252.