王與,劉洋
(滁州學(xué)院數(shù)學(xué)科學(xué)學(xué)院,安徽滁州 239000)
分類技術(shù)在高校教學(xué)管理中的應(yīng)用
王與,劉洋
(滁州學(xué)院數(shù)學(xué)科學(xué)學(xué)院,安徽滁州 239000)
隨著高等教育的日益普及,運用科學(xué)的分析方法找出更科學(xué)更有效的管理手段,已經(jīng)成為高校管理面臨的新課題。以某新建本科院校學(xué)生專業(yè)方向選擇為例,根據(jù)學(xué)生的學(xué)習(xí)情況,運用貝葉斯分類技術(shù)對其進行分類預(yù)測,從而幫助教學(xué)管理部門做出科學(xué)的決策,合理分配教學(xué)資源。
分類預(yù)測;貝葉斯分類技術(shù);教學(xué)管理
隨著我國高等教育的日益普及,高校的辦學(xué)規(guī)模在不斷增大,高校的管理也隨之面臨著巨大的壓力和挑戰(zhàn)。對于高校教學(xué)管理者來說,基于現(xiàn)有的資源運用科學(xué)的分析方法找出更科學(xué)更有效的管理手段,已經(jīng)成為高校面臨的新課題。為適應(yīng)高等教育的大眾化,培養(yǎng)高素質(zhì)的應(yīng)用型人才,很多高校在培養(yǎng)模式上進行了大幅度的改革,比較常見的做法是在各專業(yè)實行“大專業(yè)、寬口徑、多方向”的培養(yǎng)模式,即在大學(xué)的前兩年內(nèi),學(xué)生主要學(xué)習(xí)公共基礎(chǔ)課和學(xué)科基礎(chǔ)課(必修),而后兩年,學(xué)生可以根據(jù)自己的愛好、個性發(fā)展以及現(xiàn)階段的學(xué)習(xí)情況,在設(shè)置的多個專業(yè)方向中任選一個方向進行深入學(xué)習(xí)。專業(yè)方向的選擇一定程度上決定了學(xué)生今后的發(fā)展,因此合理的選擇合適自己的專業(yè)方向顯得尤為重要。一般來說,學(xué)生在進行專業(yè)方向的選擇時,往往是依據(jù)自己的理解及興趣愛好進行的,有時還會受到諸多外界因素的影響,主要包括同學(xué)、老師、父母、家庭和社會的影響。雖然大三學(xué)生已經(jīng)在本專業(yè)進行了兩年的學(xué)習(xí),但對專業(yè)方向了解并不深,面對多種多樣的方向及課程設(shè)置,大部分的學(xué)生對各門課程間的關(guān)聯(lián)并不了解,對何種專業(yè)方向合適自己也沒有認識,因此在選擇時多半是隨意選擇,具有一定的盲目性,這也就造成了學(xué)生在后續(xù)的學(xué)習(xí)中遇到很多困難,可能選擇了完全不合適自己的方向,甚至影響今后職業(yè)發(fā)展。如何科學(xué)的指導(dǎo)學(xué)生選擇專業(yè)方向,將學(xué)生的興趣愛好與專業(yè)知識的掌握程度充分相結(jié)合,從而合理的選擇專業(yè)方向,成為高校教育管理中的一個重要的課題。
本文以某新建本科院校數(shù)學(xué)與應(yīng)用數(shù)學(xué)專業(yè)學(xué)生方向選擇為例,結(jié)合學(xué)生對專業(yè)方向選擇的實際需求,運用貝葉斯分類技術(shù),根據(jù)學(xué)生的學(xué)習(xí)情況對其進行分類預(yù)測,幫助教學(xué)管理部門做出合理決策,達到指導(dǎo)學(xué)生合理選擇專業(yè)方向以及預(yù)測方向人數(shù)的目的。
1.1 分類技術(shù)概述
數(shù)據(jù)挖掘技術(shù)是一門綜合性多學(xué)科的技術(shù),被認為是數(shù)據(jù)庫和人工智能領(lǐng)域中研究、開發(fā)和應(yīng)用最活躍的分支之一。近年來已廣泛應(yīng)用在產(chǎn)品質(zhì)量分析、金融風(fēng)險預(yù)測、電信、分子生物學(xué)、基因工程研究以及信息搜索等眾多領(lǐng)域。分類作為數(shù)據(jù)挖掘中具有代表性的一種方法,也漸漸成為目前數(shù)據(jù)挖掘領(lǐng)域應(yīng)用廣泛的一個分支。分類技術(shù)是運用分類方法構(gòu)建一個分類函數(shù)(分類模型或分類器),根據(jù)這個分類將輸入的數(shù)據(jù)映射到某個給定的類別上。分類問題的應(yīng)用領(lǐng)域很廣,數(shù)據(jù)挖掘中的很多問題都可以轉(zhuǎn)換為分類問題來處理。比較典型的是客戶服務(wù)領(lǐng)域,比如將客戶按忠誠度分類,預(yù)測客戶的流失度等。
貝葉斯分類方法是一種使用方便且錯誤率最小的概率分類法,其具有完善的貝葉斯理論基礎(chǔ),有很好的模型、學(xué)習(xí)以及推理能力,是一種使用普遍的數(shù)據(jù)挖掘分類方法。貝葉斯分類技術(shù)是一種統(tǒng)計學(xué)分類方法,一般用于預(yù)測類成員聯(lián)系的可能性,例如,數(shù)據(jù)項屬于某個特定類的概率[1]。
1.2 貝葉斯分類模型
貝葉斯分類是一種基于概率統(tǒng)計中貝葉斯定理的分類模型,其利用數(shù)據(jù)的屬性值,通過計算來預(yù)測數(shù)據(jù)屬于某個類的可能性來對數(shù)據(jù)進行分類。分類數(shù)據(jù)項是由條件屬性值組成的特征向量,并且還具有一個目標屬性。其具體的數(shù)據(jù)項形式X{x1,x2,…,x n;c}為離散變量的有限集,其中xi(1≤i≤n)為條件屬性值,c為目標屬性。令樣本集有A1,A2,…,An這n個屬性,構(gòu)成了樣本的特征向量,可能的類別為{C1,C2,…,Cm},待分類樣本X的特征向量為{x1,x2,…,xn;c}。這樣,我們通過求出X分別屬于每個類別的概率P(Ci|X),其中P(Ci|X)=P(X|Ci)P(Ci)/P(X),得出最大概率的即為X的預(yù)測類別。對所有的Ci,P(X)都相同,而P(Ci)等于訓(xùn)練集中類別為Ci的樣本所占的比例值,則只需比較P(X|Ci)·P(Ci)的大小。若假設(shè)屬性獨立,則有P(X|Ci)=
2.1 問題描述及數(shù)據(jù)預(yù)處理
該專業(yè)設(shè)置兩個方向供學(xué)生選擇,分別為:軟件工程方向及經(jīng)濟金融方向。入學(xué)前兩年學(xué)生主要學(xué)習(xí)公共基礎(chǔ)課和學(xué)科基礎(chǔ)課,大三時學(xué)生可以根據(jù)自己的興趣愛好及課程學(xué)習(xí)情況進行選擇其中任意一個方向進行深入學(xué)習(xí)。
本例中,分類目標屬性為本專業(yè)方向:軟件工程方向及經(jīng)濟金融方向,數(shù)據(jù)樣本包含19個條件屬性(即課程),分別為:數(shù)值分析、數(shù)學(xué)建模與計算軟件、數(shù)據(jù)庫原理與應(yīng)用、數(shù)據(jù)結(jié)構(gòu)、解析幾何、概率統(tǒng)計、離散數(shù)學(xué)、常微分方程、復(fù)變函數(shù)、計算機基礎(chǔ)、高等代數(shù)(一、二)、數(shù)學(xué)分析(一、二、三)等17門課程,課程成績轉(zhuǎn)化為四級制(優(yōu)秀、良好、中等、及格)記錄,數(shù)據(jù)中還另外包含2個條件屬性,分別是學(xué)生對兩個方向的興趣度:對軟件方向的興趣度及對金融方向的興趣度,以三級制(較多、一般、較少)記錄,即所有屬性值均為離散值。在選擇某屆該專業(yè)學(xué)生成績及專業(yè)方向選擇情況作為專業(yè)選擇訓(xùn)練集樣本,經(jīng)過預(yù)處理共有62條記錄,其中2個目標屬性數(shù)據(jù)來自于學(xué)生方向選擇表,19個成績條件屬性來自于學(xué)生成績表,而2個興趣度條件屬性則來自于對學(xué)生的問卷調(diào)查。
2.2 貝葉斯分類模型流程
貝葉斯學(xué)生方向選擇模型流程如圖1所示:
圖1 貝葉斯分類的流程
2.3 實例分析預(yù)測
推斷新樣本的專業(yè)方向選擇情況,用貝葉斯分類法對某高校數(shù)學(xué)與應(yīng)用數(shù)學(xué)專業(yè)方向選擇進行預(yù)測。例如,某學(xué)生N的各門課程成績?yōu)椋簲?shù)值分析=中等,數(shù)學(xué)建模與計算機軟件=優(yōu)秀,數(shù)學(xué)分析一=良好,數(shù)學(xué)分析二=及格,數(shù)學(xué)分析三=中等,數(shù)據(jù)庫原理及應(yīng)用=中等,數(shù)據(jù)結(jié)構(gòu)=及格,離散數(shù)學(xué)=良好,解析幾何=優(yōu)秀,計算機基礎(chǔ)=及格,程序設(shè)計基礎(chǔ)=及格,高等代數(shù)一=良好,高等代數(shù)二=中等,概率統(tǒng)計=良好,復(fù)變函數(shù)=良好,大學(xué)英語=及格,常微分方程=良好;其對軟件方向的興趣度為一般,經(jīng)濟金融方向興趣度為一般。
使用貝葉斯算法計算各屬性的所有取值相對于每個類別的概率結(jié)果如表1所示。
另,P(軟件工程方向)=17/62,P(經(jīng)濟金融方向)=45/62。由上述條件,我們有
根據(jù)上述結(jié)果P(N|軟件工程方向)>P(N|經(jīng)濟金融方向),可以推測該學(xué)生有較大的幾率選擇軟件工程方向,該預(yù)測結(jié)果也于實際情況相一致。
表1 各屬性的條件概率
運用數(shù)據(jù)挖掘中的分類技術(shù),科學(xué)地預(yù)測學(xué)生專業(yè)方向的選擇,將學(xué)生的興趣愛好與專業(yè)知識的掌握程度充分結(jié)合,指導(dǎo)學(xué)生更合理的選擇專業(yè)方向;通過對學(xué)生專業(yè)方向選擇的預(yù)測,可以幫助教學(xué)管理部門做出決策,充分利用教學(xué)資源,避免了資源的浪費。本文只對分類技術(shù)在教學(xué)管理中作了簡單的應(yīng)用,還可以通過對學(xué)生每一學(xué)習(xí)階段的情況進行預(yù)測,指導(dǎo)學(xué)生為專業(yè)方向的選擇早做準備,更有利于學(xué)生的職業(yè)生涯規(guī)劃。
[1]董 倩,王克儉,韓憲忠,苑迎春.基于貝葉斯分類的網(wǎng)上書店潛在用戶挖掘[J].Microcomputer &Its Applications,2011,(1):47-49.
[2]韓家煒.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機械工業(yè)出版社,2000.
[3]王 俊.樸素貝葉斯分類模型的研究與應(yīng)用[D].安徽:合肥工業(yè)大學(xué),2006.
[4]丁智斌,袁 方,董賀偉.數(shù)據(jù)挖掘在高校學(xué)生學(xué)習(xí)成績分析中的應(yīng)用[J].計算機工程與設(shè)計,2006,(4).
TP301
A
1673-1794(2011)05-0124-02
王 與(1984-),女,碩士,主要研究方向為數(shù)據(jù)挖掘。
2011-07-14