李書翔 趙?;? 陳曉
摘要:現(xiàn)有的家庭經(jīng)濟(jì)困難學(xué)生認(rèn)定方法都不可避免的出現(xiàn)主觀性、片面性的問題,造成認(rèn)定結(jié)果的不準(zhǔn)確。文章通過探討數(shù)據(jù)挖掘技術(shù)在家庭經(jīng)濟(jì)困難學(xué)生認(rèn)定中的可行性,構(gòu)建理論模型,將數(shù)據(jù)挖掘技術(shù)運(yùn)用于家庭經(jīng)濟(jì)困難學(xué)生認(rèn)定過程。
關(guān)鍵詞:家庭經(jīng)濟(jì)困難認(rèn)定;數(shù)據(jù)挖掘;理論模型
中圖分類號:TP391文獻(xiàn)標(biāo)志碼:A文章編號:2095-9214(2016)10-0293-01
一、問題提出
根據(jù)國家統(tǒng)計局?jǐn)?shù)據(jù),2015年,全國高校在校學(xué)生人數(shù)超過2600萬人,教育部2016年8月新聞發(fā)布會公布數(shù)據(jù)顯示,2015年,全國高等學(xué)校國家助學(xué)金受助學(xué)生達(dá)到1073萬人次,由此可見,2015年全國高校在校家庭經(jīng)濟(jì)困難學(xué)生比例已超過40%,這僅僅是得到認(rèn)定的家庭經(jīng)濟(jì)困難學(xué)生,而家庭經(jīng)濟(jì)困難學(xué)生申請人數(shù)遠(yuǎn)遠(yuǎn)高于這一比例。面對數(shù)量如此龐大的家庭經(jīng)濟(jì)困難學(xué)生群體,如何精確的確定學(xué)生家庭經(jīng)濟(jì)困難等級這一問題是做好大學(xué)生精準(zhǔn)扶貧的先決條件,同時提高學(xué)生資助工作的效率和效益。
二、現(xiàn)有家庭經(jīng)濟(jì)困難學(xué)生認(rèn)定方法述評
2007年,教育部、財政部聯(lián)合下發(fā)《關(guān)于認(rèn)真做好家庭經(jīng)濟(jì)困難學(xué)生認(rèn)定工作的指導(dǎo)意見》,對于家庭經(jīng)濟(jì)困難學(xué)生的認(rèn)定工作進(jìn)行了規(guī)范。各高校根據(jù)學(xué)校、學(xué)生特點(diǎn)發(fā)展出一系列的困難生認(rèn)定辦法,這些辦法主要有:
1.民主評議法。學(xué)生填寫《高等學(xué)校學(xué)生及家庭情況調(diào)查表》、《高等學(xué)校家庭經(jīng)濟(jì)困難學(xué)生認(rèn)定申請表》;學(xué)校成立各級困難生認(rèn)定小組,根據(jù)學(xué)生條件及在校期間日常消費(fèi)行為等情況進(jìn)行評議,形成學(xué)生是否困難以及困難等級的初步結(jié)果;初評結(jié)果經(jīng)公示與學(xué)校再評之后確定學(xué)生困難等級并進(jìn)行資助;認(rèn)定結(jié)果半年之后再進(jìn)行復(fù)查,最終確定本學(xué)年家庭經(jīng)濟(jì)困難學(xué)生名單。
民主評議的結(jié)果存在主觀性太強(qiáng)的問題,認(rèn)定結(jié)果很難做到公平、公正。主要因?yàn)椋阂皇菍W(xué)生由于趨利思想,提供的《家庭經(jīng)濟(jì)調(diào)查表》存在主觀性較強(qiáng),信息不準(zhǔn)確的問題;二是認(rèn)定小組的成員無法保證對全部申請者全面了解,在認(rèn)定過程中也存在主觀臆測等問題。
2.條件匹配法。不少學(xué)校意識到民主評議法存在的問題,逐漸通過歸納家庭經(jīng)濟(jì)困難學(xué)生特點(diǎn)并用學(xué)生的具體情況進(jìn)行匹配的辦法完善認(rèn)定過程,主要有以下幾種[1]:(1)通過學(xué)生“一卡通”系統(tǒng)等信息歸納一定的標(biāo)準(zhǔn)來判定學(xué)生家庭經(jīng)濟(jì)情況;(2)根據(jù)高校所在地最低生活保障線,學(xué)生消費(fèi)低于該水平則認(rèn)定為困難生;(3)設(shè)定一些特定指標(biāo),根據(jù)學(xué)生滿足指標(biāo)的數(shù)量確定其家庭經(jīng)濟(jì)困難程度。
條件匹配法能夠從一定程度上解決認(rèn)定過程中的主觀性問題,但是以上的方法都存在指標(biāo)體系不明確、指標(biāo)不全面、缺乏統(tǒng)一標(biāo)準(zhǔn)、認(rèn)定標(biāo)準(zhǔn)過于單一沒有可比性、操作不規(guī)范主觀色彩濃重等特點(diǎn)。這種辦法可以確定學(xué)生的家庭經(jīng)濟(jì)是否困難,但是無法更進(jìn)一步的確定其家庭經(jīng)濟(jì)困難程度。
3.指標(biāo)打分法。近年來,山東省內(nèi)部分高校逐步推行指標(biāo)打分法:建立起綜合評價家庭經(jīng)濟(jì)困難程度指標(biāo)體系,架構(gòu)困難生認(rèn)定系統(tǒng)。學(xué)生根據(jù)自身情況填寫調(diào)查問卷,系統(tǒng)根據(jù)學(xué)生填寫情況自動得出學(xué)生評分,全體申請學(xué)生根據(jù)這一評分綜合排序,從而確定家庭經(jīng)濟(jì)困難程度,依次開展學(xué)生資助。
這種方式同時結(jié)合了定性與定量,相對來說更加客觀合理。但是,也存在填寫系統(tǒng)過程中存在主觀、趨利等現(xiàn)象。
困難生認(rèn)定經(jīng)過了從定性到定量的持續(xù)發(fā)展過程,困難生認(rèn)定的科學(xué)性、客觀性逐步加強(qiáng)。面對大量的家庭經(jīng)濟(jì)困難學(xué)生信息,提高認(rèn)定的準(zhǔn)確性需要長期的探索。
三、數(shù)據(jù)挖掘技術(shù)在家庭經(jīng)濟(jì)困難學(xué)生認(rèn)定中的可行性分析
《高等學(xué)校學(xué)生及家庭情況調(diào)查表》中所調(diào)查的學(xué)生信息量十分大,加之還要綜合考慮學(xué)生在校期間具體消費(fèi)情況,因此一個學(xué)生所對應(yīng)的信息最多達(dá)到上百條。以一個三百人的年級為例,學(xué)生按照40%的比例申請認(rèn)定,一個年級困難生認(rèn)定所涉及到的數(shù)據(jù)就達(dá)到上萬條,以此類推,一個體量為三萬人學(xué)校面臨的困難生認(rèn)定的信息將數(shù)以百萬計。面對如此龐大的數(shù)據(jù)量,目前的應(yīng)用還停留在簡單的備份、查詢、統(tǒng)計階段,可以說是“數(shù)據(jù)豐富、知識匱乏”。
在海量數(shù)據(jù)背景下綜合考慮家庭經(jīng)濟(jì)困難學(xué)生各項指標(biāo),減少評價過程中的主觀因素,并進(jìn)一步的提取出有用的規(guī)則和相關(guān)的知識。基于此,我們引入數(shù)據(jù)挖掘技術(shù)。數(shù)據(jù)挖掘是指從看似無規(guī)律的大量數(shù)據(jù)中自動搜索隱藏于其中的有著特殊關(guān)系性的信息的過程,他通過分析海量數(shù)據(jù)的每一條信息并從中尋找某種規(guī)律、關(guān)聯(lián)或者結(jié)論。數(shù)據(jù)挖掘技術(shù)應(yīng)用于家庭經(jīng)濟(jì)困難學(xué)生認(rèn)定過程的可行性如下:首先,家庭經(jīng)濟(jì)困難學(xué)生數(shù)據(jù)庫儲存的海量數(shù)據(jù)為數(shù)據(jù)挖掘提供了“原材料”支持;其次,數(shù)據(jù)挖掘技術(shù)強(qiáng)調(diào)技術(shù)的發(fā)現(xiàn)與提取過程,側(cè)重于從全部數(shù)據(jù)中尋找有用的知識,這就避免了以往認(rèn)定過程中有側(cè)重的虛報個人信息的行為,盡量做到客觀、全面;最后,隨著研究的深入,數(shù)據(jù)挖掘技術(shù)也愈加豐富,為分析海量困難生數(shù)據(jù)提供了技術(shù)支持。
四、數(shù)據(jù)挖掘技術(shù)在家庭經(jīng)濟(jì)困難學(xué)生認(rèn)定中的應(yīng)用探索
數(shù)據(jù)挖掘應(yīng)用于家庭經(jīng)濟(jì)困難學(xué)生認(rèn)定過程的路徑如下:對已經(jīng)評價的貧困生數(shù)據(jù)進(jìn)行分類,找出與貧困生類別相關(guān)的貧困因素,再對未知類別的貧困生做出預(yù)測,結(jié)果與原有結(jié)果比較,檢測模型效果,完成挖掘任務(wù)。最后提取規(guī)則應(yīng)用于家庭經(jīng)濟(jì)困難的評價和管理工作。建立如圖1的完整的基于數(shù)據(jù)挖掘技術(shù)的家庭經(jīng)濟(jì)困難學(xué)生認(rèn)定系統(tǒng)。
1.家庭經(jīng)濟(jì)困難學(xué)生信息庫。該信息庫基于高校每年通過認(rèn)定的家庭經(jīng)濟(jì)困難學(xué)生數(shù)據(jù)建立,涵蓋學(xué)生個人及家庭的全部信息。
2.數(shù)據(jù)處理子系統(tǒng)。通過一定的數(shù)據(jù)清洗與預(yù)處理的手段,將信息庫中的數(shù)據(jù)調(diào)整為能夠被數(shù)據(jù)挖掘子系統(tǒng)使用的標(biāo)準(zhǔn)數(shù)據(jù)集。這個過程主要包括數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)變換、數(shù)據(jù)規(guī)約等幾個方面。
3.數(shù)據(jù)挖掘子系統(tǒng)。接著利用數(shù)據(jù)挖掘算法構(gòu)建貧困生評價模型,對貧困生進(jìn)行分類。如果得到的模型不能滿足要求,需要返回前面的步驟,考慮算法的選擇、數(shù)據(jù)的預(yù)處理結(jié)果是否需要調(diào)整,經(jīng)過調(diào)優(yōu)得到較優(yōu)模型[1]。由于家庭經(jīng)濟(jì)困難學(xué)生的認(rèn)定主要涉及分類與預(yù)測的問題,常用于這些問題的算法有貝葉斯網(wǎng)絡(luò)、決策樹、META等。
4.學(xué)生分類與學(xué)生資助子系統(tǒng)。這兩個系統(tǒng)是對家庭經(jīng)濟(jì)困難學(xué)生認(rèn)定結(jié)果的應(yīng)用。學(xué)生資助子系統(tǒng)的結(jié)果可以返回到學(xué)生信息庫中,為下一次的數(shù)據(jù)挖掘提供數(shù)據(jù)支持。
(作者單位:濟(jì)南大學(xué)外國語學(xué)院學(xué)生工作辦公室)
參考文獻(xiàn):
[1]楊知玲.數(shù)據(jù)挖掘在高校貧困生評價中的應(yīng)用研究[D].華南理工大學(xué), 2015