裴文俊
?
大數(shù)據(jù)背景下的上海市中職校報名系統(tǒng)的研究和實踐
裴文俊
摘要:隨著上海市中職校招生工作規(guī)范化要求的推進,通過招生報名數(shù)據(jù)進行政府決策支持的重要性凸顯。隨著報名考試人數(shù)的增加,合理運用大數(shù)據(jù)技術(shù)是一種趨勢。根據(jù)報名系統(tǒng)現(xiàn)狀,從招生報名信息化角度,結(jié)合實踐應(yīng)用,對大數(shù)據(jù)環(huán)境下的報名系統(tǒng)開發(fā)設(shè)計進行了研究和分析。
關(guān)鍵詞:大數(shù)據(jù);中職校;招生報名系統(tǒng)
信息技術(shù)的發(fā)展提高了人們對大容量數(shù)據(jù)存儲、分析、查詢和使用的能力,伴隨著物聯(lián)網(wǎng)和云計算等技術(shù)的廣泛應(yīng)用,數(shù)據(jù)的種類不斷擴大,數(shù)據(jù)的“量”從KB發(fā)展到了ZB, 質(zhì)量不斷提高。社會各個領(lǐng)域數(shù)據(jù)的快速積累,推動了大數(shù)據(jù)時代的來臨,只有對大數(shù)據(jù)進行全面的利用,才能充分發(fā)揮它的技術(shù)價值。美國蘋果公司為了在硅谷開設(shè)店面,也要用大數(shù)據(jù)工具進行慎重分析后才拍板??梢?,數(shù)據(jù)就是生產(chǎn)資料,弄清了數(shù)據(jù)就能促進目標(biāo)又快又好地實現(xiàn)。
2008年起,上海市開展了部分中等職業(yè)學(xué)校試行自主招收在滬農(nóng)民工同住子女工作,隨著招生學(xué)校、招生計劃和招生類型的不斷擴大和提高。2013年12月上海市人民政府發(fā)布了《關(guān)于來滬人員隨遷子女就讀本市各級各類學(xué)校的實施意見》,2014年上海市教育委員會明確了中職校招收隨遷子女的報名條件,教育行政部門同時希望對非滬籍進城務(wù)工人員子女在滬就學(xué)的報名信息審查的基礎(chǔ)上,科學(xué)分析流動人口子女的相關(guān)情況后作出教育資源配置的正確決策。原有的僅以采集信息和報名數(shù)據(jù)為主的報名方式,多依賴于工作者經(jīng)驗和匯總統(tǒng)計下級數(shù)據(jù)而成。
原有的報名方式不適應(yīng)決策支持的需要,因此,利用大數(shù)據(jù)推進招生報名系統(tǒng)建設(shè)、開展數(shù)據(jù)處理和分析,從而提高招生錄取工作的管理水平勢在必行?;诖髷?shù)據(jù)的數(shù)據(jù)挖掘,提供準(zhǔn)確的決策支持?jǐn)?shù)據(jù)為政府決策,對于促進教育公平、社會和諧穩(wěn)定發(fā)展、提升城市整體素質(zhì),具有重要的現(xiàn)實意義。
綜上所述,大數(shù)據(jù)技術(shù)的發(fā)展是教育招生考試發(fā)展的重大挑戰(zhàn)和機遇,利用大數(shù)據(jù)改革現(xiàn)在的決策模式,提高隨遷子女招生報名的效率,推進中職校招收隨遷子女工作的科學(xué)性,具有非常重要的現(xiàn)實意義。
1.1中職校招收隨遷子女報名人數(shù)基本情況
上海市中職校實施招收在滬進城務(wù)工人員隨遷子女,自實施以來的招生計劃和報名人數(shù)的變化情況,如圖1所示:
圖1 2008-2013上海市中職校招收隨遷子女計劃數(shù)和報名人數(shù)比較單位:人
隨著招生計劃和報名人數(shù)的增長,以每名考生關(guān)聯(lián)1名家長的信息數(shù)據(jù),再結(jié)合考生照片和證件復(fù)印件等佐證材料計算,數(shù)據(jù)量將成倍增長,這些數(shù)據(jù)聚合在一起的數(shù)據(jù)量是非常大的。但目前這些數(shù)據(jù)還靜靜地躺在報名數(shù)據(jù)庫中,僅用于日常管理工作,管理者還沒有充分發(fā)現(xiàn)報名數(shù)據(jù)資源的利用價值。實際上,通過大數(shù)據(jù)技術(shù)的信息系統(tǒng),對這些數(shù)據(jù)的整合、分析和利用,獲取有用數(shù)據(jù),研究分析事物的相關(guān)性和預(yù)測事物的發(fā)展,結(jié)合現(xiàn)實社會中的其他數(shù)據(jù),相互補充,提高報名政策制定的有效性和前瞻性是非常有意義的。
1.2中職校招收隨遷子女的報名系統(tǒng)情況
上海市中職校招收隨遷子女的報名系統(tǒng)經(jīng)歷了從無到有,從本地化到網(wǎng)絡(luò)化的變遷,如表1所示:
表1 上海市中職校招收隨遷子女報名系統(tǒng)變化
可見,上海市中職校招收隨遷子女的報名系統(tǒng)還停留在為解決業(yè)務(wù)工作而設(shè)計開發(fā)的層面,采用最簡單的數(shù)據(jù)庫技術(shù),對招生考試的報名數(shù)據(jù)進行獲取、分析、處理、存儲和檢索。目前的報名系統(tǒng)并未實現(xiàn)從大量復(fù)雜的數(shù)據(jù)中獲取有意義的相關(guān)性,并找出規(guī)律,指導(dǎo)招生考試的科學(xué)管理。
此外,即使有獨立的報名系統(tǒng),還存在與招生考試和錄取的其他環(huán)節(jié)信息不共享,數(shù)據(jù)重復(fù)采集等問題。各時期的報名系統(tǒng)的比較如表2所示:
表2 上海市中職校招收隨遷子女報名系統(tǒng)各階段功能比較
1.3 中職校招收隨遷子女的報名系統(tǒng)存在問題
隨著招生人數(shù)不斷增長,異地中高考方案的最終落地和城市發(fā)展帶來的人口遷移,上海市普通全日制中等職業(yè)學(xué)校招收在滬進城務(wù)工人員隨遷子女的報考人數(shù)增加,必將是大勢所趨。
然而,目前報名系統(tǒng)在大規(guī)模的招生考試數(shù)據(jù)面前,缺乏從數(shù)據(jù)中獲取信息的能力,沒有針對指導(dǎo)決策支持而進行的特定應(yīng)用分析,表面上數(shù)據(jù)量大,實際上信息含量不高,主要存在以下問題:
(1)信息孤島現(xiàn)象:報名數(shù)據(jù)在考務(wù)和錄取等環(huán)節(jié)需要與各個系統(tǒng)通過另外接口交換,信息不易共享,形成信息孤島和信息流失。在數(shù)據(jù)利用上,各系統(tǒng)相互獨立,存在功能重復(fù)開發(fā)。
(2)數(shù)據(jù)采集類型單一:目前報名系統(tǒng)僅僅采集姓名、性別、家庭住址和父母姓名職業(yè)等文字類型數(shù)據(jù),數(shù)據(jù)種類單一化,與招生考試其他系統(tǒng)的數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一,數(shù)據(jù)交換復(fù)雜而低效。
(3)后續(xù)開發(fā)利用欠缺:面對海量的數(shù)據(jù),現(xiàn)在的開發(fā)技術(shù)還停留在簡單的統(tǒng)計和報表,沒有進行深入挖掘,缺乏深層次的內(nèi)因分析和規(guī)劃,因而不能體現(xiàn)招生考試的價值和考試導(dǎo)向功能。
2.1大數(shù)據(jù)的概念和特點
根據(jù)維基百科中的大數(shù)據(jù)定義,大數(shù)據(jù)是指利用常用軟件工具來獲取、管理和處理數(shù)據(jù)所耗時間超過可容忍時間的數(shù)據(jù)集[1]。同時,參考研究機構(gòu)Gartner的描述,大數(shù)據(jù)是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)[2]。所以,如果僅從數(shù)據(jù)量或類型等某一個方面描述大數(shù)據(jù)都是不夠準(zhǔn)確的,大數(shù)據(jù)是一個綜合的概念,大數(shù)據(jù)應(yīng)當(dāng)是達到一定數(shù)據(jù)規(guī)模,并且數(shù)據(jù)類型繁多和復(fù)雜的數(shù)據(jù)集,它同時具備快速反應(yīng)客觀情況、能被用于數(shù)據(jù)分析和處理,最終獲得有價值信息能力的有用數(shù)據(jù)。
因此,大數(shù)據(jù)應(yīng)該具有以下的特點:
(1)量大類型多:大數(shù)據(jù)首先應(yīng)當(dāng)是數(shù)據(jù)體量上要達到一定的規(guī)模,數(shù)據(jù)的單位和維度也越來越多,隨著互聯(lián)網(wǎng)和數(shù)據(jù)庫技術(shù)的發(fā)展,各種系統(tǒng)的數(shù)據(jù)積累后形成的數(shù)據(jù)集。其次這種數(shù)據(jù)不應(yīng)是平面化、簡單化的,傳統(tǒng)意義上的結(jié)構(gòu)化數(shù)據(jù),而應(yīng)是立體的,包括文字、圖片,甚至音頻視頻等大量非結(jié)構(gòu)化的數(shù)據(jù)。
(2)價高反應(yīng)快:大數(shù)據(jù)不是簡單地大量數(shù)據(jù)堆積,不是靜止不動的,那是沒有意義的,而是具有內(nèi)在信息價值的數(shù)據(jù)。對每一條數(shù)據(jù)歸納、抽象和分析等及時有效處理后,都能獲得有意義的價值線索和規(guī)律。同時這種價值反饋的相應(yīng)時間應(yīng)該是快速和實時的。
2.2數(shù)據(jù)挖掘的概念和作用
就招生考試報名而言,數(shù)據(jù)量取決于考生數(shù)量和采集信息字段的數(shù)量和類型,相應(yīng)的深度數(shù)據(jù)分析技術(shù)可以利用數(shù)據(jù)挖掘技術(shù)。數(shù)據(jù)挖掘技術(shù)是一種獨立的利用信息技術(shù)進行數(shù)據(jù)分析的方法。它包括通過對數(shù)據(jù)倉庫中的數(shù)據(jù)進行分析,獲得有用知識和信息的一系列方法和技術(shù)。
數(shù)據(jù)挖掘就是從大量有噪聲的、模糊的或者隨機的數(shù)據(jù)中提取隱含的、先前未知的、對決策有潛在價值的知識和規(guī)則,并能夠根據(jù)已有的信息對未發(fā)生行為做出結(jié)果預(yù)測,為決策提供依據(jù)[3]。
數(shù)據(jù)挖掘為從數(shù)據(jù)中隱含的未知的潛在的和有用的信息中進行的不平凡的提取過程[4]。目的是將大量的數(shù)據(jù)轉(zhuǎn)化為有利于各種類型使用者的信息。如果在中職校招收隨遷子女報名系統(tǒng)中使用基于大數(shù)據(jù)技術(shù)的數(shù)據(jù)挖掘,能預(yù)期以下收獲:
(1)確定進城務(wù)工人員從事的行業(yè)信息、居住區(qū)域信息、收入稅收等信息;
(2)預(yù)測招生中職校學(xué)校的人數(shù);
(3)支持與考試錄取系統(tǒng)的數(shù)據(jù)自動對接;
(4)便于構(gòu)建學(xué)生檔案;
(5)使決策者掌握更多務(wù)工人員、隨遷子女和學(xué)校專業(yè)的發(fā)展趨勢。
2.3基于大數(shù)據(jù)的隨遷子女報名的數(shù)據(jù)分析
隨著隨遷子女報考數(shù)量的增加,隨遷子女招生與中考招生報名系統(tǒng)合并,隨遷子女?dāng)?shù)據(jù)、中招報名數(shù)據(jù)、父母數(shù)據(jù)和考試科目數(shù)據(jù)等各個系統(tǒng)產(chǎn)生的數(shù)據(jù)聚合,必將產(chǎn)生海量的數(shù)據(jù)。同時,現(xiàn)代招生報名過程中要求采集字段的多樣化,除了文字信息外,還有考生照片和佐證材料等。數(shù)據(jù)類型一定會足夠豐富,隨遷子女報考中職校所引起的數(shù)據(jù)量必將形成大數(shù)據(jù)格局。
同時,如果當(dāng)隨遷子女報考中職校過程中發(fā)生群體性等特殊事件,若運行中報名系統(tǒng)足夠敏感,具有很強的數(shù)據(jù)分析能力,就能根據(jù)數(shù)據(jù)變化及時反應(yīng)出問題并呈現(xiàn)給決策者,決策者可以及時發(fā)現(xiàn)問題從而解決問題,保證招生報名的平穩(wěn)運行。
顯然,以大數(shù)據(jù)為基礎(chǔ),結(jié)合數(shù)據(jù)挖掘技術(shù)為工具的招生報名系統(tǒng),能夠及時評估報名的發(fā)展趨勢,跟蹤實時變化,分析報名的動向,從而協(xié)助招生報名管理機構(gòu)搞好報名工作。
3.1報名系統(tǒng)模型設(shè)計
依據(jù)大數(shù)據(jù)的特點和中職校招收隨遷子女報名工作的實際,報名系統(tǒng)可分為數(shù)據(jù)收集系統(tǒng)、數(shù)據(jù)處理系統(tǒng)和數(shù)據(jù)應(yīng)用系統(tǒng),如圖2所示:
圖2 報名系統(tǒng)模型圖
3.2 報名系統(tǒng)功能分析
報名系統(tǒng)的準(zhǔn)備工作就是制定考生報名信息標(biāo)準(zhǔn)、各字段的標(biāo)準(zhǔn)字典碼庫。因為只有對數(shù)據(jù)進行統(tǒng)一和整合,才能實現(xiàn)數(shù)據(jù)共享,真正實現(xiàn)數(shù)據(jù)的整合、分析和利用。一般報名數(shù)據(jù)信息標(biāo)準(zhǔn)包含以下內(nèi)容。
字段名 類型 長度 說明主鍵設(shè)置導(dǎo)入方式校驗信息其他備注
標(biāo)準(zhǔn)字典碼庫內(nèi)容包括:證件類型代碼、省市代碼、考生類別代碼、區(qū)縣代碼、民族代碼和學(xué)校代碼等。
獲得大量基礎(chǔ)數(shù)據(jù)后,完善的報名系統(tǒng)框架構(gòu)建是提升報名系統(tǒng)價值的關(guān)鍵。大數(shù)據(jù)下的報名系統(tǒng)不能僅僅為了完成基本業(yè)務(wù)工作,應(yīng)當(dāng)從新技術(shù)的視野出發(fā),進行整體構(gòu)建,目標(biāo)是從報名系統(tǒng)中獲得有價值信息。報名系統(tǒng)基本設(shè)計如表3所示:
表3 報名子系統(tǒng)功能介紹
4.1功能模塊設(shè)計
根據(jù)上文的模型思路,結(jié)合目前隨遷子女招生管理實際,報名系統(tǒng)框架模型如圖3所示:
圖3 報名系統(tǒng)框架模型圖
4.2業(yè)務(wù)流程分析
根據(jù)上海市中職校招收隨遷子女的報名規(guī)定,用戶主要涉及考生、報名點管理人員、區(qū)縣和市級招生管理人員。市級招生管理人員主要是配置報名參數(shù),如招生學(xué)校、專業(yè)、采集信息字段、上傳文件格式大小和報名時間等;報名點管理人員和區(qū)縣管理人員主要是指導(dǎo)考生報名和驗證審核相關(guān)報名資料;考生按規(guī)定時間登錄網(wǎng)站進行報名和輸入相關(guān)信息。報名過程中管理人員可以查看報名人數(shù)、報名情況和統(tǒng)計情況等,考生可以查看和修改本人信息,查看審核結(jié)果等??紤]報名系統(tǒng)的實際工作要求和外系統(tǒng)的相關(guān)聯(lián)系,設(shè)計流程圖如圖4所示:
圖4 中職校招收隨遷子女報名流程圖
4.3基于大數(shù)據(jù)的隨遷子女報名系統(tǒng)開發(fā)實踐
2014年上海市教育委員發(fā)布了《關(guān)于做好2014年全日制普通中等職業(yè)學(xué)自主招收進城務(wù)工人員隨遷子女報名工作的通知》,首次明確了進城務(wù)工人員報考隨遷子女需要“上海市居住證”或“靈活就業(yè)居住證+臨時居住證”的招生模式。決策者們希望通過報名,掌握務(wù)工人員的群體的基本特征信息,以便作為制定和調(diào)整隨遷子女報考政策的參考依據(jù),所以筆者在規(guī)劃設(shè)計2014年上海市全日制普通中等職業(yè)學(xué)校自主招收進城務(wù)工人員隨遷子女信息管理系統(tǒng)時,嘗試運用大數(shù)據(jù)技術(shù)和數(shù)據(jù)挖掘技術(shù),對數(shù)據(jù)采集進行了整理,重新設(shè)計了報名系統(tǒng)等,如圖5、圖6所示:
圖5 2014年上海市中職校招收隨遷子女報名系統(tǒng)登錄界面
圖6 2014年上海市中職校招收隨遷子女報名模塊界面
在2014年的系統(tǒng)設(shè)計中,同時對進城務(wù)工人員的分布情況、持證情況和行業(yè)分類做了數(shù)據(jù)分析的探索,一共進行了12項數(shù)據(jù)分析比較,如表4所示:
表4 2014年上海市中職校招收隨遷子女報名系統(tǒng)數(shù)據(jù)分析項目
當(dāng)報名系統(tǒng)獲得基礎(chǔ)數(shù)據(jù)后,可以綜合運用數(shù)據(jù)挖掘技術(shù)進行相關(guān)分析。如運用關(guān)聯(lián)規(guī)則的Apriori算法,可以分析出父母是某個行業(yè)的,與隨遷子女考生報考的學(xué)校和專業(yè)的關(guān)聯(lián)性;再如報考了某學(xué)校的A專業(yè)的考生會同時報考B專業(yè)的可能性,這些既能幫助考生正確選擇志愿,又能幫助學(xué)校進行招生專業(yè)規(guī)劃。以最簡單的數(shù)據(jù)挖掘方法—分類分析法為例,分析父母持證情況,如表5所示:
表5 2014年上海市中職校招收隨遷子女報名系統(tǒng)父母持證情況表
當(dāng)報名結(jié)束后,決策者可以方便地從上表中得出本市進城務(wù)工人員的基本行業(yè)分布,外來人群的社會保險繳費比例(就業(yè)類居住證有繳費要求),務(wù)工人員的在滬穩(wěn)定性(根據(jù)簽注年限)等信息。基于這些信息,城市管理者可以制定人口調(diào)節(jié)政策,各行業(yè)主管部門可以調(diào)整相應(yīng)管理政策,教育決策者能制定年度招生計劃,合理配置各種教育資源。
準(zhǔn)確的數(shù)據(jù)是政府進行正確決策的依據(jù),利用大數(shù)據(jù)建立的隨遷子女報名系統(tǒng)具有以下功能:
(1)有利于隨遷子女招生工作。深入研究報名數(shù)據(jù)中規(guī)律,結(jié)合已有的經(jīng)驗,能夠提高招生考試的信息化建設(shè),和招生考試工作的效率。
(2)有利于隨遷子女教育決策。對報名數(shù)據(jù)的開發(fā)和利用,可以輔助決策者及時制定和調(diào)整決策。
(3)有利于社會穩(wěn)定。以科學(xué)準(zhǔn)確的數(shù)據(jù)為支撐的隨遷子女招生政策,可以獲得進城務(wù)工人員的認(rèn)同,使他們能安心地為上海建設(shè)做出他們的貢獻。
信息化技術(shù)的高速發(fā)展,大數(shù)據(jù)一定會對招生考試報名系統(tǒng)帶來巨大的影響,管理部門應(yīng)當(dāng)以此為契機,不能再簡單地用經(jīng)驗做決策,應(yīng)當(dāng)建立基于大數(shù)據(jù)的,能及時、準(zhǔn)確地反應(yīng)客觀情況的報名系統(tǒng),實現(xiàn)招生考試的現(xiàn)代化和科學(xué)化。
參考文獻
[1] 馬建光,姜巍.大數(shù)據(jù)的概念、特征及其應(yīng)用[J].國防科技,2013,34(2):10-17.
[2] 林偉勝,許卓偉.大數(shù)據(jù)時代信息系統(tǒng)建設(shè)的一些思考[J].信息與電腦,2013,01.
[3] 裴文俊.基于大規(guī)模學(xué)業(yè)考試服務(wù)平臺的決策支持系統(tǒng)研究[J]招生考試研究,2014.
[4] 郭茹.數(shù)據(jù)挖掘技術(shù)在教育領(lǐng)域的應(yīng)用[J].科技和產(chǎn)業(yè),2014,9:121-124.
收稿日期:(2015.04.09)
作者簡介:裴文?。?977-),男,上海市工商外國語學(xué)校,高級工程師,研究方向:數(shù)據(jù)庫應(yīng)用、數(shù)據(jù)挖掘和決策支持,上海,200231
文章編號:1007-757X(2015)12-0047-04
中圖分類號:TP39
文獻標(biāo)志碼:A