教育事業(yè)統(tǒng)計(jì)工作是國(guó)家評(píng)價(jià)教育質(zhì)量、規(guī)劃教育規(guī)模、規(guī)范教育管理的重要依據(jù)之一。數(shù)據(jù)質(zhì)量作為統(tǒng)計(jì)工作的核心,對(duì)數(shù)據(jù)分析和輔助決策具有決定性作用。本文詳述了如何利用信息技術(shù)手段,在離線環(huán)境下通過(guò)本地?cái)?shù)據(jù)引擎實(shí)現(xiàn)學(xué)?;A(chǔ)數(shù)據(jù)到統(tǒng)計(jì)數(shù)據(jù)的全流程轉(zhuǎn)換,最終生成數(shù)據(jù)準(zhǔn)確的中初等教育事業(yè)統(tǒng)計(jì)報(bào)表,在實(shí)際應(yīng)用中發(fā)揮了巨大作用。通過(guò)軟件的開發(fā),經(jīng)過(guò)不斷的探索和研究,筆者積累了一定的經(jīng)驗(yàn),對(duì)于開發(fā)類似項(xiàng)目具有非常重要的參考價(jià)值。
一、工作現(xiàn)狀和存在問題
目前,學(xué)校的教育統(tǒng)計(jì)工作中存在著一些問題,影響了統(tǒng)計(jì)數(shù)據(jù)工作的開展,主要有以下幾個(gè)方面:
一是缺乏專業(yè)的學(xué)校統(tǒng)計(jì)人員。教育統(tǒng)計(jì)工作涉及面廣,數(shù)據(jù)量大,工作周期長(zhǎng),但學(xué)校每年教育統(tǒng)計(jì)工作時(shí)間僅一兩周,因此多數(shù)學(xué)校無(wú)專職統(tǒng)計(jì)人員,對(duì)統(tǒng)計(jì)指標(biāo)也不夠熟悉,在填報(bào)統(tǒng)計(jì)報(bào)表時(shí)存在因理解偏差產(chǎn)生的數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一情況。
二是業(yè)務(wù)素質(zhì)有待進(jìn)一步提升。有些學(xué)校的統(tǒng)計(jì)人員計(jì)算機(jī)操作技能不高,難以處理復(fù)雜的學(xué)生和教職工數(shù)據(jù)。尤其是涉及學(xué)生數(shù)據(jù)的年級(jí)、班級(jí)、年齡等情況,以及教師數(shù)據(jù)的學(xué)歷、職稱、學(xué)科等情況,填報(bào)報(bào)表時(shí)也有因計(jì)算問題造成數(shù)據(jù)錯(cuò)誤的情況發(fā)生。
三是存在數(shù)據(jù)孤島現(xiàn)象。多數(shù)學(xué)校教務(wù)、人事、財(cái)務(wù)等系統(tǒng)獨(dú)立運(yùn)行,數(shù)據(jù)也由不同人員負(fù)責(zé)管理,填報(bào)報(bào)表時(shí)依賴人工匯總。個(gè)別學(xué)校甚至出現(xiàn)數(shù)據(jù)脫節(jié)情況,如學(xué)籍系統(tǒng)中的相關(guān)數(shù)據(jù)與寄宿、資助等各管理部門的數(shù)據(jù)不一致。
通過(guò)調(diào)研還發(fā)現(xiàn),個(gè)別學(xué)校還存在統(tǒng)計(jì)人員更換頻繁、工作設(shè)備陳舊、統(tǒng)計(jì)數(shù)據(jù)原始資料歸檔不規(guī)范,以及數(shù)據(jù)錄入時(shí)因手誤造成數(shù)據(jù)填報(bào)錯(cuò)誤等問題。
為此,我們開發(fā)了教育事業(yè)統(tǒng)計(jì)報(bào)表生成和數(shù)據(jù)核查工具,既可以解決學(xué)校人工填報(bào)過(guò)程中容易出現(xiàn)計(jì)算錯(cuò)誤的問題,也可以解決教育行政部門校驗(yàn)、核對(duì)報(bào)表數(shù)據(jù)量過(guò)大的問題,能夠在較大程度上減少人工整理數(shù)據(jù)的工作,提高數(shù)據(jù)質(zhì)量,優(yōu)化工作效率。
二、功能需求分析
(一)總體功能
數(shù)據(jù)導(dǎo)人。從學(xué)校現(xiàn)有的Excel數(shù)據(jù)表中讀取數(shù)據(jù),導(dǎo)人軟件。數(shù)據(jù)來(lái)源包括統(tǒng)一數(shù)據(jù)和不統(tǒng)一數(shù)據(jù)。統(tǒng)一數(shù)據(jù)是指從現(xiàn)有的信息管理系統(tǒng)導(dǎo)出的數(shù)據(jù),如學(xué)籍管理系統(tǒng)、事業(yè)單位人員管理系統(tǒng)等,這部分?jǐn)?shù)據(jù)有固定的表格格式、規(guī)范的枚舉值,各學(xué)校情況基本相同;不統(tǒng)一數(shù)據(jù)是指各學(xué)校為便于學(xué)校工作,自行設(shè)計(jì)的表格用于學(xué)生、教師等數(shù)據(jù)的管理,這部分?jǐn)?shù)據(jù)各學(xué)校在格式和數(shù)值上均不盡相同,個(gè)別學(xué)??赡艹霈F(xiàn)不規(guī)范的簡(jiǎn)化信息。
數(shù)據(jù)導(dǎo)出。將導(dǎo)入軟件的學(xué)生、教職工數(shù)據(jù)通過(guò)系統(tǒng)計(jì)算轉(zhuǎn)換為教育統(tǒng)計(jì)報(bào)表所需數(shù)據(jù),并導(dǎo)出為符合教育事業(yè)綜合統(tǒng)計(jì)調(diào)查制度規(guī)范格式的Excel表格文件,并且可以導(dǎo)入教育統(tǒng)計(jì)管理信息,減少手工錄入數(shù)據(jù)產(chǎn)生的錯(cuò)誤。
(二)輔助功能
鑒于原始數(shù)據(jù)中可能存在的不統(tǒng)一、不規(guī)范、不一致的問題,軟件設(shè)計(jì)時(shí)還應(yīng)具備以下功能。1.字段識(shí)別。在讀取數(shù)據(jù)的過(guò)程中,能夠查找并識(shí)別字段名稱的關(guān)鍵信息,從相同指標(biāo)不同名稱的字段中提取數(shù)據(jù)導(dǎo)人軟件。通過(guò)字段識(shí)別,解決數(shù)據(jù)不統(tǒng)一的問題。2.數(shù)據(jù)清洗。在讀取數(shù)據(jù)的過(guò)程中,將缺失值、異常值、簡(jiǎn)化值進(jìn)行修改完善,并去除數(shù)據(jù)中的異常字符。通過(guò)數(shù)據(jù)清洗,解決數(shù)據(jù)不規(guī)范的問題。3.數(shù)據(jù)匹配。導(dǎo)入過(guò)程中可以批量進(jìn)行,減少操作步驟。通過(guò)數(shù)據(jù)匹配,解決數(shù)據(jù)不一致的問題。4.數(shù)據(jù)校驗(yàn)。校驗(yàn)中若發(fā)現(xiàn)數(shù)據(jù)存在問題則以表格或報(bào)告的形式反饋給使用者。通過(guò)對(duì)數(shù)據(jù)的校驗(yàn),將校驗(yàn)結(jié)果反饋給用戶進(jìn)行數(shù)據(jù)核實(shí)或修正,避免生成錯(cuò)誤的統(tǒng)計(jì)報(bào)表數(shù)據(jù)。
(三)擴(kuò)展功能
軟件應(yīng)具備生成報(bào)表的擴(kuò)展模塊,若教育事業(yè)綜合統(tǒng)計(jì)調(diào)查制度調(diào)整,統(tǒng)計(jì)報(bào)表發(fā)生變化,可以方便快捷地修訂導(dǎo)出的報(bào)表,也可以根據(jù)管理需求從現(xiàn)有數(shù)據(jù)中生成新的報(bào)表。
(四)運(yùn)行環(huán)境
軟件設(shè)計(jì)為離線單機(jī)運(yùn)行,主要從以下三個(gè)方面考慮。一是易用性,避免配置運(yùn)行環(huán)境,降低軟件使用學(xué)習(xí)成本。二是安全性,減少各部門原始數(shù)據(jù)的共享使用和網(wǎng)絡(luò)傳輸。三是兼容性,確保軟件能夠在陳舊老化的辦公設(shè)備中流暢運(yùn)行。
三、系統(tǒng)總體設(shè)計(jì)
(一)開發(fā)工具
VisualFoxPro(VFP)作為一種傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng),在中小規(guī)模數(shù)據(jù)處理上具備一定優(yōu)勢(shì),不僅具有強(qiáng)大的數(shù)據(jù)管理功能和較高的數(shù)據(jù)處理效率,還可以同時(shí)進(jìn)行Excel數(shù)據(jù)的格式轉(zhuǎn)換。VFP單機(jī)部署方便,無(wú)須安裝.NET框架或Java等軟件環(huán)境,不需要網(wǎng)絡(luò)支持,對(duì)硬件環(huán)境要求不高。
我們分別使用VFP9.0和.NET4.0進(jìn)行軟件開發(fā),實(shí)現(xiàn)數(shù)據(jù)的導(dǎo)入、清洗、校驗(yàn)和導(dǎo)出等功能,并研究對(duì)比兩個(gè)版本的技術(shù)差異和適用方向。
(二)工作流程
根據(jù)功能需求分析,設(shè)計(jì)流程框架如下:
(三)數(shù)據(jù)架構(gòu)
1.統(tǒng)計(jì)報(bào)表。本項(xiàng)目中涉及的中初等教育各階段統(tǒng)計(jì)報(bào)表共有34張,包括班級(jí)情況表5張、學(xué)生情況表15張、教職工情況表14張,報(bào)表數(shù)據(jù)均可由原始數(shù)據(jù)生成,無(wú)須進(jìn)行人工計(jì)算。2.學(xué)校類型。由于中初等教育各階段報(bào)表結(jié)構(gòu)不完全相同,創(chuàng)建學(xué)校類型信息表,包括學(xué)前教育、小學(xué)、初中、普通高中、特殊教育、中等職業(yè)教育等,分別設(shè)置類型代碼對(duì)應(yīng)所需的統(tǒng)計(jì)報(bào)表。3.學(xué)生數(shù)據(jù)表。包括學(xué)生姓名、身份證號(hào)、性別、民族、年級(jí)、班級(jí)、學(xué)段、學(xué)制等字段,用于存放經(jīng)過(guò)清洗和校驗(yàn)的學(xué)生數(shù)據(jù)。4.教職工數(shù)據(jù)表。包括教職工姓名、身份證號(hào)、性別、民族、學(xué)歷、職稱、崗位、任教學(xué)科等字段,用于存放經(jīng)過(guò)清洗和校驗(yàn)的教職工數(shù)據(jù)。
(四)系統(tǒng)實(shí)現(xiàn)
在數(shù)據(jù)處理過(guò)程中,數(shù)據(jù)的導(dǎo)入分為兩步,第一步導(dǎo)入姓名和身份證號(hào),作為人員信息的基礎(chǔ)數(shù)據(jù),導(dǎo)人時(shí)應(yīng)優(yōu)先使用身份證號(hào),以防止人員信息中姓名重復(fù)造成的數(shù)據(jù)錯(cuò)誤;第二步導(dǎo)入其他字段,根據(jù)身份證號(hào)或姓名匹配數(shù)據(jù),用于完善人員信息并生成報(bào)表數(shù)據(jù)。代碼處理流程如下:1.讀取Excel文件。2.定位擬導(dǎo)入數(shù)據(jù)Excel表中“身份證號(hào)\"或“姓名\"字段。3.識(shí)別其他數(shù)據(jù)字段,通過(guò)“身份證號(hào)\"或“姓名\"匹配數(shù)據(jù)并存儲(chǔ)。4.數(shù)據(jù)清洗。已列入清洗規(guī)則的共20個(gè)字段86個(gè)值,通過(guò)對(duì)規(guī)則的持續(xù)更新,可進(jìn)一步提高存儲(chǔ)數(shù)據(jù)的規(guī)范性。5.數(shù)據(jù)校驗(yàn)。已列入校驗(yàn)規(guī)則的16條公式,通過(guò)對(duì)校驗(yàn)公式的持續(xù)更新,可進(jìn)一步提高存儲(chǔ)數(shù)據(jù)的準(zhǔn)確性。6.報(bào)表生成并導(dǎo)出Excel表格。根據(jù)教育統(tǒng)計(jì)管理信息系統(tǒng)數(shù)據(jù)導(dǎo)入規(guī)則,導(dǎo)出的表格均按照單工作表分工作簿存儲(chǔ),便于數(shù)據(jù)導(dǎo)入。
四、結(jié)語(yǔ)
本文完整呈現(xiàn)了單機(jī)環(huán)境下使用信息技術(shù)手段進(jìn)行教育統(tǒng)計(jì)數(shù)據(jù)生成的實(shí)現(xiàn)細(xì)節(jié),編寫的軟件經(jīng)多所學(xué)校實(shí)際數(shù)據(jù)測(cè)試驗(yàn)證,在單機(jī)環(huán)境下可以高速處理基礎(chǔ)數(shù)據(jù)并生成統(tǒng)計(jì)報(bào)表。系統(tǒng)運(yùn)行穩(wěn)定,在陳舊設(shè)備上運(yùn)行操作流暢,環(huán)境適應(yīng)性較強(qiáng),可作為學(xué)校教育統(tǒng)計(jì)信息化的參考方案。
(本文系2024年度河南省基礎(chǔ)教育教學(xué)研究項(xiàng)目一般課題“信息技術(shù)在教育統(tǒng)計(jì)工作中的應(yīng)用研究\"的成果。立項(xiàng)編號(hào):JCJYC2420080023)
(實(shí)習(xí)編輯 王曼琪)