文/齊鳳林 高珺 張凱
根據(jù)教育部關(guān)于高等教育質(zhì)量監(jiān)測國家數(shù)據(jù)平臺數(shù)據(jù)填報工作部署,高校每年開展教育質(zhì)量監(jiān)測數(shù)據(jù)采集填報工作。采集數(shù)據(jù)根據(jù)獲取方式不同分為兩類,一類是信息系統(tǒng)已有的數(shù)據(jù),通過數(shù)據(jù)同步自動獲??;另一類游離在系統(tǒng)之外,需要進行集中采集,最終將這兩類數(shù)據(jù)拼接在一起,形成完整的符合“高等教育質(zhì)量監(jiān)測國家數(shù)據(jù)平臺”(以下簡稱“國家數(shù)據(jù)平臺”)錄入要求的數(shù)據(jù)集。這些數(shù)據(jù)為本科教學(xué)評估、專業(yè)認(rèn)證等業(yè)務(wù)提供數(shù)據(jù)支撐服務(wù)。因此,各高校非常重視數(shù)據(jù)的采集質(zhì)量,尤其是數(shù)據(jù)的客觀真實性、準(zhǔn)確性和及時性。復(fù)旦大學(xué)在數(shù)據(jù)采集填報中,由復(fù)旦大學(xué)本科生院牽頭,校園信息化辦公室提供技術(shù)支持,成立數(shù)據(jù)采集小組,統(tǒng)籌相關(guān)工作。
圖1展示了傳統(tǒng)的高校數(shù)據(jù)采集模式。在分發(fā)過程(1)中,數(shù)據(jù)采集小組將需要填寫的表格分發(fā)給院系部門。院系部門完成數(shù)據(jù)收集后,將結(jié)果反饋(2)給數(shù)據(jù)采集小組。若采集小組審核錄入時發(fā)現(xiàn)錯誤,則再次反饋給院系部門對問題數(shù)據(jù)進行調(diào)整(3)。
整個采集過程可能存在以下三個問題。
若院系部門誤填或漏填數(shù)據(jù),需要重新執(zhí)行過程(3),就會再現(xiàn)“(2),(3)”之間多次調(diào)整數(shù)據(jù)的過程。由于數(shù)據(jù)采集工作涉及院系部門較多,這種反復(fù)確認(rèn)拖延了整個采集時間,降低數(shù)據(jù)采集效率。
圖 1 傳統(tǒng)數(shù)據(jù)采集模式
傳統(tǒng)的數(shù)據(jù)采集模式中,院系部門收到的表格一般是只有列名的空白表格。院系部門需要人工填寫每一個字段信息,無疑增大了數(shù)據(jù)填寫的錯誤率,也會導(dǎo)致格式不統(tǒng)一,影響采集過程。
院系部門按照表格模板填寫內(nèi)容,實際填寫的內(nèi)容可能會和業(yè)務(wù)部門規(guī)定的統(tǒng)計口徑不一致。例如在采集課程信息時,院系填寫的實際授課情況與教務(wù)處掌握的課程信息之間可能存在出入。
上述問題都會降低數(shù)據(jù)采集效率,影響數(shù)據(jù)采集的結(jié)果,達不到精準(zhǔn)、高效采集數(shù)據(jù)的目的,使教學(xué)評估的數(shù)據(jù)采集工作流于形式。
復(fù)旦大學(xué)網(wǎng)上辦事服務(wù)大廳(eHall)自2015年9月正式上線以來,逐漸實現(xiàn)從業(yè)務(wù)服務(wù)向數(shù)據(jù)服務(wù)的轉(zhuǎn)型。一表通平臺作為eHall中一個關(guān)鍵子系統(tǒng),目的是減少用戶紙質(zhì)填表業(yè)務(wù)量。數(shù)據(jù)采集工作本質(zhì)上是各院系部門的填表工作。一表通平臺針對傳統(tǒng)數(shù)據(jù)采集模式存在的問題,重塑數(shù)據(jù)采集流程。圖2展示了一表通平臺數(shù)據(jù)采集模式。其中,數(shù)據(jù)采集小組和院系部門直接和一表通平臺交互。
圖 2 一表通平臺數(shù)據(jù)采集模式
根據(jù)數(shù)據(jù)提供主體的不同,將《高等教育質(zhì)量監(jiān)測國家數(shù)據(jù)平臺數(shù)據(jù)填報指南》(以下簡稱“填報指南”)中的表分為兩類。
1.單個業(yè)務(wù)部門即可填寫的表單
如表1“校區(qū)及地址”只需要學(xué)校辦公室填寫即可,此類表格的數(shù)據(jù)采集相對簡單。
表1 填報指南“校區(qū)及地址”
2.需要多個校內(nèi)單位共同完成的表單
如表2“專業(yè)核心課程情況”,教務(wù)處可以提供前幾項內(nèi)容的權(quán)威信息,后三項關(guān)于教學(xué)學(xué)時的信息只有院系可以精確提供。
表2 填報指南“專業(yè)核心課程情況(學(xué)年)”
本文討論的采集工作主要針對此類表單。
為方便設(shè)計模板表格,將所有待采集表單中的數(shù)據(jù)項進行分類。圖3以采集教職工基本信息為例,根據(jù)數(shù)據(jù)來源,將采集字段分為三類。依據(jù)三類數(shù)據(jù)項的特點,設(shè)計下載的表格模板。
圖 3 采集教職工基本信息示例
1.有權(quán)威數(shù)據(jù)源,且不可更改的數(shù)據(jù)
“工號”和“姓名”是人事處提供的教職工基本屬性,默認(rèn)是不可更改的。為方便院系填寫,將其預(yù)載入表格模板。由于表格模板只包含本部門教職工的基本信息,無需將“單位號”包含在模板中。“入校時間”默認(rèn)從教職工入校開始,無需再次確認(rèn),也不會出現(xiàn)在模板中。
2. 沒有權(quán)威數(shù)據(jù)源,但有可參考的數(shù)據(jù)
“是否實驗技術(shù)人員”會隨著教職工在校內(nèi)的發(fā)展情況而變動。業(yè)務(wù)部門能夠提供歷史數(shù)據(jù)作為參考,所以這類數(shù)據(jù)出現(xiàn)在模板中,允許院系部門核正。
3. 沒有權(quán)威數(shù)據(jù)源,也沒有可參考的數(shù)據(jù)
“是否工程背景”既沒有權(quán)威數(shù)據(jù)源,也沒有參考數(shù)據(jù),只能由院系新增填寫,在模板中以空白呈現(xiàn)。
圖4是院系部門填寫的表格樣例,為方便系統(tǒng)測試,彩色部分特別標(biāo)注錯誤輸入數(shù)據(jù)。
圖 4 院系部門填寫的示例表格
由數(shù)據(jù)采集小組維護權(quán)限表,分配訪問一表通平臺的填寫人員權(quán)限。院系部門在填寫過程中,需要執(zhí)行以下操作:
1.在一表通平臺下載各類數(shù)據(jù)表格模板;2.對表格信息進行核正,補充空白字段信息;3.將填寫表格上傳一表通平臺。
該模式設(shè)置雙重數(shù)據(jù)校驗。
1.表格模板校驗。制作模板表格時,設(shè)置表格中的內(nèi)容輸入提示,對于輸入范圍有限制的字段,預(yù)先設(shè)置好選擇范圍。
2.一表通平臺校驗。系統(tǒng)在接收用戶上傳的表格時,逐個對接收數(shù)據(jù)進行校驗,包括錄入字段取值范圍、字段間邏輯關(guān)系、數(shù)據(jù)條數(shù)是否刪減等。當(dāng)填寫表格上傳至一表通平臺時,系統(tǒng)友好定位出錯數(shù)據(jù)位置,精確到行和列,方便用戶快速修改。
數(shù)據(jù)采集小組作為管理者,可以通過單位數(shù)據(jù)中心查看每個院系部門的填報進度,還可以根據(jù)填報進度對相關(guān)院系部門進行催辦。
數(shù)據(jù)采集小組可以在填報的任意階段,對全校填報數(shù)據(jù)進行導(dǎo)出。由于此前經(jīng)過了雙重數(shù)據(jù)校驗,導(dǎo)出的結(jié)果符合國家數(shù)據(jù)平臺的要求。
本文分析了傳統(tǒng)數(shù)據(jù)采集模式存在的問題,針對數(shù)據(jù)采集自身的特點,提出提升采集效率、降低錯誤率的一表通數(shù)據(jù)采集模式,該模式具有以下特點:
1.根據(jù)表單采集主體的不同,將關(guān)注點放在需要多部門合作的表單上。
2.通過增加雙重錯誤校驗,提升了部門填寫效率,降低了采集數(shù)據(jù)的錯誤率。
3.通過系統(tǒng)直接反饋上傳結(jié)果,避免人工反復(fù)確認(rèn)環(huán)節(jié)。4.數(shù)據(jù)采集小組可以查看填報進度,對院系部門進行督辦。
5.導(dǎo)出數(shù)據(jù)操作簡單,為數(shù)據(jù)采集小組節(jié)省大量匯總整理時間。
下一步,將引入數(shù)據(jù)批次概念,將每次收集的數(shù)據(jù)歸為一個批次。在此后的數(shù)據(jù)采集中,將最近批次的數(shù)據(jù)預(yù)載入表格模板,進一步減少院系部門填寫量。如此迭代,數(shù)據(jù)采集工作會變得越來越輕松。