李碩 周董
[摘 要] 2013年以來,全新的《事業(yè)單位會計制度》和《高等學(xué)校會計制度》相繼出臺,高校經(jīng)濟運行體制在新制度指導(dǎo)下,開始由粗放式管理模式逐步轉(zhuǎn)變?yōu)榫毣⑼该骰墓芾砟J?,產(chǎn)生了對高校辦學(xué)成本進行分析的要求。在高校預(yù)算編制過程中,如何從上年度預(yù)算執(zhí)行情況中獲得對新一年預(yù)算編制工作有指導(dǎo)意義的,有利于高校管理層決策的知識,成為當(dāng)前高校預(yù)算管理研究的一個方向。將近年來興起的數(shù)據(jù)挖掘技術(shù)應(yīng)用于高校的預(yù)算管理工作中,是一個不錯的選擇。本文對高校預(yù)算工作現(xiàn)狀和數(shù)據(jù)挖掘技術(shù)在預(yù)算編制中的應(yīng)用進行探討。
[關(guān)鍵詞] 高校預(yù)算;數(shù)據(jù)挖掘;財務(wù)管理;DM;KDD
[中圖分類號] F232;G475 [文獻標(biāo)識碼] A [文章編號] 1673 - 0194(2014)19- 0034- 03
1 高校預(yù)算管理現(xiàn)狀
作為高校運作的經(jīng)濟命脈和神經(jīng)中樞,我國高校預(yù)算管理的改革正在逐步深化,高校預(yù)算管理工作由最初的“資源配置”功能逐步轉(zhuǎn)化為“資源配置”與“目標(biāo)控制”并重[1]。“資源配置”是實施預(yù)算管理的原始動力,而“目標(biāo)控制”則是預(yù)算管理優(yōu)良再循環(huán)的重要基礎(chǔ)。目前,隨著高校體制改革的推進,高校預(yù)算管理工作中的“目標(biāo)控制(管理)”功能已經(jīng)愈發(fā)得到高校管理層的重視,但是在實際的預(yù)算編制中,高校基本上還是采用基數(shù)―增長的預(yù)算編制方法[2]。這種方法簡便易行,但實質(zhì)上是預(yù)算編制人員在默認(rèn)上年預(yù)算合理的基礎(chǔ)上根據(jù)上年財務(wù)收支工作中累積的經(jīng)驗和本年概略的發(fā)展目標(biāo)制訂一個粗糙方案,是一種缺乏科學(xué)性、公開性、公平性的非量化的預(yù)算編制方法。究其原因,是現(xiàn)有的預(yù)算執(zhí)行體系缺乏一種有效的、可靠的輔助決策機制,難以產(chǎn)生科學(xué)可信的可供管理層和預(yù)算編制人員參考的預(yù)算執(zhí)行分析報告,預(yù)算編制工作的質(zhì)量只能依賴于本級預(yù)算編制人員和下級預(yù)算單位相關(guān)人員的工作經(jīng)驗和職業(yè)道德,對于高校決策者來說,這樣的預(yù)算管理機制是模糊的,不規(guī)范的,難以掌控的,不利于高校形成健康的運行體制,也不利于高校制訂長遠的發(fā)展規(guī)劃。只有通過信息化手段,運用某些特定的方法,從高校預(yù)算執(zhí)行過程中形成的海量數(shù)據(jù)里,提取和精煉高置信度的關(guān)聯(lián)數(shù)據(jù),對預(yù)算編制工作進行強有力的支撐,才能形成科學(xué)合理的高可靠性的預(yù)算編制方案。
目前,我國高校預(yù)算管理和會計核算的職能并沒有分離,同屬于財務(wù)部門。高校財務(wù)部門普遍應(yīng)用的商業(yè)化財會電算化系統(tǒng)是基于高校一般會計核算需求設(shè)計開發(fā)的,在《事業(yè)單位會計制度》和《高等學(xué)校會計制度》的框架內(nèi),財會電算化系統(tǒng)圍繞會計核算的基本職能來運作,在提供管理決策支持方面的功能是微弱的,同時由于會計電算化數(shù)據(jù)相對單一、孤立,豐度低,在記錄高校經(jīng)濟活動的過程中偏重于合法性,無法全面準(zhǔn)確地從成本效益的角度反映高校包括教學(xué)、科研、行政、后勤各類機構(gòu)的運作特征,進而導(dǎo)致無法提供有效的信息來滿足決策層的管理需要。那么,應(yīng)用數(shù)據(jù)挖掘技術(shù),對與高校經(jīng)濟活動相關(guān)聯(lián)的數(shù)據(jù)進行科學(xué)的分析、處理和展現(xiàn),是目前比較可行的方案。
2 數(shù)據(jù)挖掘技術(shù)介紹
近年來,信息技術(shù)在生產(chǎn)生活中的應(yīng)用呈指數(shù)級增長,各行各業(yè)在實際工作中積累了巨量的應(yīng)用數(shù)據(jù),這些數(shù)據(jù)中蘊含了許多有價值的規(guī)律和知識,被稱為“知識金礦”。由于缺乏強有力的數(shù)據(jù)分析工具,這些寶貴的知識財富只能混雜在大量的冗余數(shù)據(jù)中,慢慢地流失自己的價值。數(shù)據(jù)挖掘(Data Mining,DM),也被稱為知識發(fā)現(xiàn)(Knowledge Discovery in Database,KDD)技術(shù),就是從大量的、異構(gòu)的、模糊的、有噪聲的應(yīng)用數(shù)據(jù)中發(fā)現(xiàn)并提取浸沒在其中的有價值的、可靠的知識信息和模式的數(shù)據(jù)處理過程。數(shù)據(jù)挖掘技術(shù)是涉及多學(xué)科的技術(shù)集成,包括數(shù)據(jù)倉庫技術(shù)、統(tǒng)計學(xué)、機器學(xué)習(xí)、高性能計算、模式識別、神經(jīng)網(wǎng)絡(luò)、數(shù)據(jù)可視化、信息檢索、圖像與信號處理以及空間或時間數(shù)據(jù)分析[3]。
數(shù)據(jù)挖掘的過程由數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘、模式評估、知識展現(xiàn)這4個可以互相迭代的步驟來完成,其中數(shù)據(jù)預(yù)處理步驟包括對數(shù)據(jù)的清洗、集成、選擇、轉(zhuǎn)換等操作,模式評估質(zhì)量則依賴于支持度、置信度等客觀度量的選擇和制定,知識展現(xiàn)過程就是使用可視化技術(shù)向用戶提供易于理解的知識發(fā)現(xiàn)結(jié)果。
3 數(shù)據(jù)挖掘技術(shù)在高校預(yù)算管理中的應(yīng)用
基于數(shù)據(jù)挖掘技術(shù)對規(guī)律和知識發(fā)現(xiàn)的強大能力,將數(shù)據(jù)挖掘技術(shù)和高校的財務(wù)預(yù)算編制工作結(jié)合起來,不僅有利于使財務(wù)人員從繁雜的財務(wù)數(shù)據(jù)中解脫出來,減少財務(wù)工作人員在高校運作和科研方面知識的短板對預(yù)算編制工作的負面影響,同時也給高校管理層提供了清晰、可靠的決策參考?;跀?shù)據(jù)挖掘技術(shù)的預(yù)算3.1 預(yù)算數(shù)據(jù)預(yù)處理
高校在預(yù)算編制過程中涉及的數(shù)據(jù)種類繁多,在目前高校管理系統(tǒng)暫未進行有效整合的現(xiàn)實環(huán)境下,各部門基本按照歸口上級部門的要求,應(yīng)用縱向體系下安排的MIS系統(tǒng)或者各分屬行業(yè)應(yīng)用自己符合行業(yè)標(biāo)準(zhǔn)的通用管理系統(tǒng),包括教務(wù)管理系統(tǒng)、人事管理系統(tǒng)、財務(wù)管理系統(tǒng)、科研管理系統(tǒng)、國有資產(chǎn)管理系統(tǒng)、后勤集團下屬各行業(yè)管理系統(tǒng)等。這些MIS系統(tǒng)使用各種數(shù)據(jù)庫管理系統(tǒng)(DBMS)來進行業(yè)務(wù)支撐,包括ACCESS,MS SQL Server,Oracle,InterBase等,有些數(shù)據(jù)甚至只是一些表格文檔、Web頁面、平面文件(Flat File)等,這些數(shù)據(jù)只要和高校預(yù)算編制工作有關(guān),就需要通過數(shù)據(jù)預(yù)處理的流程載入預(yù)算編制的數(shù)據(jù)倉庫中。
對于能夠支持某種標(biāo)準(zhǔn)數(shù)據(jù)接口規(guī)范(比如ODBC)的DBMS,我們只需要在數(shù)據(jù)預(yù)處理工具(Extraction-Transformation-Loading,ETL)中指定源數(shù)據(jù)類型就可以了,一些符合數(shù)據(jù)格式描述的平面文件,也可以通過安裝平面文件提取插件(Flat-File Extraction Plug-in,F(xiàn)EP)來輔助完成,一些缺乏數(shù)據(jù)形式但是具有數(shù)據(jù)意義的平面文件,則需要進行人工處理,至少符合ETL標(biāo)準(zhǔn)后通過ETL工具載入預(yù)算數(shù)據(jù)倉庫。
當(dāng)然,在各類預(yù)算相關(guān)數(shù)據(jù)載入預(yù)算倉庫之前,應(yīng)通過ETL提供的數(shù)據(jù)清洗工具對數(shù)據(jù)進行清理,如果不能滿足本校預(yù)算編制規(guī)則,則可以通過一些易于二次開發(fā)的工具,比如Potters Wheel編寫定制的數(shù)據(jù)清理程序。數(shù)據(jù)清理的過程主要包括缺失值處理和降噪處理。處理缺失值的方法一般采用回歸、決策樹、或者貝葉斯推理的方法來生成一個最可能的值來填充(需注意空值和缺失值的區(qū)別)。降噪處理主要通過分箱、回歸、聚類等方法去除噪聲數(shù)據(jù),通過這兩步處理后,待處理數(shù)據(jù)將變得完整和平滑。
將“光滑”的數(shù)據(jù)載入預(yù)算數(shù)據(jù)倉庫后,可以根據(jù)預(yù)算編制的約束條件對數(shù)據(jù)進行集成、變換、規(guī)約、分層等處理。
在數(shù)據(jù)集成的過程中需要注意到實體識別(比如,不同MIS系統(tǒng)中關(guān)于教工編號的表達)和冗余(比如兩個字段,一個是月基本工資,一個是年基本工資,這兩個數(shù)據(jù)中的一個即為冗余數(shù)據(jù))問題。
數(shù)據(jù)規(guī)約操作可以以極為微小損傷的方式高度壓縮數(shù)據(jù)量,在大大提高數(shù)據(jù)挖掘效率的同時產(chǎn)生相同(或幾乎相同)的分析結(jié)果。主要方法有數(shù)據(jù)立方體聚集、屬性子集選擇、維度規(guī)約、數(shù)值規(guī)約、離散化和概念分層產(chǎn)生等,譬如,一些預(yù)算項目編制時需要參考上年度整年的支出情況,有些預(yù)算項目編制時需要根據(jù)高校特征(暑假開學(xué)、寒假開學(xué)、招生季、撥款規(guī)律)等,這些預(yù)算編制時無需逐月參考上年數(shù)據(jù),可以使用數(shù)據(jù)立方體聚集的方法壓縮數(shù)據(jù),有些屬性,比如教工電話號碼等,對預(yù)算編制無意義,可以使用屬性子集選擇的方法過濾數(shù)據(jù),如果某些數(shù)據(jù)經(jīng)過編碼重構(gòu)之后對信息表達無損的,可以使用維度規(guī)約的方法(數(shù)學(xué)方法)等。
通過數(shù)據(jù)預(yù)處理,將預(yù)算編制需要的相關(guān)數(shù)據(jù)轉(zhuǎn)換成適合挖掘的數(shù)據(jù)形式后,我們就可以開始從這些數(shù)據(jù)礦藏中挖掘“知識金礦”了。
3.2 預(yù)算數(shù)據(jù)挖掘
高校預(yù)算編制的過程中需要涉及具有多種特性的支出、收入項目,需要根據(jù)這些項目的特征選擇合適的數(shù)據(jù)挖掘方法,主要的數(shù)據(jù)挖掘方法及其在預(yù)算編制中的應(yīng)用如下。
3.2.1 分類分析
分類分析的方法就是按照預(yù)算項目的特征設(shè)定分類模式,按照分類模式將待分析數(shù)據(jù)劃分為不同的種類,在給定這些數(shù)據(jù)分類標(biāo)示符之后,按照類別僅進行分析和匯總,從中提取出有價值的規(guī)律和知識。
這種方法在預(yù)算編制決策中可以應(yīng)用于不同辦學(xué)層次收入分析,不同層次人才的科研經(jīng)費獲取能力分析,不同專業(yè)招生能力分析,不同類別科研項目經(jīng)費支出分析等。
3.2.2 回歸分析
回歸分析的方法反映了某一事務(wù)的屬性值在時間維度上的變化特征,形成一個變量或?qū)傩蚤g的函數(shù)關(guān)系,主要研究的是隨著時間變化的趨勢,研究這個趨勢可以對未來屬性值的變化進行預(yù)測,以及發(fā)現(xiàn)時間維度上這些數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系。
這種方法在預(yù)算編制決策中可以應(yīng)用于專業(yè)設(shè)置趨勢分析(對于專業(yè)設(shè)置相對靈活的職業(yè)教育類高校的預(yù)算編制工作尤其重要),能源耗用分析等。
3.2.3 聚類分析
聚類分析的方法是將一組數(shù)據(jù)對象分成類(簇,Cluster)的過程,使得同一個簇中的數(shù)據(jù)具有極高的相似性,而不同的簇之間的數(shù)據(jù)對象具有高度的相異性。適用于事先沒有已知的類別劃分,需要在分析過程中形成相似數(shù)據(jù)聚合并得到簇的數(shù)量和特征。
這種方法在預(yù)算編制決策中可以應(yīng)用于某些項目核算的科目支出賬的分析,比如差旅費支出特征,專利費支出特征,項目往來賬分析等,從中獲取不同的項目在科目支出方面可能的規(guī)律。
3.2.4 關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則的分析方法是分析數(shù)據(jù)項之間存在的關(guān)系的方法,即分析某一事務(wù)中數(shù)據(jù)項的出現(xiàn)或者變化與另一事務(wù)中某一數(shù)據(jù)項的出現(xiàn)或者變化是否具有內(nèi)在聯(lián)系的方法。應(yīng)用這種方法常常能夠找到看似無關(guān)的數(shù)據(jù)之間潛在的有趣的關(guān)聯(lián)關(guān)系。
這種方法在預(yù)算編制決策中可以通過對收入和支出數(shù)據(jù)之間關(guān)系的分析,找到其中內(nèi)在的規(guī)律,比如可以試著分析科研經(jīng)費收入的變化和業(yè)務(wù)招待支出之間在科研經(jīng)費預(yù)算流程中是否有某種關(guān)聯(lián),就業(yè)經(jīng)費支出和學(xué)費收入之間在一般收支預(yù)算執(zhí)行過程中是否有內(nèi)在的聯(lián)系等。
3.2.5 變化和偏差分析
變化和偏差分析方法用于分析分類中的反常實例和模式的例外,通過分析實際結(jié)果與預(yù)測之間的偏差找到潛在有趣的規(guī)律,常常用于風(fēng)險分析。
這種方法在預(yù)算編制決策中用于對高校上年度預(yù)算執(zhí)行情況中發(fā)生的規(guī)則外情形進行分析,比如偶發(fā)的大型支出,比如限制或禁止點招之后對學(xué)校收入的影響等。
3.3 數(shù)據(jù)挖掘結(jié)果的模式評估
在選擇以上5種方法對合適的數(shù)據(jù)進行第一次挖掘之后,我們要對挖掘出來的知識進行評估,評價其對預(yù)算編制工作是否有用。評價基于4條標(biāo)準(zhǔn),即是否易于理解,是否能在另一組相似數(shù)據(jù)上再現(xiàn),是否具有潛在價值,是否是全新的知識。在模式評估中存在一些模式興趣度的客觀度量,包括支持度和置信度兩種評價方法,定義為:
support(A=>B)=P(A∪B)
confidence(A=>B)=P(A|B)
其中支持度(support)的意義即在事務(wù)中A項和B項同時出現(xiàn)的概率,信任度(confidence)即在事務(wù)中出現(xiàn)事務(wù)B的同時,也出現(xiàn)事務(wù)A的概率。
使用支持度和信任度對模式進行評估后還要根據(jù)需要人工對挖掘成果進行主觀評價,根據(jù)模式評估結(jié)果對數(shù)據(jù)挖掘的有效性進行改善,對數(shù)據(jù)進行重新挖掘或者改用其他方法進行挖掘。 4 預(yù)算數(shù)據(jù)的數(shù)據(jù)挖掘舉例
使用分類分析中的決策樹算法對高校不同專業(yè)的招生能力進行分析,有利于高校適時靈活地進行專業(yè)調(diào)整,提高招生指標(biāo)的完成度,獲取更多的財政撥付資金。
決策樹算法是通過構(gòu)造決策樹來發(fā)現(xiàn)數(shù)據(jù)中蘊含的規(guī)則,一般分兩步來進行:第一步,根據(jù)已知領(lǐng)域知識構(gòu)造決策樹,第二步,根據(jù)模式評估效果對決策樹進行修剪。經(jīng)過這兩步的操作,產(chǎn)生新穎的知識。
專業(yè)設(shè)置決策樹生成步驟如下:
(1)按已知的招生不足和招生足對數(shù)據(jù)進行初始分裂
(2)按已知的學(xué)科分類比如社會科學(xué)類和自然科學(xué)類專業(yè)進行第二次分裂。
(3)再按專業(yè)細分分別對社會科學(xué)類和自然科學(xué)類專業(yè)進行再次分裂。
(4)生成決策樹。
(5)根據(jù)模式評估對分類方法進行改進或者對決策樹進行修剪,根據(jù)需要從步驟1重新開始。
生成決策樹的例子如圖3 所示。
圖3表明,職業(yè)教育型高校專業(yè)設(shè)置應(yīng)以實用和就業(yè)為導(dǎo)向,減少純理論性專業(yè)的設(shè)置,提高招生效率,在財政資金撥付以招生人數(shù)為基準(zhǔn)的情況下,只有這樣才能獲得充足的預(yù)算收入,具體的量化指標(biāo)依賴于對數(shù)據(jù)的挖掘,需根據(jù)興趣度對決策樹進行判斷和修正。
5 結(jié) 語
隨著新的《事業(yè)單位會計制度》和《高等學(xué)校會計制度》的出臺,全面預(yù)算和績效預(yù)算成為高校預(yù)算改革的目標(biāo),科學(xué)應(yīng)用數(shù)據(jù)挖掘的方法,對高校運作過程中產(chǎn)生的海量數(shù)據(jù)進行多角度、多維度的分析,形成清晰明確的管理決策信息,有利于高校在預(yù)算編制工作中做到兼顧公平與效率,使預(yù)算更好地服務(wù)于高校長遠規(guī)劃,為高校的科學(xué)發(fā)展提供堅實可靠的數(shù)據(jù)基礎(chǔ)。
主要參考文獻
[1]陸媛.高校預(yù)算績效評價的理論研究及績效指標(biāo)體系設(shè)計[J]. 技術(shù)經(jīng)濟與管理研究, 2006(1).
[2]張寬. 我國高校預(yù)算管理體系研究[D].湘潭:湘潭大學(xué), 2010.
[3][加]Han J, Kamber M. 數(shù)據(jù)挖掘概念與技術(shù)[M]. 第2版.北京:機械工業(yè)出版社,2007.