單軍亭+單昱+單晨+瞿晶珠
摘 要 大數(shù)據(jù)是互聯(lián)網(wǎng)信息時(shí)代的發(fā)展趨勢(shì),小數(shù)據(jù)是大數(shù)據(jù)的基礎(chǔ),二者相輔相成,相得益彰。本文通過探討大數(shù)據(jù)與小數(shù)據(jù)之間的關(guān)系,建立內(nèi)控測(cè)試?yán)馐马?xiàng)數(shù)據(jù)庫的目的與意義,簡(jiǎn)述用大數(shù)據(jù)思維建立例外事項(xiàng)Excel小數(shù)據(jù)庫的程序和方法,以及數(shù)據(jù)庫的使用方式。
關(guān)鍵詞 大數(shù)據(jù) 數(shù)據(jù)庫 建設(shè)程序
大數(shù)據(jù)思維是目前企業(yè)關(guān)注和熱議的話題,正在影響或改變傳統(tǒng)的企業(yè)模式。運(yùn)用大數(shù)據(jù)新型技術(shù)從海量的數(shù)據(jù)庫中提取可用數(shù)據(jù),通過對(duì)結(jié)構(gòu)性和非結(jié)構(gòu)性數(shù)據(jù)進(jìn)行全面、關(guān)聯(lián)和快速分析,精準(zhǔn)預(yù)測(cè)未來發(fā)展趨勢(shì),已成為互聯(lián)網(wǎng)信息時(shí)代的共識(shí)和不爭(zhēng)的事實(shí)。大數(shù)據(jù)的運(yùn)行,離不開數(shù)據(jù)資源的支持,沒有各類數(shù)據(jù)庫資源的匯集,大數(shù)據(jù)就無數(shù)據(jù)來源。因此,在大數(shù)據(jù)思維下建立相應(yīng)的小數(shù)據(jù)庫,不僅是大數(shù)據(jù)有效運(yùn)行的基礎(chǔ),更是應(yīng)用大數(shù)據(jù)新型技術(shù)的保障。
一、對(duì)數(shù)據(jù)、信息和數(shù)據(jù)庫的理解
百度百科和360百科均把數(shù)據(jù)(data)解釋為,數(shù)據(jù)是對(duì)客觀事物存在事實(shí)或觀察的結(jié)果和邏輯歸納,是表示客觀事物未被加工和處理、原汁原味的原始素材。數(shù)據(jù)是計(jì)算機(jī)信息技術(shù)的術(shù)語,是信息的表現(xiàn)形式和載體,可以是符號(hào)、文字、數(shù)字、語音、圖像、視頻等。信息是數(shù)據(jù)的內(nèi)涵,數(shù)據(jù)是信息的表達(dá)。數(shù)據(jù)本身并無意義,只有對(duì)實(shí)體行為產(chǎn)生影響時(shí)才成為信息,數(shù)據(jù)和信息不可分離。①
筆者認(rèn)為,數(shù)據(jù)是對(duì)各類事物誕生、發(fā)展和消亡等各個(gè)時(shí)序節(jié)點(diǎn)全過程運(yùn)行軌跡,用各種各樣能被人和機(jī)器等認(rèn)識(shí)、甄別和記憶,用不同的語言文字、影像圖形、符號(hào)標(biāo)識(shí)等進(jìn)行描述匯總和統(tǒng)計(jì)分析的一維或多維記錄。單個(gè)記錄的匯集可以形成一組或一個(gè)緯度,多個(gè)緯度的聚集便可形成一個(gè)庫。記錄數(shù)量按照“積水成淵、積土成山”規(guī)則,即可形成大、中、小等不同層級(jí)的庫。由于記錄的是各種類型的信息,通常這些信息又被稱為數(shù)據(jù),所以這些信息數(shù)據(jù)記錄形成的庫就被稱為數(shù)據(jù)庫。
不言而喻,數(shù)據(jù)量小的是小數(shù)據(jù)庫,數(shù)據(jù)量大的是大數(shù)據(jù)庫(介于中間的是中控?cái)?shù)據(jù)庫)。單個(gè)或多個(gè)小數(shù)據(jù)庫的匯集可以形成大數(shù)據(jù)庫。由此可知,小數(shù)據(jù)庫是大數(shù)據(jù)庫的基礎(chǔ),大數(shù)據(jù)庫是小數(shù)據(jù)庫的集合,沒有小數(shù)據(jù)庫就形成不了大數(shù)據(jù)庫,沒有小數(shù)據(jù)就形成不了大數(shù)據(jù)。
二、大數(shù)據(jù)與小數(shù)據(jù)之間的關(guān)系
網(wǎng)絡(luò)技術(shù)的不斷進(jìn)步和信息載體飛速發(fā)展,為大數(shù)據(jù)的崛起提供了機(jī)遇和平臺(tái)。數(shù)據(jù)庫是按照一定的數(shù)據(jù)結(jié)構(gòu),集成、記錄、存儲(chǔ)和管理數(shù)據(jù)資源的倉(cāng)庫,結(jié)構(gòu)性和非結(jié)構(gòu)性信息層級(jí)分明,使用方便、操作簡(jiǎn)單。
(一)大數(shù)據(jù)和小數(shù)據(jù)之間存在層級(jí)關(guān)系
數(shù)據(jù)庫可以分為三個(gè)層級(jí):第一層級(jí)是集團(tuán)層面,處于數(shù)據(jù)庫的頂層;第二層級(jí)是地區(qū)公司層面,處于數(shù)據(jù)庫的中層;第三層級(jí)是地區(qū)公司所屬層面,處于數(shù)據(jù)庫的底層。大數(shù)據(jù)是小數(shù)據(jù)的集合,集團(tuán)層面可視同為大數(shù)據(jù)。小數(shù)據(jù)是業(yè)內(nèi)不同部門各相關(guān)數(shù)據(jù)的集成,地區(qū)公司所屬層面可視同為小數(shù)據(jù)。小數(shù)據(jù)是大數(shù)據(jù)的基礎(chǔ)和來源,沒有小數(shù)據(jù)就沒有大數(shù)據(jù);大數(shù)據(jù)是小數(shù)據(jù)的匯集,沒有大數(shù)據(jù),小數(shù)據(jù)就沒有價(jià)值取向,二者相輔相成,相得益彰。
(二)大數(shù)據(jù)和小數(shù)據(jù)之間的數(shù)據(jù)取值不對(duì)稱
大數(shù)據(jù)的數(shù)據(jù)來源于小數(shù)據(jù),而小數(shù)據(jù)是各行業(yè)部門投入大量的人、財(cái)、物資源,把長(zhǎng)期積累的各類資源轉(zhuǎn)換成數(shù)據(jù)資源的結(jié)果,是企業(yè)內(nèi)部勞動(dòng)成果和辛勤付出的平臺(tái)和血汗,一般只限制在有權(quán)限的內(nèi)部使用,不會(huì)輕易外傳。由于受考核指標(biāo)的影響,不同層級(jí)的單位上報(bào)數(shù)據(jù)時(shí),在考慮和權(quán)衡自身利弊的情況下,基本都會(huì)對(duì)關(guān)鍵指標(biāo)進(jìn)行加工和處理,對(duì)下真實(shí)可靠,對(duì)上卻受到懷疑。這種背景下的大數(shù)據(jù),因其數(shù)據(jù)取值不對(duì)稱,就具有了一定的欺騙性。
(三)大數(shù)據(jù)和小數(shù)據(jù)的數(shù)據(jù)使用都有權(quán)限限制
大數(shù)據(jù)背景下,業(yè)內(nèi)數(shù)據(jù)屬于內(nèi)部資料,一般不會(huì)對(duì)外開放。業(yè)外人員要想獲得相應(yīng)的數(shù)據(jù),必須經(jīng)過逐級(jí)審批,且有限制權(quán)限。比如,人事、財(cái)務(wù)、合同、采購(gòu)和審計(jì)等部門的非內(nèi)部人員想獲取相關(guān)數(shù)據(jù),如同非內(nèi)部人員想查看淘寶、微信、銀行或醫(yī)院等相關(guān)數(shù)據(jù)一樣,一般只能在對(duì)外開放的平臺(tái)上查看對(duì)外披露的數(shù)據(jù),但這些數(shù)據(jù)都經(jīng)過了加工和處理。要想收集到最原始的數(shù)據(jù)進(jìn)行數(shù)據(jù)分析和預(yù)測(cè),必須有相應(yīng)的權(quán)限,并且經(jīng)過允許。由此可知,大數(shù)據(jù)只是供內(nèi)部有權(quán)限人員使用的平臺(tái),外部想實(shí)現(xiàn)數(shù)據(jù)挖掘、采集、篩選和運(yùn)算,用大數(shù)據(jù)分析和預(yù)測(cè),基本無能為力。
三、建立內(nèi)控測(cè)試?yán)馐马?xiàng)數(shù)據(jù)庫的目的與意義
在大數(shù)據(jù)背景下,集團(tuán)公司作為國(guó)有大型企業(yè),已經(jīng)建立了一系列的數(shù)據(jù)體系。由于受使用權(quán)限等影響,人事、財(cái)務(wù)、合同、采購(gòu)和審計(jì)等部門的非內(nèi)部專業(yè)人員一般無法獲取相應(yīng)的數(shù)據(jù)資料。建立業(yè)內(nèi)小型數(shù)據(jù)庫,能夠擴(kuò)大非內(nèi)部專業(yè)人員的使用范圍,為非專業(yè)人員提供一個(gè)通暢的查詢平臺(tái)。由于各業(yè)務(wù)之間存在一定的瓶頸,加上內(nèi)部之間互相涉密,系統(tǒng)間使用的框架、平臺(tái)和接口不統(tǒng)一,限制了大數(shù)據(jù)分析者運(yùn)用大數(shù)據(jù)算法進(jìn)行挖掘和統(tǒng)計(jì)分析的能力。在此,筆者以本公司內(nèi)控測(cè)試?yán)馐马?xiàng)數(shù)據(jù)為例,簡(jiǎn)述建立小型數(shù)據(jù)庫的目的和意義。
(一)梳理存在問題,方便查詢分析
按照內(nèi)控手冊(cè)要求,公司每年至少開展一次內(nèi)控測(cè)試,查找內(nèi)控體系設(shè)計(jì)和運(yùn)行中存在的問題,修訂失效控制,維護(hù)內(nèi)控管理手冊(cè)。所屬單位完成例外事項(xiàng)整改任務(wù)后,大多數(shù)情況下都不會(huì)再去翻閱和查看,給日后使用帶來了不便。梳理內(nèi)控測(cè)試?yán)馐马?xiàng),建立數(shù)據(jù)庫可以為后續(xù)的查詢分析提供方便。
(二)提醒關(guān)注事項(xiàng),避免重復(fù)發(fā)生
內(nèi)控測(cè)試?yán)馐马?xiàng)數(shù)量是考核內(nèi)控體系運(yùn)行情況的一項(xiàng)指標(biāo),建立內(nèi)控測(cè)試?yán)馐马?xiàng)數(shù)據(jù)庫,可以提醒崗位人員及時(shí)關(guān)注相關(guān)事項(xiàng),統(tǒng)計(jì)分析和查找存在問題的根源,有利于主管部門結(jié)合實(shí)際情況制定切實(shí)可行的防控措施,從而避免內(nèi)控例外事項(xiàng)的重復(fù)發(fā)生。
(三)防范潛在風(fēng)險(xiǎn),推進(jìn)控制執(zhí)行
內(nèi)控測(cè)試?yán)馐马?xiàng)的產(chǎn)生是未能按照控制要求執(zhí)行的結(jié)果,內(nèi)部控制的關(guān)鍵是控制對(duì)應(yīng)的風(fēng)險(xiǎn)。產(chǎn)生例外事項(xiàng)說明控制措施執(zhí)行不力或者失效,其對(duì)應(yīng)風(fēng)險(xiǎn)造成的影響,雖然沒有立刻顯現(xiàn),但確實(shí)存在,如不認(rèn)真對(duì)待,潛在風(fēng)險(xiǎn)一旦爆發(fā),后果和影響或不可估量。內(nèi)控例外事項(xiàng)數(shù)據(jù)庫對(duì)應(yīng)了風(fēng)險(xiǎn)防范和懲處重復(fù)發(fā)生措施,為全面提升內(nèi)控執(zhí)行力提供了依據(jù)和支持。endprint
四、數(shù)據(jù)庫建設(shè)的程序方法
搭建數(shù)據(jù)庫的方法多種多樣,有系統(tǒng)、有軟件、也有表單。如前所述,系統(tǒng)數(shù)據(jù)庫由于內(nèi)部之間互相涉密,系統(tǒng)間使用的框架、平臺(tái)和接口不統(tǒng)一,限制了大數(shù)據(jù)分析者運(yùn)用大數(shù)據(jù)算法進(jìn)行挖掘和統(tǒng)計(jì)分析的能力。軟件建庫需要學(xué)習(xí)相關(guān)的專業(yè)技術(shù),Access也要具備相應(yīng)技能。相比之下,筆者認(rèn)為還是Office Excel表單結(jié)構(gòu)簡(jiǎn)單、使用方便。這里,筆者以微軟Office Excel為例,簡(jiǎn)述本公司內(nèi)控測(cè)試?yán)馐马?xiàng)結(jié)構(gòu)性數(shù)據(jù)庫的建設(shè)程序和方法,其他不同類型小數(shù)據(jù)庫的建立,如人事、財(cái)務(wù)、合同、采購(gòu)和審計(jì)等方法與此大同小異。
一是設(shè)計(jì)數(shù)據(jù)庫結(jié)構(gòu),整理統(tǒng)一表格。結(jié)合年度測(cè)試情況,根據(jù)需要?dú)w類數(shù)據(jù)內(nèi)容,把各年度例外事項(xiàng)測(cè)試層級(jí)、測(cè)試主題內(nèi)容和領(lǐng)域名稱,例外事項(xiàng)問題及產(chǎn)生原因、問題根源,問題解決措施,重復(fù)發(fā)生例外事項(xiàng)懲處措施,提升內(nèi)控執(zhí)行力建議等統(tǒng)計(jì)分析內(nèi)容,一并設(shè)計(jì)納入數(shù)據(jù)庫結(jié)構(gòu)之中,形成統(tǒng)一的Excel表格,在征求意見的基礎(chǔ)上,修訂、完善數(shù)據(jù)庫結(jié)構(gòu),整理設(shè)計(jì)格式統(tǒng)一的內(nèi)控測(cè)試?yán)馐马?xiàng)數(shù)據(jù)庫。
二是下發(fā)統(tǒng)計(jì)分析通知,指導(dǎo)表格填寫。在公司網(wǎng)頁上發(fā)布關(guān)于開展內(nèi)控測(cè)試?yán)馐马?xiàng)分析工作的通知,明確分析期間、范圍、內(nèi)容和上報(bào)時(shí)間。組織所屬單位開展例外事項(xiàng)統(tǒng)計(jì)分析業(yè)務(wù)培訓(xùn),指導(dǎo)業(yè)務(wù)骨干分項(xiàng)填寫相關(guān)內(nèi)容,把建庫要求落實(shí)到基層對(duì)應(yīng)部門,自下而上制定問題解決措施和重復(fù)發(fā)生例外事項(xiàng)懲處措施,經(jīng)存在問題的對(duì)應(yīng)部門簽字確認(rèn)后,提交主管領(lǐng)導(dǎo)審核。
三是收集反饋資料,審查對(duì)應(yīng)內(nèi)容。例外事項(xiàng)統(tǒng)計(jì)分析業(yè)務(wù)主管部門相關(guān)人員在規(guī)定時(shí)間收集所屬單位上報(bào)的反饋資料,逐一審查對(duì)應(yīng)內(nèi)容,發(fā)現(xiàn)不符合要求等問題及時(shí)溝通并返回修訂,直至全部合格后,把例外事項(xiàng)統(tǒng)計(jì)分析表整理匯總為統(tǒng)一文檔。之后調(diào)整表格順序,編制鏈接庫文件目錄。
四是制作VBA窗體,測(cè)試運(yùn)行效果。首先,打開Excel數(shù)據(jù)表,主界面如未顯示開發(fā)工具,可在Office按鈕主菜單下選擇Excel選項(xiàng),之后選擇常用,然后選擇勾選開發(fā)工具;其次,在主界面點(diǎn)擊開發(fā)工具,之后選擇錄制宏,完成宏錄制后打開開發(fā)工具,左側(cè)點(diǎn)擊Visual Basic,在視圖中點(diǎn)擊工程資源編輯器,在對(duì)象下點(diǎn)擊This Workbook,然后雙擊并編程;第三,在主界面插入中選擇用戶窗體,出現(xiàn)窗體和控件工具箱,之后設(shè)計(jì)窗體,然后雙擊窗體在UserForm1編程;第四,完成編程后設(shè)計(jì)圖片和文字格式,在主界面運(yùn)行欄中選擇運(yùn)行子過程/用戶窗體,出現(xiàn)運(yùn)行界面后,輸入用戶名和密碼,之后進(jìn)入查詢導(dǎo)航,然后調(diào)試程序并完成測(cè)試。
非結(jié)構(gòu)性數(shù)據(jù)庫的建設(shè)程序和方法與結(jié)構(gòu)性數(shù)據(jù)庫基本相同,只是編程、表單引用等更加煩瑣和復(fù)雜。
五、數(shù)據(jù)庫的使用方式
為有效防范潛在風(fēng)險(xiǎn),全面提升內(nèi)控執(zhí)行力,制作完成例外事項(xiàng)統(tǒng)計(jì)分析數(shù)據(jù)庫后,可及時(shí)在公司網(wǎng)頁上發(fā)布,所屬單位崗位人員進(jìn)入查詢系統(tǒng)后,可進(jìn)行查詢和分析。
綜上所述,在大數(shù)據(jù)思維下建立例外事項(xiàng)小數(shù)據(jù)庫(內(nèi)控測(cè)試?yán)馐马?xiàng)Excel統(tǒng)計(jì)分析小數(shù)據(jù)庫),是發(fā)展并應(yīng)用大數(shù)據(jù)新型技術(shù)的前提和基礎(chǔ),大數(shù)據(jù)和小數(shù)據(jù)相輔相成,相得益彰。
注釋:①百度百科、360百科。
(單軍亭單位為青海油田企管法規(guī)處(內(nèi)控與風(fēng)險(xiǎn)管理處);單昱單位為中國(guó)石油大學(xué)(華東)儲(chǔ)運(yùn)與建筑學(xué)院;單晨單位為青海油田井下作業(yè)公司試油測(cè)試大隊(duì);瞿晶珠單位為青海油田社區(qū)管理中心物業(yè)一公司)
[作者簡(jiǎn)介:?jiǎn)诬娡ぃ?964—),男,本科,畢業(yè)于北京科技大學(xué)工商管理專業(yè),云南大學(xué)經(jīng)濟(jì)管理研究生結(jié)業(yè),高級(jí)項(xiàng)目管理師,青海油田企管法規(guī)處(內(nèi)控與風(fēng)險(xiǎn)管理處)業(yè)務(wù)部門負(fù)責(zé)人,研究方向:企業(yè)內(nèi)部控制,綜合風(fēng)險(xiǎn)管理。單昱,中國(guó)石油大學(xué)(華東)儲(chǔ)運(yùn)與建筑學(xué)院工程力學(xué)專業(yè)本科在讀。單晨,大專,石油工程專業(yè)。瞿晶珠,大專,計(jì)算機(jī)應(yīng)用專業(yè)。]
參考文獻(xiàn)
[1] http://baike.so.com/doc/5387430-7565065.html[OL]. 360百科.
[2] http://baike.baidu.com/link?url=k40A0wYoiB74deIK8UI7sqpkm_xjBpQt4t6jxSj6AlF
ZZ-SOSrx_Y3OjMpvRZCslSGDFXaifIdpySL5MV2UY38CQmTYwqf3lAkl5kQNTYE7[OL].百度百科.
[3] 青山. Excel窗體設(shè)計(jì)制作方法[OL]. http://club.excelhome.net/forum.php?mod=viewthread&tid=137671&page=1&authorid=76888,2005-12-02.
[4] 單軍亭,單晨.淺談?dòng)么髷?shù)據(jù)思維建立內(nèi)控測(cè)試?yán)馐马?xiàng)小數(shù)據(jù)庫[J].青海油田企業(yè)文化,2016(2):61-62.endprint