陳耿+馬寅+韓志耕
【摘要】隨著大數(shù)據(jù)的發(fā)展,財務(wù)報表也逐漸向網(wǎng)絡(luò)化、電子化發(fā)展,XBRL因此而興起,針對企業(yè)財務(wù)的審計方法也因隨之發(fā)生改變。本文分析了非結(jié)構(gòu)化數(shù)據(jù)庫——NoSQL的特點,并研究了兩種適合XBRL網(wǎng)絡(luò)財務(wù)報告存儲的NoSQL數(shù)據(jù)庫,探究了基于NoSQL的XBRL財務(wù)報告智能審計方法。
【關(guān)鍵詞】XBRL 財務(wù)報告 智能審計
XBRL是Extensible Business Reporting Language的縮寫,即可擴展商業(yè)報告語言,是一種全新的網(wǎng)絡(luò)財務(wù)報告形式。目前,我國財政部在全國推廣XBRL網(wǎng)絡(luò)財務(wù)報告形式,并且,上交所與深交所早在2010年就開始要求上市公司每年需要報送并披露XBRL格式的年報。XBRL作為一種全新的財務(wù)報告方式,針對它的審計鑒證成為未來研究的關(guān)鍵。
一、NoSQL及其技術(shù)優(yōu)勢
在面對大數(shù)據(jù)應(yīng)用中來源不同、擁有海量信息的數(shù)據(jù)進行整合、處理時,傳統(tǒng)的關(guān)系型數(shù)據(jù)庫在可用性、靈活性、可擴展性等特性上表現(xiàn)出明顯的缺陷,此時,一些不拘泥于固定關(guān)系模式的數(shù)據(jù)庫應(yīng)運而生,他們不再一味的遵循關(guān)系結(jié)構(gòu),于是這些數(shù)據(jù)庫被稱為NoSQL(Not Only SQL)。NoSQL數(shù)據(jù)庫一經(jīng)誕生,就受到了電子商務(wù)、社交網(wǎng)絡(luò)、定位服務(wù)等互聯(lián)網(wǎng)行業(yè)的青睞,以亞馬遜、Twitter為主要代表的大型互聯(lián)網(wǎng)公司早已正式采用NoSQL作為公司、客戶數(shù)據(jù)的存儲模式。NoSQL與傳統(tǒng)的SQL數(shù)據(jù)庫想比較有以下幾點優(yōu)勢:
(一)易擴展
NoSQL數(shù)據(jù)庫種類繁多,但是一個共同的特點都是去掉關(guān)系數(shù)據(jù)庫的關(guān)系型特性。數(shù)據(jù)之間無關(guān)系,這樣就非常容易擴展。也無形之間,在架構(gòu)的層面上帶來了可擴展的能力。
(二)大數(shù)據(jù)量,高性能
NoSQL數(shù)據(jù)庫都具有非常高的讀寫性能,尤其在大數(shù)據(jù)量下,同樣表現(xiàn)優(yōu)秀。這得益于它的無關(guān)系性,數(shù)據(jù)庫的結(jié)構(gòu)簡單。一般MySQL使用Query Cache,每次表的更新Cache就失效,是一種大粒度的Cache,在針對web2.0的交互頻繁的應(yīng)用,Cache性能不高。而NoSQL的Cache是記錄級的,是一種細粒度的Cache,所以NoSQL在這個層面上來說就要性能高很多了。
(三)靈活的數(shù)據(jù)模型
NoSQL無需事先為要存儲的數(shù)據(jù)建立字段,隨時可以存儲自定義的數(shù)據(jù)格式。而在關(guān)系數(shù)據(jù)庫里,增刪字段是一件非常麻煩的事情。如果是非常大數(shù)據(jù)量的表,增加字段簡直就是一個噩夢。這點在大數(shù)據(jù)量的web2.0時代尤其明顯。
(四)高可用
NoSQL在不太影響性能的情況,就可以方便的實現(xiàn)高可用的架構(gòu)。比如Cassandra,HBase模型,通過復(fù)制模型也能實現(xiàn)高可用。
二、適用于XBRL的幾種NoSQL數(shù)據(jù)庫
XBRL將信息顆?;?,把財務(wù)報告內(nèi)容分解成一個個信息元素(元素可以簡單理解為一個數(shù)字或者一段文字),每個元素可以單獨從報告中提取出來進行分析處理。XBRL在選取數(shù)據(jù)庫時應(yīng)當(dāng)考慮數(shù)據(jù)的增刪改查等操作的快捷方便,以及財務(wù)數(shù)據(jù)分析的統(tǒng)計、分析等功能。有兩款NoSQL數(shù)據(jù)庫是國際XBRL軟件商的應(yīng)用主流——MongoDB和Redis。
(一)MongoDB
MongoDB是一款文檔數(shù)據(jù)庫,在Mongo DB中,每一條記錄都是一個Document對象,適用于動態(tài)查詢。每一份XBRL財務(wù)報表數(shù)據(jù)都以文檔的形式存儲在MongoDB數(shù)據(jù)庫中,可以實時插入、更新或查詢新元素,具備實時財務(wù)數(shù)據(jù)存儲所需的復(fù)制及高度伸縮性。
但是,MongoDB的本身特性也限制了XBRL的部分功能使用。MongoDB文檔式存儲方式,減弱了XBRL財務(wù)信息顆?;膬?yōu)勢,各信息元素不能方便的組合、拼接,只能將整份文檔數(shù)據(jù)從數(shù)據(jù)庫中提取出,以至于不能滿足大量原子性復(fù)雜事務(wù)的操作要求。
(二)Redis
Redis是Key/Value類數(shù)據(jù)庫,主要用途在于高性能訪問。Redis的優(yōu)點在于速度快,簡單,容易維護,支持多種數(shù)據(jù)結(jié)構(gòu)。和Memcached類似,它支持存儲的value類型相對更多,包括string(字符串)、list(鏈表)、set(集合)、zset(有序集合)和hash(哈希類型)。這些數(shù)據(jù)類型都支持push/pop、add/remove及取交集并集和差集及更豐富的操作,而且這些操作都是原子性的。而原子性操作極大地契合了XBRL信息數(shù)據(jù)顆?;奶匦?,在不同財務(wù)數(shù)據(jù)組合、分析等功能需求上有著得天獨厚的優(yōu)勢。
但是,Redis的缺點是不提供數(shù)據(jù)可靠性保障,支持的功能也比較少。擴容,負載均衡,高可用方便也有明顯的不足。對于將來XBRL財務(wù)數(shù)據(jù)進一步的分析利用可能會有所阻礙。
三、智能審計與XBRL
智能審計的核心技術(shù)就是利用大數(shù)據(jù)的分析方法對審計數(shù)據(jù)進行處理轉(zhuǎn)換、挖掘利用、多維分析,以獲取更多有用的審計先做。智能審計的工作途徑有兩種:一種是直接從審計數(shù)據(jù)中發(fā)現(xiàn)疑點、線索,審計人員根據(jù)線索直接切入問題;另一種是從大量數(shù)據(jù)中發(fā)現(xiàn)疑點,審計人員根據(jù)疑點導(dǎo)向查找問題。XBRL的顆?;?、關(guān)系型、標(biāo)準(zhǔn)化、可擴展等特性極大的契合了智能審計的技術(shù)要求,將XBRL作為智能審計系統(tǒng)的數(shù)據(jù)標(biāo)準(zhǔn),可以降低審計過程中的信息交換成本,提高數(shù)據(jù)分析效率,為智能審計的實現(xiàn)提供了技術(shù)支持。
參考文獻
[1]曾志勇,劉建業(yè).基NoSQL的XBRL數(shù)據(jù)存儲研究與應(yīng)用[J].中國管理信息化,2015,(19):49-50.
[2]阮夢黎.大數(shù)據(jù)挑戰(zhàn)下的NoSQL系統(tǒng)研究[J].聊城大學(xué)學(xué)報(自然科學(xué)版),2015,(01):88-93.
[3]李偉.大數(shù)據(jù)下的NoSQL數(shù)據(jù)庫技術(shù)分析[J].信息通信,2014,(07):72-73.
[4]曹順良,宋靜,李榮,雷向欣.智能審計軟件系統(tǒng)架構(gòu)研究[J].財會通訊,2012,(16):96-97.
[5]葉煥倬,何玉凝.基于智能匹配的計算機審計數(shù)據(jù)采集技術(shù)研究[J].審計與經(jīng)濟研究,2010,(05):40-46.
[6]李立成.智能審計決策支持系統(tǒng)淺探[J].財會通訊,2009,(10):109-110.
基金項目:本文為國家自然科學(xué)基金資助項目(71271117);江蘇省自然科學(xué)基金資助項目(BK20151460);江蘇省高校自然科學(xué)基金資助項目(16KJB520021);江蘇省公共工程審計重點實驗室開放課題資助項目(GGSS2015-04);南京審計大學(xué)研究生創(chuàng)新計劃資助項目(MZ2016009)。