李東賓
摘 要 大數(shù)據(jù)這個概念近年來在越來越多的場合、被越來越多的人提及,并且經(jīng)常和云計算聯(lián)系在一起,云計算與大數(shù)據(jù)之間到底是什么關(guān)系成為熱點話題。本文對大數(shù)據(jù)與云概念進行了解讀與區(qū)分。
關(guān)鍵詞 大數(shù)據(jù) 云計算 數(shù)據(jù)挖掘 對審計影響
中圖分類號:G424 文獻標識碼:A
目前,大數(shù)據(jù)伴隨著云計算技術(shù)的發(fā)展,正在對全球經(jīng)濟社會生活產(chǎn)生巨大的影響。大數(shù)據(jù)、云計算技術(shù)給現(xiàn)代審計提供了新的技術(shù)和方法,要求審計組織和審計人員把握大數(shù)據(jù)、云計算技術(shù)的內(nèi)容與特征,促進現(xiàn)代審計技術(shù)和方法的進一步發(fā)展。
1大數(shù)據(jù)、云計算的涵義與特征
隨著云計算技術(shù)的出現(xiàn),大數(shù)據(jù)吸引了全世界越來越多的關(guān)注。哈佛大學(xué)社會學(xué)教授加里·金說:“這是一場革命,龐大的數(shù)據(jù)資源使得各個領(lǐng)域開始了量化進程,無論學(xué)術(shù)界、商界還是政府,所有領(lǐng)域都將開始這種進程。”
1.1大數(shù)據(jù)的涵義與特征
“數(shù)據(jù)”這個詞在拉丁文里是“已知”的意思,也可以理解為“事實”。2009年,“大數(shù)據(jù)”概念才逐漸開始在社會上傳播。而“大數(shù)據(jù)”概念真正變得火爆,卻是因為美國奧巴馬政府在2012年高調(diào)宣布了其“大數(shù)據(jù)研究和開發(fā)計劃”。這標志著“大數(shù)據(jù)”時代真正開始進入社會經(jīng)濟生活中來了?!按髷?shù)據(jù)”或稱巨量資料,指的是所涉及的數(shù)據(jù)量規(guī)模大到無法利用現(xiàn)行主流軟件工具,在一定的時間內(nèi)實現(xiàn)收集、分析、處理或轉(zhuǎn)化成為幫助決策者決策的可用信息?;ヂ?lián)網(wǎng)數(shù)據(jù)中心(IDC)認為“大數(shù)據(jù)”是為了更經(jīng)濟、更有效地從高頻率、大容量、不同結(jié)構(gòu)和類型的數(shù)據(jù)中獲取價值而設(shè)計的新一代架構(gòu)和技術(shù),用它來描述和定義信息爆炸時代產(chǎn)生的海量數(shù)據(jù),并命名與之相關(guān)的技術(shù)發(fā)展與創(chuàng)新。大數(shù)據(jù)具有4個特點:第一,數(shù)據(jù)體量巨大,從TB級別躍升到PB級別。第二,處理速度快,這與傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的思維的轉(zhuǎn)變,這些轉(zhuǎn)變將改變?nèi)藗兝斫夂脱芯可鐣?jīng)濟現(xiàn)象的技術(shù)和方法。主要表現(xiàn)在以下方面:
(1)是在大數(shù)據(jù)時代,不依賴抽樣分析,而可以采集和處理事物整體的全部數(shù)據(jù)。19世紀以來,當面臨大的樣本量時,人們都主要依靠抽樣來分析總體。但是,抽樣技術(shù)是在數(shù)據(jù)缺乏和取得數(shù)據(jù)受限制的條件下不得不采用的一種方法,這其實是一種人為的限制。過去,因為記錄、儲存和分析數(shù)據(jù)的工具不夠科學(xué),只能收集少量數(shù)據(jù)進行分析。如今,科學(xué)技術(shù)條件已經(jīng)有了很大的提高,雖然人類可以處理的數(shù)據(jù)依然是有限的,但是可以處理的數(shù)據(jù)量已經(jīng)大量增加,而且未來會越來越多。隨著大數(shù)據(jù)分析取代抽樣分析,社會科學(xué)不再單純依賴于抽樣調(diào)查和分析實證數(shù)據(jù),現(xiàn)在可以收集過去無法收集到的數(shù)據(jù),更重要的是,現(xiàn)在可以不再依賴抽樣分析。
(2)是在大數(shù)據(jù)時代,不再熱衷于追求數(shù)據(jù)的精確度,而是追求利用數(shù)據(jù)的效率。當測量事物的能力受限制時,關(guān)注的是獲取最精確的結(jié)果。但是,在大數(shù)據(jù)時代,追求精確度已經(jīng)既無必要又不可行,甚至變得不受歡迎。大數(shù)據(jù)紛繁多樣,優(yōu)劣摻雜,精準度已不再是分析事物總體的主要手段。擁有了大數(shù)據(jù),不再需要對一個事物的現(xiàn)象深究,只要掌握事物的大致發(fā)展趨勢即可,更重要的是追求數(shù)據(jù)的及時性和使用效率。與依賴于小數(shù)據(jù)和精確性的時代相比較,大數(shù)據(jù)更注重數(shù)據(jù)的完整性和混雜性,幫助人們進一步認識事物的全貌和真相。
(3)是在大數(shù)據(jù)時代,人們難以尋求事物直接的因果關(guān)系,而是深入認識和利用事物的相關(guān)關(guān)系。長期以來,尋找因果關(guān)系是人類發(fā)展過程中形成的傳統(tǒng)習(xí)慣。尋求因果關(guān)系即使很困難且用途不大,但人們無法擺脫認識的傳統(tǒng)思維。在大數(shù)據(jù)時代,人們不必將主要精力放在事物之間因果關(guān)系的分析上,而是將主要精力放在尋找事物之間的相關(guān)關(guān)系上。事物之間的相關(guān)關(guān)系可能不會準確地告知事物發(fā)生的內(nèi)在原因,但是它會提醒人們事情之間的相互聯(lián)系。人們可以通過找到一個事物的良好相關(guān)關(guān)系,幫助其捕捉到事物的現(xiàn)在和預(yù)測未來。
1.2云計算的涵義與特征
“云計算”概念產(chǎn)生于谷歌和IBM等大型互聯(lián)網(wǎng)公司處理海量數(shù)據(jù)的實踐。2006年8月9日,Google首席執(zhí)行官埃里克·施密特在搜索引擎大會首次提出“云計算”的概念。2007年10月,Google與IBM開始在美國大學(xué)校園推廣云計算技術(shù)的計劃,這項計劃希望能降低分布式計算技術(shù)在學(xué)術(shù)研究方面的成本,并為這些大學(xué)提供相關(guān)的軟硬件設(shè)備及技術(shù)支持。目前全世界關(guān)于“云計算”的定義有很多?!霸朴嬎恪笔腔诨ヂ?lián)網(wǎng)的相關(guān)服務(wù)的增加、使用和交付模式,是通過互聯(lián)網(wǎng)來提供動態(tài)易擴展且經(jīng)常是虛擬化的資源。美國國家標準技術(shù)研究院2009年關(guān)于云計算的定義是:“云計算是一種按使用量付費的模式,這種模式提供可用的、便捷的、按需的網(wǎng)絡(luò)訪問,進入可配置的計算資源共享池(資源包括網(wǎng)絡(luò)、服務(wù)器、存儲、應(yīng)用軟件、服務(wù)等),這些資源能夠被快速提供,只需投入很少的管理工作,或與服務(wù)供應(yīng)商進行很少的交互。”根據(jù)這一定義,云計算的特征主要表現(xiàn)為:首先,云計算是一種計算模式,具有時間和網(wǎng)絡(luò)存儲的功能。其次,云計算是一條接入路徑,通過廣泛接入網(wǎng)絡(luò)以獲取計算能力,通過標準機制進行訪問。第三,云計算是一個資源池,云計算服務(wù)提供商的計算資源,通過多租戶模式為不同用戶提供服務(wù),并根據(jù)用戶的需求動態(tài)提供不同的物理的或虛擬的資源。第四,云計算是一系列伸縮技術(shù),在信息化和互聯(lián)網(wǎng)環(huán)境下的計算規(guī)??梢钥焖贁U大或縮小,計算能力可以快速、彈性獲得。第五,云計算是一項可計量的服務(wù),云計算資源的使用情況可以通過云計算系統(tǒng)檢測、控制、計量,以自動控制和優(yōu)化資源使用。
2兩者的區(qū)別與聯(lián)系
大數(shù)據(jù)的超大容量自然需要容量大,速度快,安全的存儲,滿足這種要求的存儲離不開云計算。高速產(chǎn)生的大數(shù)據(jù)只有通過云計算的方式才能在可等待的時間內(nèi)對其進行處理。同時,云計算是提高對大數(shù)據(jù)的分析與理解能力的一個可行方案。大數(shù)據(jù)的價值也只有通?過數(shù)據(jù)挖掘才能從低價值密度的數(shù)據(jù)中發(fā)現(xiàn)其潛在價值,而大數(shù)據(jù)挖掘技術(shù)的實現(xiàn)離不開云計算技術(shù)。總之,云計算是大數(shù)據(jù)處理的核心支撐技術(shù),是大數(shù)據(jù)挖掘的主流方式。沒有互聯(lián)網(wǎng),就沒有虛擬化技術(shù)為核心的云計算技術(shù),沒有云計算就沒有大數(shù)據(jù)處理的支撐技術(shù)。
參考文獻
[1] 鄧川,楊文鶯.云審計對會計事務(wù)所的機遇、挑戰(zhàn)及對策[J].財會研究,2012(02):1214.
[2] Michael,M.云計算[M].姜進磊譯.機械工業(yè)出版,2009.
[3] 張為民.云計算:深刻改變未來[M].科學(xué)出版社,2009.