王磊WANG Lei
(成都銀杏酒店管理學院,成都611743)
預計到2024年,全球創(chuàng)建的數(shù)據(jù)量將達143ZB,作為人工智能賴以發(fā)展的重要資源,大數(shù)據(jù)的核心價值在于預測,即對海量數(shù)據(jù)進行存儲和分析,把數(shù)學算法運用到海量的數(shù)據(jù)上來預測事件發(fā)生的可能性。大數(shù)據(jù)已經(jīng)滲透到每一個行業(yè),逐漸成為重要的生產(chǎn)要素?;ヂ?lián)網(wǎng)終端的普及使企業(yè)可以通過互聯(lián)網(wǎng)業(yè)務的開展而獲取海量數(shù)據(jù),再通過數(shù)據(jù)挖掘等技術手段創(chuàng)造商業(yè)價值,這就成為互聯(lián)網(wǎng)企業(yè)在并不盈利的情況下仍然可以獲得高估值的重要原因。這些商業(yè)現(xiàn)象也為企業(yè)會計理論研究帶來了新的課題:是否應該以及如何才能將數(shù)據(jù)資源在企業(yè)財務報表中予以反映。
1.2.1 多樣化的價值實現(xiàn)方式
大數(shù)據(jù)按獲取方式來劃分,可以分為結構化數(shù)據(jù)、非結構化數(shù)據(jù)和半結構化數(shù)據(jù)。第一種是結構化數(shù)據(jù),是指能夠用數(shù)據(jù)或統(tǒng)一的結構加以表示的信息,稱之為結構化數(shù)據(jù);第二種是非結構化數(shù)據(jù),是指其字段長度可變,并且每個字段的記錄又可以由可重復的或不可重復的子字段構成的數(shù)據(jù)庫。第三種是半結構化數(shù)據(jù),是介于完全結構化數(shù)據(jù)和完全無結構的數(shù)據(jù)之間的數(shù)據(jù)。數(shù)據(jù)的不同類型分別具有不同的價值實現(xiàn)方式,結構化的數(shù)據(jù)價值實現(xiàn)具有相對確定性。而半結構化和非結構化數(shù)據(jù)占比高(這兩類約占數(shù)據(jù)總量的90%),又集中了價值挖掘的最大機會,但卻受制于價值密度、時效性、數(shù)據(jù)挖掘技術等不確定性因素,因而其價值實現(xiàn)方式具有高度不確定性。
1.2.2 價值變現(xiàn)具有多種不確定性
大數(shù)據(jù)的價值絕大部分來源于非結構化數(shù)據(jù)和半結構化數(shù)據(jù),其價值實現(xiàn)具有不確定性,其特殊性可分為三大因素:
①數(shù)據(jù)資源在產(chǎn)權歸屬所導致的不確定性。
資產(chǎn)的定義強調(diào)為企業(yè)所擁有或控制,而由于數(shù)據(jù)的可復制性,且不具有排他性,因而數(shù)據(jù)的控制權或所有權是虛無的。從數(shù)據(jù)價值實現(xiàn)的角度來看,決定其價值實現(xiàn)的因素主要取決于“被誰使用”而非“為誰所有”,這就可能導致企業(yè)使用了產(chǎn)權有爭議的數(shù)據(jù)資源而遭遇到法律風險??梢?,數(shù)據(jù)資源難以為企業(yè)所絕對控制或擁有,不能符合傳統(tǒng)的資產(chǎn)的定義。
②主要由于主觀因素所導致的不確定性。
第一,使用者選擇的使用場景導致數(shù)據(jù)資源價值的變化。不同地區(qū)之間、不同企業(yè)之間或者同一企業(yè)的不同業(yè)務場景之間的差異,都會對數(shù)據(jù)資源的使用壽命產(chǎn)生影響。受到企業(yè)的戰(zhàn)略規(guī)劃、發(fā)展階段以及主營業(yè)務類型等影響,同樣的數(shù)據(jù)資源在不同業(yè)務場景下有著不同的價值實現(xiàn)方式。
第二,使用頻率也會影響數(shù)據(jù)資源價值變現(xiàn)。與常規(guī)資產(chǎn)不同的是,常規(guī)資產(chǎn)通常會隨著使用次數(shù)的增加而發(fā)生折舊,使用次數(shù)往往有限,但數(shù)據(jù)資源使用的次數(shù)無限,而且數(shù)據(jù)的價值就是從使用中產(chǎn)生的,不經(jīng)使用的數(shù)據(jù)一文不值。
第三,數(shù)據(jù)采集與挖掘等技術的水平使得價值變現(xiàn)具有不確定性。當今全球數(shù)據(jù)量飛速增長的同時,不可避免地存在著大量高價值的數(shù)據(jù)沒有被收集和挖掘,以至于處于“價值沉睡”的狀態(tài)。不同類型數(shù)據(jù)挖掘的技術對數(shù)據(jù)的價值實現(xiàn)也存在差異。
③主要由于數(shù)據(jù)自身的特性所導致的不確定性。
第一,數(shù)據(jù)的安全性使得價值變現(xiàn)具有不確定性。確保數(shù)據(jù)安全是數(shù)據(jù)價值實現(xiàn)的前提條件。以運營商為例,其所擁有的都是最直接反映用戶身份、行為的數(shù)據(jù),必須在保護用戶隱私的前提下使用數(shù)據(jù),才能合法創(chuàng)造價值,因此,需要加強數(shù)據(jù)安全管理。
第二,數(shù)據(jù)是否具備潛在價值具有不確定性。在上述提到的影響著數(shù)據(jù)資源價值的因素之外,還有很多不確定性因素都在制約其價值變現(xiàn)。譬如,來自證券交易所的分時行情數(shù)據(jù)與實時報價數(shù)據(jù),對于短線操作股民具有更高價值,但對欺詐檢測的價值卻不顯著。因此,還存在著諸如用戶差異等不確定性。
第三,數(shù)據(jù)資源的價值密度導致價值變現(xiàn)具有不確定性。大數(shù)據(jù)因其容量巨大,其價值往往是潛在的,需要通過挖據(jù)才能得以顯現(xiàn)。然而,當大數(shù)據(jù)時代來臨,企業(yè)需要存儲和處理的數(shù)據(jù)量激增,數(shù)據(jù)的結構和來源更是紛繁復雜,這會導致數(shù)據(jù)的價值密度降低。
1.2.3 文獻回顧
近年來,大多數(shù)數(shù)據(jù)資產(chǎn)的研究都明確主張應該將企業(yè)的數(shù)據(jù)資源進行表內(nèi)核算,李如(2017)論證了大數(shù)據(jù)確認為資產(chǎn)的必要性和可能性,并提出了確認條件,包括大數(shù)據(jù)須經(jīng)過整理分析,并處于可利用狀態(tài),對其的控制權必須合法等[1]。很多學者采用與之類似的思路,從會計準則的角度來探討數(shù)據(jù)資源是否符合資產(chǎn)的定義和確認條件,認為數(shù)據(jù)資源在一定條件下可以確認為資產(chǎn),并納入企業(yè)資產(chǎn)負債表核算[2]-[8]。還有很多學者默認企業(yè)應該確認數(shù)據(jù)資產(chǎn),即越過了對數(shù)據(jù)資產(chǎn)會計確認的研究,而直接探討數(shù)據(jù)資產(chǎn)的價值計量問題,提出了基于市場法、收益法以及層次分析等方法的數(shù)據(jù)資產(chǎn)價值評估模型[9]-[12]。祝子麗,倪杉(2018)以2002-2017年CNKI數(shù)據(jù)庫收錄的488篇數(shù)據(jù)資產(chǎn)研究的期刊論文為樣本,從其提煉出的數(shù)據(jù)資產(chǎn)會計核算研究的28個關鍵字詞來看,“會計確認”尚未進入其中[13]。
通過對比分析,現(xiàn)有研究還存在有待突破之處。
第一,很少探討數(shù)據(jù)資產(chǎn)的會計確認,深入研究其內(nèi)在規(guī)律,而大多文章都將數(shù)據(jù)資產(chǎn)的會計確認與計量置于一起來研究,或越過數(shù)據(jù)資產(chǎn)的會計確認而直接探討其會計計量的問題。然而,從會計核算的規(guī)范來看,一項經(jīng)濟資源應該是先得以確認,而后再進行計量。如果無法確認,那么也無從計量。
第二,探討數(shù)據(jù)資產(chǎn)會計確認時,沒有考慮到數(shù)據(jù)資源變現(xiàn)所面臨的諸多不確定性,也沒有對數(shù)據(jù)資源分類討論,而是通過規(guī)范性分析直接得出應否確認為資產(chǎn)的結論,顯得籠統(tǒng)。
第三,現(xiàn)有研究關于會計確認的探討都使用定性的規(guī)范性分析方法,確認定量分析,所得出的判斷有失精確性,也難以應用于會計實務工作。
有鑒于此,本文聚焦于數(shù)據(jù)資產(chǎn)會計確認,探討符合會計規(guī)范的數(shù)據(jù)資產(chǎn)的確認方法及應用。
為了有效提高數(shù)據(jù)資產(chǎn)會計確認的精度和速度,文章通過模擬某家公司的財務部門對數(shù)據(jù)資產(chǎn)會計確認的30條數(shù)據(jù),結合數(shù)字資產(chǎn)類型進行離散化處理,通過機器學習來構建數(shù)據(jù)資產(chǎn)會計確認的模型。最后,基于此模型,利用樸素貝葉斯算法求出該模型的最大后驗概率分布,從而給出針對該數(shù)據(jù)資產(chǎn)會計確認的職業(yè)判斷。
樸素貝葉斯會計確認模型的構建流程如下:
輸出:實例x的分類。
第一步,計算先驗概率。
第二步,計算條件概率。
第四步,計算并確定實例x的分類。
本節(jié)將模擬某家公司的財務部門對數(shù)據(jù)資產(chǎn)會計確認的30條數(shù)據(jù),結合數(shù)字資產(chǎn)類型進行離散化處理,通過機器學習構建數(shù)據(jù)資產(chǎn)會計確認的模型。下面分別以數(shù)據(jù)的產(chǎn)權歸屬x(1),數(shù)據(jù)時效性x(2),數(shù)據(jù)使用場景x(3),數(shù)據(jù)的價值密度x(4),數(shù)據(jù)的使用頻率x(5),數(shù)據(jù)挖掘的技術水平x(6),數(shù)據(jù)的整合性x(7),數(shù)據(jù)的安全性x(8),數(shù)據(jù)的潛在價值x(9)作為特征;以予以表內(nèi)確認c1,予以表外披露c2,無需確認c3,即作為數(shù)據(jù)資產(chǎn)會計確認類型類標記,建立數(shù)據(jù)資產(chǎn)會計確認模型,如表1、表2所示。
表1 數(shù)據(jù)資產(chǎn)會計確認模型中的特征()分類
表1 數(shù)據(jù)資產(chǎn)會計確認模型中的特征()分類
?
表2 數(shù)據(jù)資產(chǎn)會計確認模型中的判斷結論(Y)分類
通過問卷調(diào)查的方法,收集30名專家對該公司數(shù)據(jù)資產(chǎn)會計確認的判斷數(shù)據(jù),再進行離散化處理,獲得離散化的數(shù)據(jù)資產(chǎn)會計確認模型。然后,根據(jù)樸素貝葉斯算法對收集到的30位專家給出的數(shù)據(jù)運用Matlab程序計算出模型的先驗概率及條件概率。若給定X={X(1)=1,X(2)=1,X(3)=3,X(4)=2,X(5)=3,X(6)=1,X(7)=1,X(8)=1,X(9)=1,時,則相應的后驗概率分別如下:
因為Y=1時,后驗概率最大,因此得出判斷,應該“予以表內(nèi)確認”。
這表明,若該公司的數(shù)據(jù)資源表現(xiàn)出的特征為:X(1)為“有明確產(chǎn)權歸屬”、X(2)為“時效性強”、X(3)為“使用場景不確定”、X(4)為“價值密度為中等”、X(5)為“使用頻率低”、X(6)為“數(shù)據(jù)挖掘的技術水平”、X(7)為“數(shù)據(jù)的整合性強”、X(8)為“數(shù)據(jù)的安全級別高”、X(9)為“數(shù)據(jù)的潛在價值大”時,可以得出結論,應該在表內(nèi)予以確認。
通過構建數(shù)據(jù)資產(chǎn)的會計確認模型,利用樸素貝葉斯算法求解模型的最大后驗概率分布,判斷企業(yè)的數(shù)據(jù)資源的會計確認類型。由于在會計實務中,會計師進行職業(yè)判斷存在著不可避免的主觀因素而會影響企業(yè)信息披露的準確性,該模型也無法全面排除主觀因素,但是該方法可以為企業(yè)數(shù)據(jù)資源的會計確認開辟新的思路。