王 璨
赫章縣人民檢察院,貴州 赫章 553200
大數(shù)據(jù)究竟是什么?大數(shù)據(jù)既不是技術(shù)也不是產(chǎn)品[1],它是一種時代特征。大數(shù)據(jù)意味著龐大的數(shù)據(jù)量,但絕不僅僅是數(shù)據(jù)大[2]。不難看出,大數(shù)據(jù)對于不同的行業(yè)其含義會有差別,對檢察機(jī)關(guān)來說,“智慧檢務(wù)”中的大數(shù)據(jù)不是一個獨立的數(shù)據(jù)量,而是收集大量的數(shù)據(jù),根據(jù)不同的需求對相應(yīng)的數(shù)據(jù)進(jìn)行分析得出不同的結(jié)果,最后將這些數(shù)據(jù)信息進(jìn)行存儲的一個完整的數(shù)據(jù)處理過程。
大數(shù)據(jù)處理系統(tǒng)情況表
我院現(xiàn)在使用的系統(tǒng)多數(shù)屬于批量數(shù)據(jù)和交互式數(shù)據(jù)處理系統(tǒng),如統(tǒng)一業(yè)務(wù)應(yīng)用系統(tǒng)、電子卷宗系統(tǒng)、律師閱卷系統(tǒng)等。
我們更多地將圖數(shù)據(jù)處理應(yīng)用于內(nèi)部網(wǎng)站與其他。內(nèi)部網(wǎng)站匯集各類信息數(shù)據(jù),通過圖數(shù)據(jù)處理之后,在“數(shù)據(jù)統(tǒng)計”中利用統(tǒng)計圖表現(xiàn)出文章的總站提交、其他提交與發(fā)布總量的數(shù)量關(guān)系。門禁系統(tǒng)將人臉、姓名、時間這幾個節(jié)點聯(lián)系在一起,得出的分析結(jié)果就是干警職工是否在規(guī)定時間內(nèi)簽到,有無早退或遲到現(xiàn)象。指紋識別門禁系統(tǒng)更新少,對于各干警職工的指紋數(shù)據(jù)重復(fù)利用,結(jié)合指紋圖像數(shù)據(jù)精確識別各人身份。
大數(shù)據(jù)的特征是海量數(shù)據(jù),海量數(shù)據(jù)包括數(shù)據(jù)量、數(shù)據(jù)格式等,淘寶與百度的海量數(shù)據(jù)來源于不斷增長的用戶訪問量與高效的數(shù)據(jù)分析處理速度。我院的數(shù)據(jù)因為工作的特殊性局限于公安、法院,數(shù)據(jù)來源少,數(shù)據(jù)格式單一,并且公檢法司4家單位沒有形成數(shù)據(jù)共享鏈,數(shù)據(jù)量就更小了,這不符合大數(shù)據(jù)的海量數(shù)據(jù)特征。
數(shù)據(jù)的有效性(可用性)是大數(shù)據(jù)應(yīng)用的價值問題。數(shù)據(jù)質(zhì)量保證我們從海量數(shù)據(jù)中取得正確信息,現(xiàn)實工作中,我們?nèi)〉玫臄?shù)據(jù)大部分需要進(jìn)行再次篩選,如何保證數(shù)據(jù)的一致性、精確性、時效性和完整性是我們面臨的一大難題。
數(shù)據(jù)根據(jù)不同的需求還有很多隱藏價值,數(shù)據(jù)量越大,其隱藏價值越多。流式數(shù)據(jù)處理系統(tǒng)可以在實時數(shù)據(jù)中挖掘有效數(shù)據(jù),關(guān)聯(lián)性分析發(fā)現(xiàn)存在于大量數(shù)據(jù)集中的關(guān)聯(lián)關(guān)系,從而描述事物中某些共同屬性的規(guī)律和模式。我們現(xiàn)有的應(yīng)用系統(tǒng)從設(shè)計架構(gòu)上就缺乏統(tǒng)計相關(guān)分析、互信息、矩陣計算等算法設(shè)計,并且對學(xué)習(xí)性和探索性思想也不夠重視。
通過上述分析我們可以得出檢察機(jī)關(guān)現(xiàn)在處于大數(shù)據(jù)初級階段,與真正意義上的大數(shù)據(jù)還有一段距離,這需要我們持之以恒的改進(jìn)與努力,不僅僅是系統(tǒng)設(shè)計上的改變,還包括人才的培養(yǎng),思想意識上的學(xué)習(xí),未來我們將會進(jìn)入檢察機(jī)關(guān)AI時代,人工智能的普及使用是大數(shù)據(jù)應(yīng)用的發(fā)展趨勢,我們要從各方面做好準(zhǔn)備,迎接AI時代。