亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        審計全覆蓋中大數(shù)據(jù)技術(shù)的應(yīng)用

        2018-07-26 03:53:40祁學(xué)棟
        環(huán)球市場信息導(dǎo)報 2018年18期
        關(guān)鍵詞:數(shù)據(jù)量語句工作者

        祁學(xué)棟

        此次研究將理論與實務(wù)有效融合,以醫(yī)保審計為例,在其間應(yīng)用Hadoop、云計算等技術(shù),對以往軟硬件技術(shù)處理大量數(shù)量慢、錯誤率高等問題予以解決,大幅提升了審計質(zhì)量及效率。并且,還通過運用跨行業(yè)數(shù)據(jù)關(guān)聯(lián)、聚類等大數(shù)據(jù)挖掘技術(shù),對審計組開展工作提供幫助,有效改進了工作效率,不但給審計全覆蓋給予了技術(shù)支撐,也為日后大數(shù)據(jù)審計的實施給予了新思路。

        伴同我國社會經(jīng)濟的迅猛發(fā)展以及改革的持續(xù)深化,便需對公共、國有資產(chǎn)與國有資源等落實經(jīng)濟責(zé)任的狀況實施審計全覆蓋。但實際上,實施審計全覆蓋具有較大困難,其所應(yīng)對的最大問題即需針對各大行業(yè)海量數(shù)據(jù)信息、圖片等加以處理,如此便對當(dāng)前的審計技術(shù)運用、數(shù)據(jù)收集等帶來了較大抨擊。在此形勢下,經(jīng)由應(yīng)用大數(shù)據(jù)技術(shù)便可將上述問題有效處理,其不但與大數(shù)據(jù)時代發(fā)展需求相符,也屬于執(zhí)行黨中央、國務(wù)院有關(guān)強化審計監(jiān)督的關(guān)鍵?;诖?,針對審計實務(wù)里面大數(shù)據(jù)技術(shù)的應(yīng)用予以研討具備顯著的學(xué)術(shù)及運用價值。此次研究把計算機、審計學(xué)等相應(yīng)理論和審計實務(wù)有效銜接,將大數(shù)據(jù)技術(shù)引進到醫(yī)保審計中,顯著改善了審計質(zhì)量與效率,給大數(shù)據(jù)時代下審計工作的實施給予了新路徑。

        一、創(chuàng)設(shè)醫(yī)保審計大數(shù)據(jù)體系

        當(dāng)前,醫(yī)保大數(shù)據(jù)審計需解決的最大難題即數(shù)據(jù)量巨大。為處理以往設(shè)備和方式收集難度大、資源損耗嚴重、數(shù)據(jù)處理分析效率不高等問題,此次研究應(yīng)用Hadoop框架,構(gòu)建形成了醫(yī)保審計大數(shù)據(jù)體系。

        借助Hadoop集群技術(shù)以增強數(shù)據(jù)處理水平。依照審計署要求與醫(yī)保審計實際需求,此次研究對湖南省人社、衛(wèi)計、民政與公積金四大部門設(shè)計了23張標(biāo)準(zhǔn)表,對醫(yī)保、新農(nóng)合等部門數(shù)據(jù)加以采集,合計7TB。如此龐大的數(shù)據(jù)量借助以往的審計方式難以實施,加之醫(yī)保審計時間緊張、收集整理與分析任務(wù)繁重,故強化數(shù)據(jù)處理能力便成為了建設(shè)基礎(chǔ)設(shè)施層的關(guān)鍵。

        Hadoop屬于以Java為基礎(chǔ)構(gòu)建形成的開源軟件框架,主要是位于較多計算機構(gòu)成的集群里面針對龐大的數(shù)據(jù)信息加以存儲、實施分布式計算。其意義在于由單一的服務(wù)器擴張至數(shù)千臺機器,所有單臺機均能夠?qū)嵤┍镜赜嬎闩c存儲。該框架的優(yōu)勢即成本投入不高,用戶不受限制,不但可對大規(guī)模數(shù)據(jù)予以處理,還可以對程序員工作進行精簡,達成計算調(diào)度管理、負載均衡等目的。同時,該框架的主要設(shè)計即分布式文件系統(tǒng)( HDFS)與計算框架( MapReduce),前者主要適用到存儲大量數(shù)據(jù)的計算中。

        在醫(yī)保審計里面先施行模擬壓力測試,經(jīng)由當(dāng)前數(shù)據(jù)加以復(fù)制、更改,模擬當(dāng)?shù)仡A(yù)期數(shù)據(jù)量,對服務(wù)器數(shù)據(jù)承載和計算壓力予以測試,依照結(jié)果借助Hadoop集群技術(shù)創(chuàng)設(shè)服務(wù)器集群,以處理海量數(shù)據(jù)分析效率不高的問題。結(jié)果表明,把5臺容量為512G的服務(wù)器經(jīng)由Hadoop集群技術(shù)整合為1臺服務(wù)器,其處理數(shù)據(jù)的能力較之單臺服務(wù)器要上漲5倍。

        借助分布式文件系統(tǒng)以強化數(shù)據(jù)容錯能力。針對湖南省醫(yī)保數(shù)據(jù)收集期間,由于各區(qū)域應(yīng)用系統(tǒng)眾多且匱乏統(tǒng)一性,故依照分級采集市州匯總原則開展工作。抽取匯總上報數(shù)據(jù)統(tǒng)一創(chuàng)設(shè)數(shù)據(jù)庫期間,假設(shè)選擇以往關(guān)系數(shù)據(jù)庫的文件存儲方法,則一旦某一數(shù)據(jù)錯誤,那么便應(yīng)編寫語句針對整個數(shù)據(jù)庫實施錯誤數(shù)據(jù)刪除,不但耗時且操作繁瑣。故而,為對數(shù)據(jù)容錯能力較差的情況予以處理,此次研究將選擇分布式文件系統(tǒng)(HDFS)為底層結(jié)構(gòu)。其主要用于大量數(shù)據(jù)的分布式存儲,能把較多計算機借助通信網(wǎng)絡(luò)整合,在統(tǒng)一管理系統(tǒng)的控制下,協(xié)同達成大規(guī)模數(shù)據(jù)處理任務(wù)。并且,其在文件存儲寫入期間,把文件劃分為文件塊,分散存儲于所有子節(jié)點主機中,但文件基礎(chǔ)信息依舊存儲于主節(jié)點,其優(yōu)勢即易拓展、容錯性好、經(jīng)濟適用性高。通過HDFS把百余個區(qū)域的數(shù)據(jù)依照行政區(qū)域代碼自主分布存儲于4臺子節(jié)點服務(wù)器中,且基于此產(chǎn)生若干副本,假設(shè)其間某一數(shù)據(jù)發(fā)生錯誤,則其他副本經(jīng)由便捷操作能及時恢復(fù)。

        借助達夢數(shù)據(jù)庫與Hive數(shù)據(jù)倉庫處理工具以改善數(shù)據(jù)采集加載效率。對大量醫(yī)保數(shù)據(jù)抽取加載期間,為處理以往的關(guān)系數(shù)據(jù)庫僅能將數(shù)據(jù)存儲于服務(wù)器本地的文件系統(tǒng)、無法應(yīng)用HDFS處理大量數(shù)據(jù)與審計工作者習(xí)慣選擇SOL分析數(shù)據(jù)等問題,此次研究嘗試選擇Hive集成國產(chǎn)達夢軟件創(chuàng)設(shè)數(shù)據(jù)倉庫。

        Hive是以Hadoop為基礎(chǔ)構(gòu)建形成的數(shù)據(jù)倉庫處理工具,在數(shù)據(jù)提取加載(ETL)方面極為便捷,是一項能夠存儲、查詢與分析存儲于Hadoop分布式文件系統(tǒng)里面的大數(shù)據(jù)機制。盡管較之關(guān)系數(shù)據(jù)庫而言,其具有擴張自身存儲性能的作用,以及較好的計算能力,然而在面向大量數(shù)據(jù)運用時,數(shù)據(jù)挖掘、實效性不足,故此次研究應(yīng)用國產(chǎn)關(guān)系數(shù)據(jù)庫達夢軟件集成應(yīng)用。

        Hive達成了醫(yī)保數(shù)據(jù)的迅速分布式存儲,然而其間如果存儲表、字段名等元數(shù)據(jù)信息需持續(xù)更新、變動,因分布式文件系統(tǒng)里面的數(shù)據(jù)以多讀少改為主,故無法把元數(shù)據(jù)存儲到Hive里面。因而,為縮減檢索期間執(zhí)行語義檢查的時間,且確保數(shù)據(jù)實時查詢,便可通過國產(chǎn)達夢數(shù)據(jù)庫對元數(shù)據(jù)予以存儲,其語法和SOL相似,且導(dǎo)入各類型表格、數(shù)據(jù)等極為便捷。

        借助MapReduce、分布式SQL引擎處理技術(shù)以改善數(shù)據(jù)分析效率。對審計數(shù)據(jù)分析期間,審計工作者往往需應(yīng)對如下問題:其一,審計工作者編寫的分析語句總需反復(fù)測試,依照結(jié)果多次修改SOL語句,但醫(yī)保數(shù)據(jù)量龐大,位于全庫中直接編寫語句、測試時間較長;其二,分析任務(wù)繁重,但Hadoop體系會損耗較多資源,單次僅可執(zhí)行1條查詢語句。

        為處理上述問題,此次研究借助MapReduce、分布式SQL引擎處理技術(shù)的同步應(yīng)用并行計算對數(shù)據(jù)分析處理。其間,前者以HDFS為基礎(chǔ)針對存儲于分布式文件系統(tǒng)的數(shù)據(jù)實施分布式計算,該框架軟件位于彼此協(xié)同的并行計算機中把大的祭祀環(huán)任務(wù)劃分為若干小任務(wù),經(jīng)由一組計算機并行實施,提高計算效率;后者通過定制查詢、執(zhí)行引擎、相應(yīng)操作符對SQL語法提供支撐,數(shù)據(jù)分析迅速且具備實效性,數(shù)據(jù)處理位于內(nèi)存中實施,且具有復(fù)雜查詢等功能。

        在醫(yī)保審計數(shù)據(jù)分析環(huán)節(jié),先要在所有市州標(biāo)準(zhǔn)SQL庫編寫測試語句,將大大任務(wù)區(qū)分成若干小任務(wù)協(xié)同分析,在語句更正后統(tǒng)計到全庫運行。因MapReduce計算框架主要以批處理任務(wù)為主,故伴同數(shù)據(jù)量的加大,應(yīng)用其實施簡單的數(shù)據(jù)檢索便會耗費較長時間,故無法與交互式查詢需求相符,此時正好適用分布式SOL查詢引擎。因而,此次研究經(jīng)由運用并行計算、依照分布式SOL引擎特性對分析任務(wù)通盤規(guī)劃,以節(jié)省數(shù)據(jù)分析時間。

        定制開發(fā)實用型工具以改進審計質(zhì)量及效率。醫(yī)保審計期間,審計工作者會具有如下問題:各區(qū)域應(yīng)用系統(tǒng)匱乏統(tǒng)一性,導(dǎo)人數(shù)據(jù)不標(biāo)準(zhǔn),基礎(chǔ)數(shù)據(jù)質(zhì)量不足,使得分析效果較差;審計工作者語句編寫習(xí)慣有差異,合庫后會反復(fù)調(diào)整投入使用,浪費時間;分析獲知的結(jié)果需切分發(fā)放到若干審計組核實,任務(wù)量龐大、繁雜。

        為處理上述問題,此次研究進行了實用工具的開發(fā),具體為數(shù)據(jù)校驗工具,依據(jù)標(biāo)準(zhǔn)表要求針對其結(jié)構(gòu)、值域檢驗,在市州數(shù)據(jù)上報前通過該工具對數(shù)據(jù)檢測、修改,以保障基礎(chǔ)數(shù)據(jù)質(zhì)量;表名翻譯工具,其能把中文表、字段名編寫SQL語句變換成中文拼音的首字母版本,讓其能位于Hive里面直接應(yīng)用;數(shù)據(jù)切分工具,通過行政區(qū)劃代碼為數(shù)據(jù)切分依據(jù),把集中分析結(jié)果自主發(fā)放到所有審計組。

        二、審計全覆蓋中大數(shù)據(jù)技術(shù)的具體應(yīng)用

        怎樣與目前的大數(shù)據(jù)環(huán)境貼合,于被審計單位龐大的數(shù)據(jù)中挖掘有效信息是審計過程中最需處理的問題。本章節(jié)依舊以湖南省醫(yī)保審計為例,對大數(shù)據(jù)技術(shù)的具體應(yīng)用進行闡述。

        應(yīng)用跨部門、跨領(lǐng)域數(shù)據(jù)關(guān)聯(lián)分析,揭示醫(yī)保政策執(zhí)行、管理問題。醫(yī)保審計分析思路強調(diào)醫(yī)保資金應(yīng)用的真實有效性,具有的醫(yī)保待遇有無契合政策界定,經(jīng)由各部門數(shù)據(jù)關(guān)聯(lián)分析,查找契合規(guī)制但不具備醫(yī)保待遇等問題。首先,把該省城鎮(zhèn)職工、居民醫(yī)保等和民政低保人員信息關(guān)聯(lián)對比分析,對特困人員沒有參保與反復(fù)資助等異常數(shù)據(jù)篩選;其次,把該省城鎮(zhèn)職工、居民醫(yī)保等信息和人社死亡人員信息等關(guān)聯(lián)分析,將死亡后依舊繳費等可疑數(shù)據(jù)篩選;最后,把該省社保經(jīng)辦機構(gòu)、定點醫(yī)療組織工作者信息與其配偶信息和工商登記信息關(guān)聯(lián)分析,將經(jīng)辦機構(gòu)等可疑數(shù)據(jù)篩選。經(jīng)由此,不但能夠給審計工作者正確有效定位疑點提供了幫助,且還顯著提升了其取證率及審計質(zhì)量。

        借助聚類技術(shù)以發(fā)現(xiàn)非法騙取醫(yī)保基金等問題。將大數(shù)據(jù)技術(shù)應(yīng)用到醫(yī)保審計能針對醫(yī)院收入真實可靠性予以分析,獲知離群結(jié)果,發(fā)現(xiàn)醫(yī)院非法騙取醫(yī)?;鸬目梢蓴?shù)據(jù)。先通過R語言文本挖掘工具,針對醫(yī)院治療項目分門別類,此次審計囊括該省千余家醫(yī)院,治療項目稱謂具有較大差異,例如“床位費”,其將近兩千余種表述模式,通過R語言文本挖掘工具里面的醫(yī)學(xué)詞匯針對項目名稱實施文本分詞,均并入到“床位費”,依照此分詞方式,得出三千多個項目名稱。而后,經(jīng)由聚類分析技術(shù),對疑點醫(yī)院、治療項目予以鎖定,基于分詞結(jié)果數(shù)據(jù),依照醫(yī)院與治療項目名稱劃分組別,把匯總數(shù)量、收入總數(shù)值當(dāng)做觀測值,構(gòu)建產(chǎn)生匯總矩陣,把離群醫(yī)院與治療項目和其有關(guān)的觀測值視為審計疑點,從而實施調(diào)查。借助該技術(shù)能給審計工作者獲知審計疑點提供幫助,且改善工作效率。

        本文具體針對審計全覆蓋中大數(shù)據(jù)技術(shù)的應(yīng)用進行了分析,以湖南省醫(yī)保審計為例,對大數(shù)據(jù)技術(shù)的具體應(yīng)用進行了探索、討論,通過應(yīng)用Hadoop軟件框架、HDFS、Hive等對大量審計數(shù)據(jù)存儲、分析。并且,為與被審計單位數(shù)據(jù)量驟增的態(tài)勢契合,通過大數(shù)據(jù)技術(shù)的應(yīng)用能幫助審計工作者明確審計疑點,改善其工作質(zhì)量與效率。

        猜你喜歡
        數(shù)據(jù)量語句工作者
        關(guān)愛工作者之歌
        基于大數(shù)據(jù)量的初至層析成像算法優(yōu)化
        致敬科技工作者
        我們
        ——致敬殯葬工作者
        黃河之聲(2021年2期)2021-03-29 01:20:20
        計算Lyapunov指數(shù)的模糊C均值聚類小數(shù)據(jù)量法
        高刷新率不容易顯示器需求與接口標(biāo)準(zhǔn)帶寬
        重點:語句銜接
        寬帶信號采集與大數(shù)據(jù)量傳輸系統(tǒng)設(shè)計與研究
        電子制作(2019年13期)2020-01-14 03:15:18
        普法工作者的“生意經(jīng)”
        精彩語句
        国产成+人+综合+亚洲 欧美| 免费看黄在线永久观看| 亚洲一区二区女优av| 亚洲日本一区二区在线观看 | 国产乱人伦精品一区二区| 日本激情网址| 少妇高潮无码自拍| 亚洲综合免费在线视频| 国产精品亚洲综合久久系列| 日韩亚洲无吗av一区二区| 亚洲av中文无码乱人伦在线观看| 少妇人妻在线无码天堂视频网 | 2021国产精品久久| 精品一区二区亚洲一二三区| 蜜臀av一区二区三区久久| 亚洲av成人精品一区二区三区| 成年女人粗暴毛片免费观看| 骚小妹影院| 九九久久国产精品大片| 国产白浆流出一区二区| 亚州终合人妖一区二区三区| 欧美疯狂性受xxxxx喷水| 国产av夜夜欢一区二区三区| 亚洲av第一页国产精品| 久久国产精久久精产国| 久久九九青青国产精品| 中文字幕人妻丝袜成熟乱| av免费一区在线播放| 青青草免费在线视频久草| 亚洲2022国产成人精品无码区| 18禁成人黄网站免费观看| 鲁鲁鲁爽爽爽在线视频观看| 国产成人av一区二区三区在线| 日韩久久久久中文字幕人妻| 日本熟妇视频在线中出| 中文字幕女同人妖熟女| 国产精品爽爽ⅴa在线观看 | 久青草久青草视频在线观看| 国产自在自线午夜精品视频在| 蜜桃视频在线免费观看一区二区| 字幕网中文字幕精品一区|