亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于大數(shù)據(jù)的信息化整合方法及建議

        2021-04-11 05:29:45趙昕暉郭智強
        甘肅科技 2021年17期
        關鍵詞:結構化數(shù)據(jù)挖掘決策

        趙昕暉,郭智強

        (1.甘肅省科學技術情報研究所,2 甘肅省物產(chǎn)集團有限責任公司,甘肅 蘭州 730000)

        在全球信息化這一時代大背景下,各個應用系統(tǒng)產(chǎn)生了大量的數(shù)據(jù)資源,由此整合數(shù)據(jù)資源及提升數(shù)據(jù)價值的需求也日益增長,并進一步推動了大數(shù)據(jù)和云計算技術的快速發(fā)展。大數(shù)據(jù)是信息化建設中產(chǎn)生的各類數(shù)據(jù)的總稱,從數(shù)據(jù)結構方面來說,分為結構化數(shù)據(jù)和非結構化數(shù)據(jù);其中結構化數(shù)據(jù)易于分析處理,而非結構化數(shù)據(jù)分析處理是大數(shù)據(jù)應用中面臨的難題之一。因此,系統(tǒng)應用分布式計算、非結構化數(shù)據(jù)存儲、垂直型數(shù)據(jù)庫應用等是基于大數(shù)據(jù)信息化整合的重點研究領域[1]。

        1 大數(shù)據(jù)與云計算的關系

        近年來,大數(shù)據(jù)和云計算等名詞頻頻登上計算機領域的技術熱搜榜首。但大數(shù)據(jù)和云計算之間的關系人們普遍缺乏系統(tǒng)的認識。大數(shù)據(jù)是指在信息化建設過程中產(chǎn)生的一系列圍繞信息化系統(tǒng)的數(shù)據(jù)總集,這些數(shù)據(jù)包含了信息化系統(tǒng)本身的基本結構化數(shù)據(jù)和非結構化數(shù)據(jù),以及系統(tǒng)和用戶產(chǎn)生的相關日志等文本類型的數(shù)據(jù)。但想要通過單一的計算并分析這些數(shù)據(jù),用來提供一定的決策支撐顯然是耗時耗力的,因此必須使用到云計算技術對大數(shù)據(jù)進行分析和存儲。云計算的前身就是分布式計算,將復雜的計算任務由單一的服務器計算通過云計算軟件調度,拆分成并行的多個計算線程,由服務器集群分別計算后再匯總結果。因此,大數(shù)據(jù)與云計算是相輔相成的,想要用好大數(shù)據(jù),必須從信息化底層整合計算資源和數(shù)據(jù)資源。

        2 大數(shù)據(jù)技術對打通信息化孤島的作用

        大數(shù)據(jù)技術是由一系列處理數(shù)據(jù)有關的單獨技術綜合而成,其包含了數(shù)據(jù)獲取技術、數(shù)據(jù)存儲技術、數(shù)據(jù)檢索技術和數(shù)據(jù)挖掘技術,運用以上四種技術組建數(shù)據(jù)資源池,并基于各信息化系統(tǒng)的元數(shù)據(jù)標準,可有效打破各信息系統(tǒng)之間互不關聯(lián)的信息資源孤島,形成大數(shù)據(jù)資源的綜合運用。

        2.1 數(shù)據(jù)資源采集獲取技術

        數(shù)據(jù)資源采集獲取技術分為針對結構化數(shù)據(jù)的數(shù)據(jù)導入導出工具、SQL 腳本、軟件接口、和數(shù)據(jù)爬蟲等定時推送技術。非結構化信息的獲取需要批量采集非結構化數(shù)據(jù)的元數(shù)據(jù)信息,通過元數(shù)據(jù)信息來對非結構化數(shù)據(jù)進行描述,來達到大數(shù)據(jù)平臺的獲取需求。

        2.2 數(shù)據(jù)存儲技術

        大數(shù)據(jù)的存儲主要采用分布式存儲技術,比較成熟的技術包括Hadoop 的HDFS 集群以及由HDFS 集群和結構化數(shù)據(jù)庫MySQL 集群共同組成大數(shù)據(jù)存儲平臺。采用這種數(shù)據(jù)存儲方法既保證了多種數(shù)據(jù)的存儲,并且可以有效的利用Hive、Spark、MapReduce 等技術對大數(shù)據(jù)進行離線計算。從而可以有效地提高大數(shù)據(jù)的計算處理效率和處理質量,縮短處理時間,提升數(shù)據(jù)利用率。

        2.3 大數(shù)據(jù)檢索技術

        大數(shù)據(jù)搜索技術是大數(shù)據(jù)的典型應用場景之一,在搜索領域也出現(xiàn)了一些成熟的技術,這類技術主要是基于分布式的全文搜索引擎與數(shù)據(jù)分析引擎。該技術能實現(xiàn)大數(shù)據(jù)平臺的數(shù)據(jù)搜索、分析和探索能力,具備良好的可擴展性和二次開發(fā)程序接口,可以為大數(shù)據(jù)整合提供完整的搜索解決方案。

        2.4 大數(shù)據(jù)挖掘技術

        大數(shù)據(jù)之所以產(chǎn)生價值,就在于對大數(shù)據(jù)的挖掘分析?;贠LAP(聯(lián)機分析)技術可以使用大數(shù)據(jù)方便的形成數(shù)據(jù)畫像、各類報表。通過深入的數(shù)據(jù)挖掘可以形成針對訪問用戶的精準數(shù)據(jù)畫像,典型的應用包括各類電商平臺的推薦系統(tǒng)和保險營銷的營銷系統(tǒng)。

        3 基于大數(shù)據(jù)技術的應用研究領域

        基于大數(shù)據(jù)技術的信息化整合應從軟件和硬件兩個方面著手。軟件方面,通過使用ETL(數(shù)據(jù)倉儲)工具,將一個個孤立的業(yè)務系統(tǒng)數(shù)據(jù)進行數(shù)據(jù)抽取、數(shù)據(jù)清洗、數(shù)據(jù)轉換之后,整合存儲到大數(shù)據(jù)平臺資源池以備使用。軟件方面,通過使用Hadoop集群可以很好地解決大數(shù)據(jù)分布式存儲和數(shù)據(jù)挖掘計算。硬件方面,采用流行的軟件定義網(wǎng)絡產(chǎn)品,將多臺高性能服務器使用虛擬化技術進行資源管理和分配,這樣能夠做到計算和存儲資源的有效利用。并且通過部署Hadoop 集群,做到大數(shù)據(jù)的分布式存儲、分發(fā)、計算,有效節(jié)約了時間成本和運維成本,數(shù)據(jù)處理效率得到了高可靠的保證。在信息安全方面,大數(shù)據(jù)中的應用數(shù)據(jù)始終處于流動狀態(tài),因此可以采用https 數(shù)字證書加密等方式,保障系統(tǒng)數(shù)據(jù)的加密傳輸。在硬件安全方面,應盡量采用安全審計設備,對各類信息進行監(jiān)測,由專業(yè)安全人員根據(jù)數(shù)據(jù)的重要性采用不同的監(jiān)測和加密方式進行傳輸和使用[1]。

        通過大數(shù)據(jù)技術將傳統(tǒng)的信息化業(yè)務系統(tǒng)整合成為了一個統(tǒng)一的應用平臺,實現(xiàn)業(yè)務系統(tǒng)數(shù)據(jù)的交互,在數(shù)據(jù)挖掘方面和數(shù)據(jù)搜索方面提升了數(shù)據(jù)的利用率,為決策支持提供有效的數(shù)字支撐。例如,采用綜合統(tǒng)計報表等方式,通過數(shù)據(jù)分析大屏直觀地展示,從而提供決策支持依據(jù),提升業(yè)務流轉效率,優(yōu)化各業(yè)務部門的協(xié)同作業(yè)。

        使用大數(shù)據(jù)平臺整合了信息化業(yè)務系統(tǒng)后,還可以有效的加強內部輔助系統(tǒng)的應用研發(fā),例如可以在考核、財務、信息資源共享等方面拓展大數(shù)據(jù)平臺的應用范圍[2]。在考核方面,有關人員考核的數(shù)據(jù)可以經(jīng)由大數(shù)據(jù)平臺匯總,大數(shù)據(jù)平臺可以直觀的反映人員的出勤、產(chǎn)出等方面的數(shù)據(jù),加強對人員的管理把控;在財務管理方面,有支付需求的業(yè)務可以采用統(tǒng)一的支付平臺,通過支付平臺的應用可以減少財務對賬流程,杜絕財務錯賬壞賬的發(fā)生,并對合同進行有效的追蹤和使用。在信息資源共享方面,可以通過大數(shù)據(jù)平臺輕松實現(xiàn)內部資源共享,并做到相關性資料一鍵搜索。

        4 數(shù)據(jù)價值體現(xiàn)和發(fā)展方向

        4.1 大數(shù)據(jù)推動決策

        大數(shù)據(jù)整合后,用好大數(shù)據(jù)的主要方向就是向決策主體服務[2],通過各個業(yè)務系統(tǒng)匯聚而來的數(shù)據(jù),經(jīng)過大數(shù)據(jù)平臺的分析挖掘,形成的數(shù)據(jù)分析結果可以在不同的決策主體之間進行共享流轉,進而方便各決策主體單位及時掌握大數(shù)據(jù)平臺的分析數(shù)據(jù)和關聯(lián)因素,加快決策進程。

        4.2 大數(shù)據(jù)推動智慧城市發(fā)展

        智慧城市是典型的大數(shù)據(jù)應用,通過打通城市政府各業(yè)務系統(tǒng),可以實現(xiàn)智慧城市智能大數(shù)據(jù)應用[3]。例如通過交通信號攝像大數(shù)據(jù)實現(xiàn)智慧交通,動態(tài)調節(jié)城市交通;通過對城市常住人口的大數(shù)據(jù)分析,使社區(qū)部門掌握人口變化信息和養(yǎng)老信息,從而推動社區(qū)精細化管理。

        4.3 大數(shù)據(jù)推動輿情監(jiān)控

        社交媒體大數(shù)據(jù)在輿情監(jiān)控方面獨有價值,通過對社交媒體產(chǎn)生的大數(shù)據(jù)進行挖掘分析,做到對社交人員的學習畫像[4],及時掌握輿情信息,促進政府對輿情的正確研判和正確引導,及時介入解決糾紛。

        5 結語

        大數(shù)據(jù)的信息化整合,不僅僅是從技術上打通信息孤島,更是要用好大數(shù)據(jù)。通過對大數(shù)據(jù)的分析、加工、挖掘,使數(shù)據(jù)產(chǎn)生更高的使用價值,從而提高數(shù)據(jù)的利用率,發(fā)揮大數(shù)據(jù)在決策中的應有作用。本文簡單地探討了大數(shù)據(jù)的基本整合思路和常用的整合技術,希望能對推動各行業(yè)大數(shù)據(jù)平臺落地實施有所幫助。

        猜你喜歡
        結構化數(shù)據(jù)挖掘決策
        為可持續(xù)決策提供依據(jù)
        促進知識結構化的主題式復習初探
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        結構化面試方法在研究生復試中的應用
        計算機教育(2020年5期)2020-07-24 08:53:00
        決策為什么失誤了
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
        電力與能源(2017年6期)2017-05-14 06:19:37
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
        基于圖模型的通用半結構化數(shù)據(jù)檢索
        計算機工程(2015年8期)2015-07-03 12:20:35
        基于軟信息的結構化轉換
        基于GPGPU的離散數(shù)據(jù)挖掘研究
        老司机亚洲精品影院| 一区二区精品天堂亚洲av | 男女交射视频免费观看网站| 亚洲av久久久噜噜噜噜| 国产免费又色又爽又黄软件| 无码区a∨视频体验区30秒| 狠狠综合久久av一区二区三区| 成人无码av免费网站| 精品久久久久久久久久中文字幕| 69av在线视频| 麻豆av毛片在线观看| 丝袜美腿亚洲一区二区| 色欲av自慰一区二区三区| 高清国产一级毛片国语| 成人性生交大片免费看激情玛丽莎 | 国产成人精品无码一区二区老年人| 白白色免费视频一区二区在线| 欧美激情肉欲高潮视频| 国产亚洲日韩在线三区| 99国产精品无码专区| 国产丝袜美腿在线视频| 亚洲精品动漫免费二区| 久久亚洲av永久无码精品| 超高清丝袜美腿视频在线| 久久精品国产亚洲av不卡国产| 人妻久久久一区二区三区| 乱伦一区二| 国产情侣自拍偷拍精品| 精品卡一卡二卡3卡高清乱码| 欧美性大战久久久久久久| 精品久久久久久99人妻| 亚洲中文字幕九色日本| 欧美性色黄大片手机版| 日本在线视频网站www色下载 | 在线国人免费视频播放| 屁屁影院ccyy备用地址| 成年女人免费v片| 国产精品黑丝美女av| 免费无码又爽又高潮视频| 国产精品 高清 尿 小便 嘘嘘| 人妻少妇久久精品一区二区|