亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于數(shù)據(jù)挖掘的在線數(shù)據(jù)分析系統(tǒng)的設計

        2020-06-19 08:20:16李星熠吳小勇韓龍姜發(fā)健陳子康
        科技創(chuàng)新導報 2020年7期
        關鍵詞:數(shù)據(jù)可視化數(shù)據(jù)分析數(shù)據(jù)挖掘

        李星熠 吳小勇 韓龍 姜發(fā)健 陳子康

        摘? ?要:隨著信息時代的到來,數(shù)據(jù)量日益膨脹,尋找一種能夠有效分析、處理數(shù)據(jù)的手段的需求也日益迫切,在當今社會生產(chǎn)活動中,數(shù)據(jù)分析可視化正成為一種越來越普遍的需求。因此數(shù)據(jù)分析軟件也隨之成為各行各業(yè)從業(yè)人員的標配,本文將介紹的ZoomIn數(shù)據(jù)分析系統(tǒng),采用簡單易懂的Web操作界面來為用戶提供將復雜數(shù)據(jù)可視化和使用模型對數(shù)據(jù)深度挖掘的功能,讓用戶能夠通過對數(shù)據(jù)進行清洗、統(tǒng)計分析、訓練相應的機器學習模型之后挖掘出隱藏在數(shù)據(jù)中的潛在價值。

        關鍵詞:數(shù)據(jù)挖掘? 數(shù)據(jù)分析? 數(shù)據(jù)可視化

        中圖分類號:TP311.1? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? ? 文章編號:1674-098X(2020)03(a)-0133-02

        現(xiàn)今大數(shù)據(jù)時代下,不少中小企業(yè)已經(jīng)積累了大量本行業(yè)的數(shù)據(jù),但是由于沒有專業(yè)數(shù)據(jù)分析能力,或是未配備數(shù)據(jù)分析人員,導致并不能將數(shù)據(jù)轉(zhuǎn)化為生產(chǎn)力。

        現(xiàn)有市面上的數(shù)據(jù)分析工具如:Tableau、Spss等軟件操作門檻較高,對專業(yè)能力有著一定的要求,需要數(shù)據(jù)分析師進行技術(shù)支持,成本過高。而且,市面上的數(shù)據(jù)分析軟件大部分是PC端,鮮有Web端應用,這就造成使用不便、系統(tǒng)配置成本大等問題[1]。如何才能讓大數(shù)據(jù)分析變得友好和易于理解,可視化無疑是最有效的途徑。

        ZoomIn數(shù)據(jù)分析系統(tǒng)是一款智能數(shù)據(jù)分析產(chǎn)品,把抽象數(shù)據(jù)的可視化功能和專業(yè)的數(shù)據(jù)挖掘模型科學整合,系統(tǒng)采用Web應用的方式呈現(xiàn)給用戶,在使用后可導出可視化分析報告、輔助決策等。

        1? 系統(tǒng)架構(gòu)

        本系統(tǒng)將目標需求按數(shù)據(jù)分析思路劃分為五個模塊,其中包括創(chuàng)建任務模塊、數(shù)據(jù)預處理模塊、數(shù)據(jù)分析模塊、數(shù)據(jù)挖掘模塊和任務發(fā)布模塊。

        在任務發(fā)布后,用戶對于同一任務可以進入任意模塊進行迭代與改進,以保證分析結(jié)果的準確性和靈活性。

        ZoomIn數(shù)據(jù)分析系統(tǒng)各組件均采用開源技術(shù),這些技術(shù)具備成熟度高、性能穩(wěn)定與可擴展性高等諸多優(yōu)勢。系統(tǒng)組件包括:Web后端框架Django搭配前端框架Vue、前端數(shù)據(jù)可視化工具E-Charts、進行數(shù)據(jù)處理與清洗的Pandas、繪圖工具庫Seaborn、機器學習算法庫Scikit-learn以及結(jié)構(gòu)化數(shù)據(jù)庫MySQL等。

        2? 數(shù)據(jù)挖掘與展示

        2.1 數(shù)據(jù)挖掘

        Python語言近幾年來在數(shù)據(jù)挖掘、數(shù)據(jù)分析等領域的使用率與熱度持續(xù)上升,這主要得益于其豐富且強大的庫以及其優(yōu)雅簡潔的語法特性。本系統(tǒng)中主要使用到的Pandas是Python中一種數(shù)據(jù)分析的包,可以用來做科學計算,從而為數(shù)據(jù)挖掘提供預先數(shù)據(jù)清洗和處理的環(huán)境。

        數(shù)據(jù)挖掘階段,我們就會使用Scikit-learn包,運用其中封裝好的機器學習與數(shù)據(jù)挖掘算法構(gòu)造挖掘模型。其中我們的數(shù)據(jù)挖掘模塊將不同字段組合放在不同算法模型進行關聯(lián)分析、相關性分析、預測分析、聚類分析等挖掘其隱藏的信息。

        2.2 數(shù)據(jù)可視化

        本系統(tǒng)做為一個數(shù)據(jù)分析平臺,其主要功能就是為了在Web端通過用戶的簡單交互操作,將復雜的數(shù)據(jù)源進行整理并將數(shù)據(jù)分析圖表或是數(shù)據(jù)挖掘結(jié)果進行多維度展示。在數(shù)據(jù)挖掘階段,我們將準備的各種挖掘模型的可調(diào)參數(shù)暴露給用戶,讓用戶可以通過反復的調(diào)參配合圖表進行不同角度的觀察與分析。

        本系統(tǒng)的數(shù)據(jù)可視化部分采用兩種不同展示方案,首先在數(shù)據(jù)預處理與數(shù)據(jù)分析階段,由于用戶需要拖拽字段和數(shù)據(jù)列來做直觀處理,我們采用在前端使用E-Charts進行支持。而后在數(shù)據(jù)挖掘階段,由于涉及大數(shù)據(jù)量的模型運算,會大大造成運算服務器的壓力,所以我們使用SeaBorn將模型運算后的視圖直接傳送到前端展示。

        3? 應用價值

        本系統(tǒng)不僅填補了Web端數(shù)據(jù)分析軟件的空白,并且操作門檻低。專業(yè)的數(shù)據(jù)分析功能解決了有數(shù)據(jù)但無分析能力的中小用戶的痛點,具有很高的應用價值,非常適合非數(shù)據(jù)挖掘?qū)I(yè)方向的用戶進行使用。借助數(shù)據(jù)挖掘模型[2]從大量原始數(shù)據(jù)中發(fā)掘出隱含的、有用的、尚未發(fā)現(xiàn)的信息,幫助決策者尋找數(shù)據(jù)間潛在的關聯(lián),發(fā)現(xiàn)被忽略的因素。

        4? 實驗與應用

        4.1 數(shù)據(jù)源

        數(shù)據(jù)來源是由用戶提供,由于Pandas的強大功能可以將目前主流的數(shù)據(jù)文件類型統(tǒng)一處理比如csv、txt文件等,這些都屬于中、小規(guī)模數(shù)據(jù)量,如果是大數(shù)據(jù)量處理的話,系統(tǒng)會選擇高速通道傳輸文件。

        4.2 學生成績分析

        智能教育是人工智能、大數(shù)據(jù)等智能技術(shù)與教育深度融合和創(chuàng)新發(fā)展形成的教育新模式[3],隨著它的普及,教育愈發(fā)從傳統(tǒng)的經(jīng)驗式把控逐漸向著數(shù)據(jù)量化控制方向靠攏。而成績分析與預測就是其中的一環(huán),結(jié)合中小學生升學過程中不同階段的考試為數(shù)據(jù)源,進行趨勢把控,嘗試去預測其后面的成績變化方向。我們依靠某市所有初、高中的學生入學與升學成績數(shù)據(jù)為數(shù)據(jù)源,進行分析挖掘和展示。

        如上圖所示是將學生成績做線性回歸的結(jié)果展示,系統(tǒng)成功地將復雜的分析結(jié)果通過Web應用的媒介直觀地展示給用戶,并且會在最后的結(jié)果發(fā)布模塊給出相關的模型誤差參考與分析建議。

        5? 結(jié)語

        本文提出了一種基于數(shù)據(jù)挖掘的在線數(shù)據(jù)分析系統(tǒng),針對于非數(shù)據(jù)分析方向的相關從業(yè)人員,解決其在低學習成本要求下進行專業(yè)數(shù)據(jù)挖掘和分析的硬性需求。系統(tǒng)有效的滿足了用戶簡單交互、多維度分析數(shù)據(jù)并獲取專業(yè)且直觀的分析結(jié)果的訴求。

        目前系統(tǒng)主要是進行中小規(guī)模的數(shù)據(jù)挖掘與處理,為滿足進一步擴大的數(shù)據(jù)量規(guī)模,在后續(xù)工作中,我們將引進分布式計算框架,用來支持大數(shù)據(jù)的分布式計算,更好地優(yōu)化系統(tǒng),使其可以應對更高水平的需求。

        參考文獻

        [1] 閆龍川.基于開源軟件的數(shù)據(jù)分析與可視化應用[A]. 中國電機工程學會電力信息化專業(yè)委員會、國家電網(wǎng)公司信息通信分公司.2016電力行業(yè)信息化年會論文集[C].中國電機工程學會電力信息化專業(yè)委員會、國家電網(wǎng)公司信息通信分公司:人民郵電出版社電信科學編輯部,2016:268-271.

        [2] 朱家元,張恒喜,虞健飛.在數(shù)據(jù)挖掘中基于SOM網(wǎng)絡的數(shù)據(jù)分析可視化設計[J].計算機應用與軟件,2003(2):15-16,41.

        [3] 劉邦奇.智能教育的發(fā)展形態(tài)與實踐路徑——兼談智能教育與智慧教育的關系[J].現(xiàn)代教育技術(shù),2019,29(10):20-27.

        猜你喜歡
        數(shù)據(jù)可視化數(shù)據(jù)分析數(shù)據(jù)挖掘
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
        電力與能源(2017年6期)2017-05-14 06:19:37
        大數(shù)據(jù)時代背景下本科教學質(zhì)量動態(tài)監(jiān)控系統(tǒng)的構(gòu)建
        可視化:新媒體語境下的數(shù)據(jù)、敘事與設計研究
        我國數(shù)據(jù)新聞的發(fā)展困境與策略研究
        科技傳播(2016年19期)2016-12-27 14:53:29
        基于R語言的大數(shù)據(jù)審計方法研究
        Excel電子表格在財務日常工作中的應用
        淺析大數(shù)據(jù)時代背景下的市場營銷策略
        新常態(tài)下集團公司內(nèi)部審計工作研究
        中國市場(2016年36期)2016-10-19 04:31:23
        淺析大數(shù)據(jù)時代對企業(yè)營銷模式的影響
        一色桃子中文字幕人妻熟女作品| 蜜桃av抽搐高潮一区二区| 欧洲精品免费一区二区三区| 999久久久精品国产消防器材| 日韩高清亚洲日韩精品一区| 日韩无码尤物视频| 韩国三级黄色一区二区| 体验区试看120秒啪啪免费| 色一情一乱一伦一区二区三区日本| 91亚洲无码在线观看| 久久九九av久精品日产一区免费 | 久久久男人天堂| 久草久热这里只有精品| 久久精品国产av麻豆五月丁| 在线精品无码字幕无码av| 这里有精品可以观看| a√无码在线观看| 国产精品一区二区偷拍| 国语自产视频在线| 人人妻人人澡人人爽久久av| 成人亚洲欧美久久久久| 亚洲青青草视频在线播放| 亚洲国产成人久久精品一区| 色www视频永久免费| 欧美精品区| 国产精品视频免费一区二区三区| 日本一区中文字幕在线播放| 欧美日韩在线视频| 丰满老熟妇好大bbbbb| 亚洲欧美日韩在线中文一| 亚洲一区二区三区亚洲| 日本少妇高潮喷水视频| 丰满的少妇xxxxx青青青| 成年视频网站在线观看777| 色和尚色视频在线看网站| 成 人 免费 在线电影| 久久免费大片| 亚洲一区二区三区免费av| 天天做天天添av国产亚洲| 少妇无码av无码专区线| 亚洲av成人一区二区三区网址|