閆鍇 覃曉虹 郭丹
【摘 ?要】可視化隨著大數(shù)據(jù)時代的來臨日漸重要,傳統(tǒng)可視化技術(shù)在應(yīng)對大規(guī)模數(shù)據(jù)有響應(yīng)時間過長、缺少靈活性等弊端,而現(xiàn)如今,這項技術(shù)已發(fā)展到一定程度,很多互聯(lián)網(wǎng)公司都推出了各自的產(chǎn)品,種類繁多,能滿足目前大多數(shù)需求。針對目前幾款比較熱門和使用普遍的技術(shù)和工具,從他們的功能特點展開分析。
【關(guān)鍵詞】大數(shù)據(jù);可視化;技術(shù);工具
引言
現(xiàn)代社會,人類早已和數(shù)據(jù)密不可分,海量數(shù)據(jù)的組成真實地反映了現(xiàn)實世界的復(fù)雜事物,但人腦無法直接把龐大的數(shù)據(jù)轉(zhuǎn)化為有效的信息,數(shù)據(jù)可視化這項技術(shù)有助于我們更好的管理和理解這些數(shù)據(jù),以及發(fā)現(xiàn)復(fù)雜數(shù)據(jù)更深層次的聯(lián)系。21世紀初Jim Thomas教授提出可視化是大數(shù)據(jù)挖掘與分析中一項必不可少的技術(shù),發(fā)展至今從入門級的Excel到專業(yè)級的商業(yè)產(chǎn)品,這項技術(shù)已經(jīng)較為成熟,它的應(yīng)用無論在金融、銷售、物流、電力、交通、傳媒,還是醫(yī)學、地理等科學都發(fā)揮著重要的作用,幫助各領(lǐng)域人員發(fā)現(xiàn)問題,診斷問題,解決問題。
1 .大數(shù)據(jù)可視化基本概念
在大數(shù)據(jù)時代,數(shù)據(jù)的價值將得到最大程度的釋放,微小的數(shù)據(jù)也有可能產(chǎn)生超乎想象的價值。大數(shù)據(jù)的特點包括:Volume(數(shù)據(jù)量大),數(shù)據(jù)從GB到TB、PB乃至EB級別,采集、存儲和計算的量大;Variety(類型繁多),廣泛的數(shù)據(jù)來源,決定了大數(shù)據(jù)形式多樣性;Velocity(速度快失效高),數(shù)據(jù)增長速度快,處理速度快,時效性高;Value(價值密度低),所產(chǎn)生的數(shù)據(jù)中,有價值的數(shù)據(jù)所占比例很小,數(shù)據(jù)價值密度較低;Online(數(shù)據(jù)在線),數(shù)據(jù)一直在線,隨時能調(diào)用和計算,這是大數(shù)據(jù)區(qū)別于傳統(tǒng)數(shù)據(jù)最大的特征。
數(shù)據(jù)可視化是一種通過將數(shù)據(jù)編碼為可視對象如點、線、顏色、位置關(guān)系、動態(tài)效果等,并將對象組成圖形來傳遞數(shù)據(jù)信息的技術(shù)。其目的是以清晰且高效的方式將信息傳遞給用戶,是利用人眼的感知能力對數(shù)據(jù)進行交互的可視化表達以增強數(shù)據(jù)認知的技術(shù)。
數(shù)據(jù)可視化技術(shù)包含以下幾個基本概念:
數(shù)據(jù)空間:是由n維屬性和m個元素組成的數(shù)據(jù)集所構(gòu)成的多維信息空間;
數(shù)據(jù)開發(fā):是指利用一定的算法和工具對數(shù)據(jù)進行定量的推演和計算;
數(shù)據(jù)分析:指對多維數(shù)據(jù)進行切片、塊、旋轉(zhuǎn)等動作剖析數(shù)據(jù),從而能多角度多側(cè)面觀察數(shù)據(jù);
數(shù)據(jù)可視化:是指將大型數(shù)據(jù)集中的數(shù)據(jù)以圖形圖像形式表示,并利用數(shù)據(jù)分析和開發(fā)工具發(fā)現(xiàn)其中未知信息的處理過程。
2. 大數(shù)據(jù)可視化技術(shù)有哪些
前端界面中幾種常見的大數(shù)據(jù)可視化技術(shù),例如Highchar ts、Echarts、Charts、D3,使用JavaScript結(jié)合HTML5中的Can vas和SVG實現(xiàn),能在pc和移動設(shè)備上運行且支持大多數(shù)主流瀏覽器,兼容性很好。
2.1 Highcharts
開源但不完全免費的軟件,非商業(yè)用途可免費使用,商業(yè)用途需授權(quán),支付相關(guān)費用獲得技術(shù)支持、圖表定制服務(wù)以及VIP專屬服務(wù)。
Highcharts主要優(yōu)勢在于:
(1)兼容性高,可以在所有的移動設(shè)備及電腦上的瀏覽器(IE6以上)中使用。(2)配置語法簡單,所有配置都是JSON對象,易于讀寫和解析。(3)支持用戶一鍵導出以及直接打印圖表。(4)支持多坐標軸,同時對比多個數(shù)據(jù)。
2.2 Echarts
開源的、免費的可視化庫,功能豐富,涵蓋各行業(yè)圖標,可根據(jù)需求高度個性化定制。
ECharts全新4.0版本新特點:千萬級數(shù)據(jù)可視化渲染能力、SVG + Canvas 雙引擎動力更佳、數(shù)據(jù)樣式分離及扁平配置讓開發(fā)更便捷、首創(chuàng)無障礙訪問支持、適配微信小程序和ppt。
2.3 Chart
由社區(qū)共同維護的開源項目,8種可視化展現(xiàn)形式,每種方式都具有動態(tài)效果并且可定制,支持所IE9以上瀏覽器。
Chart.js2.0版本的新增特點包括:
(1) 可以混合不同圖表,以便在數(shù)據(jù)集之間提供清晰的視覺區(qū)分。
(2)新增圖表軸類型,輕松繪制各種復(fù)雜的圖形。
(3)改變數(shù)據(jù)、更新顏色和添加數(shù)據(jù)時,均有開箱即用動畫效果。
3 .大數(shù)據(jù)可視化工具分析
目前國內(nèi)外數(shù)據(jù)可視化市場上已有不少成熟產(chǎn)品,廠商主要來自這幾類:一類是提供商業(yè)可視化產(chǎn)品的軟件服務(wù)商,國內(nèi)有帆軟、永洪科技、東軟、四方偉業(yè)、SMARTBI等,國外有SAP BO、IBMCognos、Oracle BIEE、Microsoft BI等傳統(tǒng)商業(yè)智能軟件服務(wù)商。第二類是新興可視化產(chǎn)品提供商,國內(nèi)有恒泰實達、數(shù)字冰雹、海致BDP等,國外有Tableau、Qlik、Micros trategy等。第三類是互聯(lián)網(wǎng)巨頭公司,如網(wǎng)易有數(shù)、百度圖說、阿里云數(shù)加,其大數(shù)據(jù)平臺可視化基本是自己設(shè)計開發(fā),同時售賣各種數(shù)據(jù)產(chǎn)品。第四類是互聯(lián)網(wǎng)大數(shù)據(jù)服務(wù)商,如百分點、海云數(shù)據(jù)、神策數(shù)據(jù)、友盟等。每款產(chǎn)品有其自身特點和應(yīng)用場景,以下介紹幾款有代表性的產(chǎn)品。
3.1 DataV
DataV是阿里云的一款數(shù)據(jù)可視化產(chǎn)品,用來分析并展示龐大復(fù)雜的數(shù)據(jù),分為基礎(chǔ)、企業(yè)和專業(yè)版,可滿足多種業(yè)務(wù)的展示需求。功能特點:
(1)提供多種模板。DataV提供指揮中心、地理分析、實時監(jiān)控、匯報展示等多種場景模版。(2)多種數(shù)據(jù)類型。AnalyticDB、RDS MySQL、兼容MySQL數(shù)據(jù)庫、CSV文件、DataV數(shù)據(jù)代理服務(wù)、API、靜態(tài)JSON。(3)圖形化界面。無須編程能力,拖拽使用,簡單方便。(4)多分辨率適配。DataV特別針對拼接大屏端的展示做了分辨率優(yōu)化,能夠適配非常規(guī)的拼接分辨率。
企業(yè)版相比基礎(chǔ)版,增加功能包括:
(1)支持大屏加密發(fā)布。(2)支持更多數(shù)據(jù)源類型。(3)支持的項目數(shù)量增多。(4)支持本地部署。(5)支持自定義組件。
3.2 RayData
RayData是騰訊云大數(shù)據(jù)實時可視化交互系統(tǒng),系統(tǒng)實現(xiàn)數(shù)據(jù)實時圖形可視化并實時交互,使用戶對數(shù)據(jù)的管理更加方便,應(yīng)用場景豐富。產(chǎn)品處于內(nèi)測階段,可通過申請來獲得使用資格。功能特點:
(1)超高分辨率。采用獨特的超高分辨率運算引擎,使圖像不被壓縮,結(jié)合其不同于傳統(tǒng)可視化界面的表現(xiàn)形式,最終呈現(xiàn)具有視覺沖擊和豐富細節(jié)的結(jié)果。(2)內(nèi)容模塊個性化。靈活的程序架構(gòu),模塊化管理,方便個性化新增業(yè)務(wù),滿足各種需求。(3)端到端軟硬一體機。RayData提供端到端產(chǎn)品方案,包括從軟件到大屏以及后端渲染服務(wù)器,只需用戶提供數(shù)據(jù)源,無須二次開發(fā)。(4)實時交互。根據(jù)接入的數(shù)據(jù)實時變化,且為雙向互動,提高用戶的參與度。此外,用戶利用移動端能遠程對大屏進行控制,控制模塊根據(jù)需求自由定制。
4. 總結(jié)
在大數(shù)據(jù)時代,可視化技術(shù)占據(jù)著不可替代的一部分,應(yīng)用于各個行業(yè)領(lǐng)域,商用和免費的產(chǎn)品繁多,不管有沒有編程經(jīng)驗的用戶都能找到自己適用的工具。目前來看,可視化技術(shù)已取得了一定的成果,但隨著時代發(fā)展,數(shù)據(jù)的規(guī)模和復(fù)雜度也會不斷增加,這項技術(shù)面臨的問題和挑戰(zhàn)也會不斷增加,相信未來的可視化工具功能會更加強大全面。
參考文獻
[1]崔迪,郭小燕,陳為.大數(shù)據(jù)可視化的挑戰(zhàn)與最新進展[J].計算機應(yīng)用.2017- 07-10.
[2]黃璽磊.大數(shù)據(jù)的最后一公里——數(shù)據(jù)可視化技術(shù)[J].中國金融電腦,2017- 02-07.
[3]劉勘,周曉崢,周洞汝.基于平行坐標法的可視數(shù)據(jù)挖掘[J].計算機研究與發(fā)展,2003-02-11.
[4]中國大數(shù)據(jù)可視化市場份額排名出爐,中國軟件網(wǎng).