亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        利用數據可視化技術提高編目數據傳播的效率

        2016-01-29 06:22:12張從珍毛國良李冬圣蔡玲玲趙英萍杜迎春武有文
        華北地震科學 2015年4期
        關鍵詞:數據可視化圖形

        ?!×?,張從珍,毛國良,李冬圣,蔡玲玲,趙英萍,楊 銳,杜迎春,武有文

        (河北省地震局,石家莊 050021)

        ?

        利用數據可視化技術提高編目數據傳播的效率

        常亮,張從珍,毛國良,李冬圣,蔡玲玲,趙英萍,楊銳,杜迎春,武有文

        (河北省地震局,石家莊050021)

        摘要:指出了利用文字或數字方式展示地震編目數據的缺陷,通過逐步分析引出了數據可視化技術在信息傳播速度、全面性方面的優(yōu)勢,通過氣泡圖、堆疊式條形圖、箱線圖、折線圖、三維散點圖進行多角度的可視化數據展示,體現了數據可視化技術在地震編目數據傳播中的直觀性和高效性。

        關鍵詞:數據可視化;圖形;編目數據集

        0引言

        地震編目數據是測震臺網產出的最主要的地震資料[1],廣泛用于預報、震情監(jiān)視、科研等工作[2]。不論是地震科研還是撰寫報告,經常需要對多組數據集進行比較并從中找出某些規(guī)律,通常會采用文字或數字方式來展現,在數據量較小時這種方式容易被接受,當數據量很大時這樣的方式就不再有效率可言了。如何才能直觀地實現大量數據的對比展示呢?根據專家研究發(fā)現,人眼對于可視符號的感知速度比對數字或文字快多個數量級,使用圖形數據展示可迅速從數據中發(fā)現模式和規(guī)律[3]。

        人眼對于顏色、圖形等有形有色的東西比較敏感。數據可視化技術就是借助計算機軟件將原本可以用文字、數字描述的東西以圖形方式展現,并且利用圖形的顏色、形狀等信息表現不同維度的數據。在計算機圖形學技術初期,人們只是用一些簡單的圖形來描述數據,隨著云計算、大數據挖掘等數據處理技術的發(fā)展,簡單的圖形學已經無法滿足需求,數據可視化技術隨之應運而生。數據可視化不僅要傳播信息,還要考慮新穎性、高效性,利用不同的場景提高信息傳播能力,要充分考慮到受眾目標、使用方式等因素[4]。根據上述概念,可以想象數據可視化不僅僅是用圖形展示數據,還要讓圖形更美觀,更簡潔、更準確。

        1編目數據展示的發(fā)展歷程

        1.1 列表方式

        人們對信息的認識從文字或數字方式開始,通常會使用表格方式(表1),表中展示了2008年的編目信息(限于篇幅僅列5條為例),表中描述了每條地震的時、空、強等信息,根據這些信息可以大致了解到測震臺網在某段時間內的數據產出情況。在做數據分析或研究時通常需要找出數據的某些規(guī)律,數據量較小時,似乎能看出規(guī)律,但數據量很大時則很難在短時間內找到規(guī)律,這樣的原始數據列表信息傳播速度較慢。

        表1 2008年1月河北臺網地震編目數據表

        1.2 統計分析方式

        表1的列表方式無法讓人一目了然,即使是長期從事地震編目的工作人員也不能立即看出規(guī)律。之后人們對這樣的數據進行統計分析,得出一些基本信息,比如:地震數量、最大震級、地震分布狀況等,這樣的統計結果要優(yōu)于原始數據列表,但依然存在一些問題。它給出數據集的極值、總量或平均值,但無法描述數據的整體分布狀況,所以統計分析方式也無法全面的傳播信息。

        1.3 可視化方式

        如果采用可視化方式,利用一張圖形就能清晰描述數據整體分布狀況(圖1)。圖中最下面的橫線是正常值中的最小值,最上面的橫線是正常值中的最大值;中間方框的下部是下四分位數,方框中間的粗橫線是中位數,方框的上部是上四分位數;最大值與最小值之外的那些點屬于離群點,它們與絕大多數的值相距較遠。從圖1中可以看出該組數據中正常值的最大值大約是ML2.5,正常值的最小值大約是ML-0.8,中位數接近ML1.0,所有值的最大值是ML4.7(圖中最上面的那個點)。有一點需要注意,對于本圖來說正常值中的最大值并不是所有值中的最大值,所有值中的最大值應該是那些離群點里最上面的一個點。

        圖1 震級值箱線圖

        2可視化技術展示數據

        2.1 數據集整體狀況的展示

        報告中,通常在開篇使用總結性的語言描述整體狀況,諸如“1月發(fā)生地震多少次,2月發(fā)生地震多少次 …… ,其中最大地震為某月的某次地震”。這樣的描述完全可以用氣泡圖來表示,氣泡圖屬于三維圖,可以同時表示月份、數量和最大值3個數據項。圖2顯示的是2014年河北省地震編目數據,從圖中可以看到,全年震級最大的地震是9月的ML4.7地震;地震次數最多的月份是10月,將近170次;地震次數最少的是7月,少于100次。這樣的圖形完全可以將整體狀況描述清楚,即使沒有文本說明也能讓人一目了然。

        圖2 2014年河北省地震編目數據氣泡圖

        2.2 數據集總量與占比的對比展示

        想要橫向比較各年度地震總量,一般會采用直方圖或柱狀圖,通過圖形的高低能看出數據總量的差異;想要縱向比較每年各震級區(qū)間與地震總量的占比,一般會采用餅圖,通過圖形所占面積的大小能得到各部分所占的比例。如果既想橫向比較數據間的總量,又想縱向比較數據內的占比,可以采用可視化技術中的堆疊式條形圖。如圖3所示,該圖中的每個矩形的高度就是表2中每年度的地震總數,每個矩形內部又分出4個不同的區(qū)域,分別代表不同震級區(qū)間的地震數量,顏色最深的代表ML1.0~1.9地震數量。從圖3可以看出每年的地震主要都集中在ML1.0~1.9震級區(qū)間內,而2010年的地震數量明顯多于其他年份。

        表2 2008—2012年首都圈地區(qū)地震活動統計表

        圖3 年度地震總量與震級區(qū)間數量堆疊式條形圖

        2.3 多組數據集數據分散狀況比較

        在對比多組數據集時,如果只是對比數據集的總量和最大值并不能反映這些數據集本質的差異,如果兩者的總量和最大值一致,則無法反映一組差異很大的數據集。假如有2組表示震級的數據(表3):

        表3 2組震級數據

        雖然2組數據的最大值都是ML2.3,而且每組數據的總量都是8個,但明顯可以看到組1中的數據比較分散,既有ML1.0以下的地震,也有ML1.0~2.0之間的地震,還有ML2.0以上的地震,而組2中的地震幾乎都集中在ML1.8~2.3之間。單純用數據總量和極值無法對上述2組數據做出準確的描述,而用箱線圖就能清楚地看出不同數據集中數據的分散狀況。將12個月的震級數據繪制到1張圖上(圖4),通過對比能夠直接看到每個月震級的分布狀況。全年地震最小值出現在2月和11月,小于ML-0.5;全年地震最大值是9月的ML4.7;9月的下四分位數小于ML0.5,是全年中最低的,這意味著該月有25%的地震震級在ML0.5以下;全年大多數月的中位數在ML1.0附近,只有9月和12月的中位數在ML0.7左右,表明9月和12月的地震有一半在ML0.7以上;5月的上四分位數超過ML1.5,為全年最大值,這意味著該月有25%的地震震級在ML1.5以上。

        圖4 震級數據箱線圖

        2.4 多組數據集趨向走勢的展示

        當需要對一些統計信息進行描述時,經常會用到如表4所示的方式。表4描述了2012—2014年河北臺網每月處理的地震個數(包括首都圈地區(qū)及本省行政區(qū)邊界外30 km內的所有地震)。單獨看這些數字時很難立即在大腦中產生對比結果,但使用折線圖(圖5)后就能看到一個清晰的趨勢。

        表4 2012—2014年河北臺網每月處理的地震個數統計

        圖5 2012—2014年每月地震數量折線圖

        2.5 多組數據集個體三維分布的描述

        由表1雖然可以看到地震震中的經緯度,但通常只有長期從事地震編目分析工作的人較容易通過經緯度的值在大腦中形成地震的大致位置,其他人員很難構建出這樣的虛擬圖,而采用散點圖方式則可以很鮮明地將所有地震發(fā)生的位置展示在圖上,但是這個圖是平面的。地震發(fā)生位置是由經緯度及深度來描述的,那么就需要用三維散點圖來展示(圖6)。圖6 為2014年1月的部分地震數據做出的三維圖,從圖中可以看出震源深度最深的地震接近16 km,最淺的在4 km左右;地震在經度上主要集中在114.0°E ~118.5°E之間;地震在緯度上主要集中在37.0°N ~40.0°N之間。

        圖6 2014年1月地震編目數據三維散點圖

        3結束語

        通過上述5種不同的可視化圖形,分別展示了數據集的整體狀況、數據集總量與占比、數據分散狀況、趨向走勢、及個體三維分布狀況。這5種可視化技術都能滿足信息傳播的高速性、直觀性、準確性,特別是當數據量比較大時,可視化數據分析比文本數據分析更具優(yōu)勢??梢暬瘮祿粌H可以為專業(yè)人員服務,而且對于非專業(yè)人員來說也能從圖形中看出一些規(guī)律,它擴大了數據的傳播范圍,降低了數據的接收難度。以上可視化數據圖均采用R語言生成,R語言由Ross Ihaka和Robert Gentleman開發(fā)[5],它具有數據分析與繪圖功能。

        致謝:本文所用測震編目數據是河北省地震局測震臺網全體編目、值班人員在一年中辛勤工作完成的,在此向臺網所有編目、值班人員表示感謝!

        參考文獻:

        [1]???,趙曦,姬建中.基于Oracle的地震數據共享方案設計及數據庫實現[J].地震地磁觀測與研究,2011,32(5):143-147.

        [2]王蘭蘭,楊晶瓊,張雪玲,等.技術進步是提高編目質量的關鍵[J].地震地磁觀測與研究,2008,29(4):105-107.

        [3]陳為,沈則潛,陶煜波,等.數據可視化[M].北京:電子工業(yè)出版社,2013:2.

        [4]Julie Steele, Noah Iliinsky.數據可視化之美[M].祝洪凱,李妹芳,譯.北京:機械工業(yè)出版社,2011:7-9.

        [5]李詩羽,張飛,王正林.數據分析:R語言實戰(zhàn)[M].北京:電子工業(yè)出版社,2014:5.

        喬子云,羅娜,張國苓,等.河北大柏舍臺深井與淺層地電阻率觀測對比分析[J].華北地震科學,2015,33(4):49-53.

        Visualization Technology Improves the Efficiency of

        Seismic Catalog Data Transmission

        CHANG Liang, ZHANG Cong-zhen, MAO Guo-liang, LI Dong-sheng,

        CAI Ling-ling, ZHAO Ying-ping, YANG Rui, DU Ying-chun, WU You-wen

        (Earthquake Administration of Heibei Province, Shijiazhuang 050021, China)

        Abstract:This paper points put the defects of using texts or numbers to display data, and then states the advantage of data visualization technology in information transmission speed and comprehensive through multi angle data displaying by bubble plot, stacked bar plot, line plot, box plot, 3D scatter plot. The visualization and high-efficiency of visualization technology in catalog data transmission are shown.

        Key words:data visualization; data set; catalog data

        作者簡介:喬子云(1965—),女(漢族),河北大名人,高級工程師,主要從事電磁分析和地震預測研究工作.E-mail:qzy@eq-he.ac.cn

        基金項目:國家自然科學基金(41274079);震情跟蹤定向工作任務(2015010403)

        收稿日期:2015-04-20

        doi:10.3969/j.issn.1003-1375.2015.04.008

        中圖分類號:P315.391

        文獻標志碼:A

        文章編號:1003-1375(2015)04-0045-04

        猜你喜歡
        數據可視化圖形
        移動可視化架構與關鍵技術綜述
        軟件導刊(2016年12期)2017-01-21 16:36:18
        大數據時代背景下本科教學質量動態(tài)監(jiān)控系統的構建
        可視化:新媒體語境下的數據、敘事與設計研究
        我國數據新聞的發(fā)展困境與策略研究
        科技傳播(2016年19期)2016-12-27 14:53:29
        基于R語言的大數據審計方法研究
        數圖形
        分圖形
        找圖形
        數據可視化在新聞生產中的應用研究
        今傳媒(2016年3期)2016-03-28 00:30:43
        圖形變變變
        中文字幕无码中文字幕有码| 一区二区三区日本大片| 伊人狠狠色j香婷婷综合| 成人免费毛片在线播放| 国产精品一区二区韩国av| 久久久久人妻精品一区二区三区| 日本高清视频永久网站www| 久久久精品人妻一区二区三区四 | 麻豆国产原创视频在线播放| 在教室伦流澡到高潮hnp视频 | 无码国产精品一区二区免费式直播 | 国产日韩欧美亚洲精品中字| 区无码字幕中文色| 少妇久久一区二区三区| 午夜视频国产在线观看| 国模无码一区二区三区不卡| 伊人色综合九久久天天蜜桃| 国产精品制服一区二区| 一区二区三区极品少妇| 久久亚洲中文字幕精品一区| 人人爽人人澡人人人妻| 亚洲色欲久久久综合网| 亚洲国产精品色婷婷久久| av中国av一区二区三区av| 美女高潮黄又色高清视频免费| 久久精品中文字幕一区| 亚洲日韩AV无码美腿丝袜| 日本一区二区免费看片| 久久亚洲av无码精品色午夜 | 天堂丝袜美腿在线观看| 国产精品久久久久9999| 无码a∨高潮抽搐流白浆| 国产思思久99久精品| 在线亚洲妇色中文色综合| 精品无人区无码乱码毛片国产| 国产精品无码一本二本三本色| 国产激情在观看| 亚洲一区二区女优视频| 日本二一三区免费在线| 亚洲综合色区另类av| 国产亚洲午夜精品|