亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于HBase的飛參數據存儲技術

        2016-09-01 01:32:31張家葉子范純龍丁國輝
        沈陽航空航天大學學報 2016年3期
        關鍵詞:數據庫效率

        呂 游,管 林,張家葉子,范純龍,丁國輝

        (1. 沈陽航空航天大學 計算機學院,沈陽 110136; 2. 沈陽飛機設計研究所 網絡信息中心,沈陽 110035;3. 92941部隊 96分隊,遼寧 葫蘆島 125000; 4. 91899部隊 機務大隊,遼寧 葫蘆島 125000)

        ?

        基于HBase的飛參數據存儲技術

        呂游1,4,管林2,張家葉子3,范純龍1,丁國輝1

        (1. 沈陽航空航天大學 計算機學院,沈陽 110136; 2. 沈陽飛機設計研究所 網絡信息中心,沈陽 110035;3. 92941部隊 96分隊,遼寧 葫蘆島 125000; 4. 91899部隊 機務大隊,遼寧 葫蘆島 125000)

        隨著數據記錄技術的發(fā)展,飛參文件記錄的信號數量和信號記錄密度都在快速增長,飛參數據記錄總量的快速增加促使故障分析等方面的飛參數據分析需求更加多元和迫切。傳統的飛參數據處理方法以文件為單位,無法對跨文件的聯合分析和特定信號集的分析提供有效的支持。針對飛參文件中數據存儲和使用的局限,提出一個基于HBase數據庫的分布式存儲架構,將飛參文件中的數據依據飛行參數存儲到HBase數據庫中,實現了對飛行信號數據的列存儲和對擴展檢索需求的良好支持。實驗結果表明,該種存儲方法大大加快了面向飛行參數的數據訪問效率,對飛參數據的綜合利用提供了存儲管理上的有益參考。

        飛參文件;飛行信號;HBase;分布式存儲

        飛機每個架次的飛行都會由飛參數據記錄系統對飛行過程中產生的各種數據進行記錄,形成飛行數據記錄文件,簡稱為飛參文件,其中的數據稱為飛參數據。飛參數據在飛機研制、故障診斷及飛行品質評價等方面起到了重要作用[1]。隨著數據記錄技術的發(fā)展,飛參文件中記錄的飛參數據信號數量超過1 000個,同時信號的記錄密度也在增加,最大的單個飛參文件已經超過200 MB,并且還在快速增長中。傳統的飛參數據處理方法以文件為單位,雖然不同的問題分析中關注的通常是少量的不同技術參數,但數據處理過程卻需要對整個文件進行讀取,而對多架次飛參數據的聯合篩選和分析效率就更低了。

        為了提高飛參數據的訪問和處理效率,本文結合現有飛參數據的特點,設計了一種基于HBase的飛參數據存儲結構,實現用HBase非關系型數據庫存儲飛參數據,將飛參數據按照參數重新組織,將飛參文件中一個參數的所有數據組織成HBase數據庫中的一條行記錄,實現了飛參數據的列存儲模式,解決了傳統飛參數據分析中面臨的訪問效率問題,并為大規(guī)模飛參數據的聯合分析提供了技術支撐。列存儲技術在很大程度上減少了參數數據分析時的讀入數據量,使得系統的查詢效率得到提高[2]。本文中采用部分飛參數據驗證了設計的可行性。

        1 背景介紹

        1.1HBase的列存儲架構

        HBase是一個面向列的分布式數據庫,作為非關系型數據庫的一種,它不同于傳統的關系型數據庫[3-4]。HBase表由行和列組成,行列坐標交叉點是表的單元格,為一個有版本號的未解釋的字節(jié)數組,版本號默認為單元格插入時的時間戳(Time Stamp)。HBase把表橫切成不同的區(qū)域(region),每個區(qū)域包含表的一個行子集。行中的列被分組成若干列簇(column families),所有的簇成員都有相同的簇前綴,簇成員間通過標識符(qualifier)區(qū)分,因此,每列表示為column family:qualifier。

        HBase中的數據存儲在Hadoop文件系統HDFS中,HBase由HMaeter服務節(jié)點和HRegionServer存儲節(jié)點組成,HMaster本身并不存儲HBase中的數據,它主要負責管理所有的HRegionServer節(jié)點。HBase邏輯上的一個表被定義成為一個Region存儲在某一臺HRegionServer上,HRegionServer負責支持多個Region向客戶端提供服務[5-6]。

        HBase的基本模式結構是表,由RowKey、列族、Timestamp(時間版本)形成一個三維有序的結構,通過三個維度坐標準確定位數據。HBase與關系數據庫(RDBMS)相比,更適合非結構化數據的存儲和管理,在實際系統中,HBase也可以與關系數據庫配合使用,兼顧二者的優(yōu)點。HBase將所有數據都以字節(jié)串的形式存儲,沒有豐富的數據類型,數據存儲按照RowKey的字典序排列,對Rowkey的設計提出了較高要求。HBase是基于列存儲的,在物理存儲中,不同的列族數據存儲在不同的文件中,另外,HBase系統可以在節(jié)點內任意增加存儲設備和節(jié)點,提高系統的靈活性和擴展性[10-12]。

        1.2 飛參數據文件

        記錄技術、計算機技術及現代測控技術的發(fā)展,促使飛參數據記錄系統能夠記錄的飛參數據量顯著增加,這種數據量增加既包括記錄參數數量的增加,也包括每個信號參數記錄密度的增大。在四代機中,飛參數據里記錄的參數數量接近1 000個,參數的記錄密度最高的達到1 kHz,部分參數的記錄密度與地面試驗環(huán)境中的記錄密度相當。這些都促使飛參數據的后期應用需求更加多元化,如故障分析、放飛審查、飛行品質評價和新機預研等。因此,利用飛參數據管理系統實現對飛參數據的有效管理,積累飛參數據資源,最大限度地發(fā)掘飛參中的有效信息,對飛機的研制和使用意義深遠[7-9]。

        飛參數據記錄系統記錄飛參生成的飛參文件一般包括文件頭和數據區(qū)兩部分,文件頭主要由飛機及飛行相關的信息構成,包括機型、出廠編號、起始記錄時間等屬性描述信息;數據區(qū)是一個行記錄集,每行記錄代表特定時刻所有飛參參數的信號值。另外,每個飛行參數在數據類型、取值范圍和精度等方面存在差別,因此行記錄中信號值的排列由預定義的順序決定。在新型飛機中,每個飛行小時產生的飛參文件規(guī)模增量約為100 MB。

        傳統飛參數據管理軟件利用飛參文件檢索數據的形勢主要有兩種:(1)將飛參文件作為訪問單位,通過直接讀取飛參文件來檢索所需的目標數據,對于獲取特定參數的所有數據值等操作經常需要遍歷整個文件,并且無法快速滿足對各參數值的靈活訪問需求;(2)將飛參文件的內容存儲到關系型數據庫中,飛參文件數據區(qū)中的行記錄轉成關系數據庫表中的行記錄,實現對多個飛參文件中飛參數據的集中管理,對于獲取特定參數的所有數據值等操作的處理形式簡化了,但效率沒有本質改善。

        2 系統實現

        2.1存儲表結構設計

        HBase分布式數據庫中的持久化數據是以HFile文件形式存儲在HDFS文件系統中的,在HFile文件中數據按RowKey有序排列。因此,HBase的表結構設計中RowKey設計是非常重要的,需要根據預期的訪問和檢索模式來為RowKey建模。

        飛參文件在使用中,以對一個或多個飛行參數的值序列進行分析為主要需求,本文設計了一個基于HBase的飛參數據的列存儲結構,利用HBase數據庫將飛參文件中的行記錄存儲方式轉換為面向參數值序列的列存儲方式,從而提高飛參數據的檢索效率。

        圖1 HBase表結構設計

        設HBase中飛參表的行結構模式為公式:

        2.2飛參數據寫入過程

        本文先將飛參數據文件集上傳到分布式文件系統HDFS中,然后對飛參文件進行預處理,將文件頭和數據行記錄分離,文件頭部分按圖1選擇信息組成行鍵RowKey,行記錄數據按參數分離,并調用函數處理各參數數據生成各參數的關聯屬性,與數據值共同組成表中各列數據——Value。通過Map過程將上述處理過的數據導入到分布式數據庫HBase,導入時HBase會自動判斷行鍵唯一性,如有重復行鍵則更新原有數據。在HBase中所謂更新就是新增數據版本,并不刪除原有數據,這種保留歷史數據的方法有利于分析過往飛參數據,其入庫流程如圖2所示。

        3 實驗環(huán)境及實驗結果

        3.1試驗參數信息

        實驗環(huán)境:兩臺臺式主機(CPU:inteli-5 3470,4GB內存)構成集群,虛擬機使用VirtualBox4.3.6,系統采用Ubuntu11.04。一臺主機運行虛擬機master(單核,2GB內存),另一臺主機運行兩個虛擬機slave節(jié)點(單核,1GB內存)。Hadoop版本2.4.0,Hbase版本0.98.1,Zookeeper版本3.4.6,JDK版本1.7.0,網絡屬局域網,帶寬100Mb/s。

        實驗數據使用飛機GPS傳感器傳回的連續(xù)時序數據,共60 600 209條記錄;數據以ASCII文本表示,以逗號為分隔符,以回車換行符(0x0D0x0A)結尾。

        3.2實驗結果

        為驗證HBase分布式數據庫的存儲和查詢效率以及可擴展性,本文使用共60 600 209條數據,分別存儲在3 000個文件中,比較了通過C語言程序直接讀取文件、MySQL關系型數據庫和HBase集群三種解決方案的寫入和讀取效率。

        圖2 數據入庫流程圖

        圖3對比了直接讀取文件方式、MySQL數據庫和HBase集群與數據規(guī)模的寫入時間。從圖3中可以看出,由于直接讀取文件方法其入庫時間只記為文件拷貝時間,所以時間比較固定,HBase集群寫入時間明顯低于MySQL關系型數據庫,并且隨文件量增大寫入時間差距也隨之變大。

        圖3 數據量與寫入時間關系對比

        圖4比較了直接讀取文件方式、MySQL數據庫和HBase集群在獲取指定參數所有架次全部數據的效率對比。通過實驗對比,3種方法查詢時間均與數據規(guī)模呈正比關系,直接讀取文件方式需要遍歷所有目標文件,并且進行全文件掃描,獲取飛參數據文件中指定參數的行記錄。MySQL關系型數據庫通過使用Select語句進行查詢,仍要遍歷整個數據表。由于本文的HBase存儲結構設計將參數寫入行鍵,所以可以通過行鍵直接篩選參數避免了全表掃描。在數據列獲取過程中,利用HBase的列過濾器,可以避免讀入不需要的列數據以提高效率。綜上得出結論:HBase集群讀取效率明顯高于傳統方法,具有高效的讀寫性能。

        圖4 數據量與讀取時間關系對比

        4 結論

        本文針對目前飛參數據分析軟件在分析飛參數據文件面臨的訪問效率低,管理不便的問題,提出了一種基于HBase數據庫的面向飛行參數值序列的飛參數據列存儲方案。根據HBase數據庫的特點設計并實現了適合飛參數據使用的存儲模型,解決了傳統處理方法無法高效分離數據屬性的問題,提高了存儲效率和檢索速度。實驗驗證了該方案的可行性,在入庫和查詢方面都能夠提供更加高效的處理結果,該方案對大規(guī)模試驗數據處理尤其是快速增長的飛參數據處理需求具有重要的理論價值和實用價值。對于HBase數據庫與關系數據庫聯合使用,對飛參數據處理中的架次、飛行參數基本屬性和索引等可結構化數據利用關系數據庫管理,對飛行參數值序列及其不確定的衍生屬性用HBase進行管理,從而更好的實現對飛參數據的管理和分析工作,將是下一步研究的工作。

        [1]曲建嶺,唐昌盛,李萬泉.飛參數據的應用研究現狀及發(fā)展趨勢[J].計測技術,2007,27(6):1-4.

        [2]IDREOS S,KERSTEN M L,MANEGOLDS.Self-organizing Tuple Reconstruction in Column-Stores[C].ACM SIGMOD International Conference on Management of Data.ACM,2009.

        [3]STONEBRAKER M.SQL databases v.NoSQL databases[J].Communications of the ACM,2010,53(4):10-11.

        [4]GHEMAWAT S,GOBIOFF H,LEUNG S T.The Google File System[C].In Proceedings of the 19th ACM Symposium on Operating System Principles,2003.

        [5]Lars George.HBase權威指南[M].代志遠,劉佳,蔣杰,譯.北京:人民郵電出版社,2013:303-304.

        [6]The Apache Software Foundation.Apache ZooKeeper[EB/OL].2010.http://zookeeper.apache.org/.

        [7]丁建新,樊江濱,郭強,等.全周期試驗數據管理系統研究[J].車輛與動力技術,2010(3):4-9.

        [8]唐宗凱,曲建嶺,高峰.飛參判據及其應用[J].計算機工程,2011(5):281-283.

        [9]李洪奇.試驗數據管理系統的應用[J].軟件工程師,2010,26(4):43-44.

        [10]DUTTA H,KAMIL A,POOLERY M,et al.Distributed storage of large-scale multidimensional electroencephalogram data using Hadoop and HBase [M] Grid and Cloud Database Management.Berlin:Springer,2011.

        [11]The Apache Software Foundation.Apache HBase[EB/OL].2015.http://hbase.apache.org/.

        [12]The Apache Software Foundation.Apache Hadoop[EB/OL].2015.http://hadoop.apache.org/.

        [13]BAI J W,WANG J Z,HUANG J L.Spatial query processing on distributed databases[M].Advances in Intelligent Systems and Applicantions-Volume 1,Springer Berlin He idelberg,2013.

        [14]Vamshi Krishna Konishetty,K Arun Kumar,Kaladhar Voruganti,and GV Rao.Implementation and evaluation of scalable data structure over hbase[C].International Conference on Advances in Computing,Communications and Informatics,2012.

        [15]陳慶奎,周利珍.基于HBase的大規(guī)模無線傳感網絡數據存儲系統[J].計算機應用,2012,32(7):1920-1923.

        (責任編輯:吳萍英文審校:趙亮)

        Flight data storage technology based on HBase

        LV You1,4,GUAN Lin2,ZHANGJIA Ye-zi3,FAN Chun-long1,DING Guo-hui1

        (1.College of Computer Science,Shenyang Aerospace University,Shenyang 110136,China;2.Network Information Center,Shenyang Aircraft Design and Research Institute,Shenyang 110035,China;3.96 Unit,92941 Troops,Huludao 125000,China;4.Locomotive Brigade,91899 Troops,Huludao 125000,China)

        With the development of data recording technology,the number of signals and the signal recording density of flight data files are growing rapidly.The rapid increase of the total amount of the flight file data prompts the requirement of flight data analysis,such as failure analysis,more diverse and urgent.Since the traditional method of processing flight file data is based on file units,it could not provide effective support for the conjoint analysis across file and the specific signals set analysis.In this paper,a distributed storage architecture based HBase database was proposed.The parameters based flight file data were stored into the HBase database,where a good support for the flight signal data columns-storage and retrieval extension was achieved.Experimental results prove that this kind of storage method accelerates the data access efficiency for the parameters of flight data file,and provides a useful reference for flight data on the utilization of storage management.

        flight data file;flight signal;HBase;distributed storage

        2095-1248(2016)03-0079-05

        2015-10-28

        國家自然科學基金青年基金(項目編號:61303016)

        呂游(1988-),男,黑龍江嫩江人,碩士研究生,主要研究方向:網絡信息安全,E-mail:lv_you@foxmail.com;管林(1962-),男,遼寧沈陽人,高級工程師,主要研究方向:工程數據管理,E-mail:415628038@qq.com。

        TP391.7

        A

        10.3969/j.issn.2095-1248.2016.03.013

        猜你喜歡
        數據庫效率
        提升朗讀教學效率的幾點思考
        甘肅教育(2020年14期)2020-09-11 07:57:42
        注意實驗拓展,提高復習效率
        效率的價值
        商周刊(2017年9期)2017-08-22 02:57:49
        數據庫
        財經(2017年15期)2017-07-03 22:40:49
        數據庫
        財經(2017年2期)2017-03-10 14:35:35
        數據庫
        財經(2016年15期)2016-06-03 07:38:02
        數據庫
        財經(2016年3期)2016-03-07 07:44:46
        數據庫
        財經(2016年6期)2016-02-24 07:41:51
        跟蹤導練(一)2
        “錢”、“事”脫節(jié)效率低
        无码不卡一区二区三区在线观看| 国产精品成人午夜久久| 色欲网天天无码av| 九一精品少妇一区二区三区| 久久精品成人免费观看97| 亚洲男同志网站| 国产精品无码一区二区三级| 中文字幕文字幕一区二区| 91性视频| 国模无码视频一区| 成年女人vr免费视频| 玖玖资源站亚洲最大的网站| 国产精品日韩中文字幕| 婷婷四房播播| 国产av国片精品有毛| 色婷婷久久综合中文久久一本| 亚洲三级在线播放| 熟妇人妻中文字幕无码老熟妇| 亚洲热线99精品视频| 人妖av手机在线观看| 成人黄色片久久久大全| 亚洲欧美v国产蜜芽tv| 亚洲国产福利精品一区二区| 性一交一乱一乱一视频| 蜜臀av在线播放一区二区三区| 精品一区二区三区久久| 国产一区二区三区av香蕉| 欧美精品一区二区精品久久| 亚洲另类精品无码专区| 中文字幕aⅴ人妻一区二区| 无码爽视频| 久久久国产精品黄毛片| 色老板在线免费观看视频日麻批| 色婷婷精品综合久久狠狠| 日韩高清亚洲日韩精品一区| 牲欲强的熟妇农村老妇女| 国产成年女人毛片80s网站| 久久综合伊人77777麻豆| 国产激情在线观看免费视频| 日本一区二区啪啪视频| 狠狠亚洲超碰狼人久久老人|