董 冬,喬江暉,朱成亮,劉 曉,白文義
(西安航天動(dòng)力試驗(yàn)技術(shù)研究所,陜西 西安 710100)
由于國(guó)外在信息化、云計(jì)算、海量存儲(chǔ)及互聯(lián)網(wǎng)絡(luò)技術(shù)的領(lǐng)先發(fā)展,在試驗(yàn)數(shù)據(jù)解析入庫(kù)領(lǐng)域已成熟應(yīng)用上述技術(shù),實(shí)現(xiàn)海量試驗(yàn)數(shù)據(jù)分布式管理,試驗(yàn)數(shù)據(jù)快速檢索,大數(shù)據(jù)實(shí)時(shí)傳輸,而國(guó)內(nèi)起步較晚,在該領(lǐng)域水平較低。近年來(lái),國(guó)內(nèi)液體火箭發(fā)動(dòng)機(jī)研試人員也將試驗(yàn)數(shù)據(jù)如何深入利用、挖掘這些試驗(yàn)數(shù)據(jù)作為重要的研究方向,并建立相關(guān)試驗(yàn)數(shù)據(jù)管理平臺(tái)。而這些數(shù)據(jù)如何存儲(chǔ)和解析入庫(kù)是建立試驗(yàn)數(shù)據(jù)管理平臺(tái)需首要解決的問題[1]。
數(shù)據(jù)有2類:一類有統(tǒng)一的結(jié)構(gòu),可以用數(shù)字或文字來(lái)描述,具有類似的層次或網(wǎng)絡(luò)結(jié)構(gòu),稱之為結(jié)構(gòu)化數(shù)據(jù)[2],結(jié)構(gòu)化數(shù)據(jù)包括完全結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù);另一類信息則無(wú)法用數(shù)字或者統(tǒng)一的結(jié)構(gòu)表示,內(nèi)容結(jié)構(gòu)不固定無(wú)法解析的數(shù)據(jù),即為非結(jié)構(gòu)化數(shù)據(jù)。既包含結(jié)構(gòu)化數(shù)據(jù),又包括非結(jié)構(gòu)化的數(shù)據(jù)統(tǒng)稱為異構(gòu)數(shù)據(jù)。發(fā)動(dòng)機(jī)試驗(yàn)數(shù)據(jù)符合異構(gòu)數(shù)據(jù)特點(diǎn),可稱為異構(gòu)試驗(yàn)數(shù)據(jù)[3]。發(fā)動(dòng)機(jī)試驗(yàn)數(shù)據(jù)的存儲(chǔ)特點(diǎn)與傳統(tǒng)意義的數(shù)據(jù)相比,有其自身的特點(diǎn)。從存儲(chǔ)的角度來(lái)考慮,發(fā)動(dòng)機(jī)試驗(yàn)數(shù)據(jù)具有存儲(chǔ)容量大、媒介類型復(fù)雜、 增長(zhǎng)快速的特點(diǎn)。
目前常用的結(jié)構(gòu)化數(shù)據(jù)存放在數(shù)據(jù)庫(kù)中[4],以字段形式存放在表結(jié)構(gòu)組成的數(shù)據(jù)庫(kù)某個(gè)表單記錄中。
1)直接存儲(chǔ)在結(jié)構(gòu)化數(shù)據(jù)庫(kù)的BLOB字段中;
2)以FTP上傳的方式保存到文件服務(wù)器中;
3)通過文件系統(tǒng)直接存儲(chǔ)在文件服務(wù)器中[5]。
液體火箭發(fā)動(dòng)機(jī)試驗(yàn)數(shù)據(jù)屬于結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)結(jié)合的構(gòu)成形式,因此采用結(jié)構(gòu)化數(shù)據(jù)的關(guān)系數(shù)據(jù)庫(kù)存儲(chǔ)方式,以及非結(jié)構(gòu)化數(shù)據(jù)的文件系統(tǒng)存儲(chǔ)方式相結(jié)合的方式進(jìn)行存儲(chǔ)。這種存儲(chǔ)方式既集成了結(jié)構(gòu)化數(shù)據(jù)便捷存儲(chǔ)的優(yōu)點(diǎn),同時(shí)又解決了非結(jié)構(gòu)化數(shù)據(jù)文件大、結(jié)構(gòu)復(fù)雜及不易解析查詢的問題。
數(shù)據(jù)解析入庫(kù)完成將各種海量異構(gòu)試驗(yàn)數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫(kù),它是整個(gè)數(shù)據(jù)管理平臺(tái)建立的關(guān)鍵環(huán)節(jié),根據(jù)數(shù)據(jù)分類建立解析入庫(kù)模型是進(jìn)行數(shù)據(jù)導(dǎo)入設(shè)計(jì)的首要前提,入庫(kù)模型對(duì)于結(jié)構(gòu)化數(shù)據(jù)解析的存儲(chǔ)量占整個(gè)數(shù)據(jù)比重越高,數(shù)據(jù)利用率越高,入庫(kù)模型設(shè)計(jì)越難。數(shù)據(jù)入庫(kù)通用模型的工作原理是:將數(shù)據(jù)源進(jìn)行分類,按照數(shù)據(jù)結(jié)構(gòu)化程度分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),針對(duì)結(jié)構(gòu)化數(shù)據(jù)進(jìn)行數(shù)據(jù)解析后導(dǎo)入數(shù)據(jù)庫(kù),非結(jié)構(gòu)化數(shù)據(jù)經(jīng)附件上傳后存入文件數(shù)據(jù)庫(kù)[6]。
數(shù)據(jù)入庫(kù)通用模型適用于比較簡(jiǎn)單的數(shù)據(jù)庫(kù)構(gòu)成,對(duì)于大數(shù)據(jù),尤其對(duì)于諸如振動(dòng)等高頻采樣率數(shù)據(jù)只能通過原始文件形式存入,不能解析文件內(nèi)容,無(wú)法進(jìn)行數(shù)據(jù)分析;并且對(duì)于半結(jié)構(gòu)化數(shù)據(jù)也無(wú)法解析,導(dǎo)致分析數(shù)據(jù)只能打開文件進(jìn)行查看,無(wú)法針對(duì)文件內(nèi)容進(jìn)行分析,數(shù)據(jù)利用價(jià)值降低。同時(shí)這些不能利用的非結(jié)構(gòu)化數(shù)據(jù)入庫(kù)占用大量的存儲(chǔ)空間,浪費(fèi)存儲(chǔ)資源。
試驗(yàn)數(shù)據(jù)專有的數(shù)據(jù)特性和存儲(chǔ)方式的復(fù)雜特點(diǎn),共同決定了僅依靠數(shù)據(jù)入庫(kù)通用模型不能達(dá)到試驗(yàn)數(shù)據(jù)入庫(kù)要求。因此,在上述模型基礎(chǔ)上進(jìn)行改進(jìn)設(shè)計(jì),經(jīng)數(shù)據(jù)結(jié)構(gòu)標(biāo)準(zhǔn)化實(shí)現(xiàn)對(duì)半結(jié)構(gòu)化數(shù)據(jù)進(jìn)行結(jié)構(gòu)標(biāo)準(zhǔn)統(tǒng)一,可作為結(jié)構(gòu)化數(shù)據(jù)數(shù)據(jù)進(jìn)行解析;同時(shí)大數(shù)據(jù)塊也可通過時(shí)域、頻域數(shù)據(jù)存儲(chǔ)模塊解析成多個(gè)*.tdmdf文件。這樣諸如高采樣獲得的振動(dòng)頻域大數(shù)據(jù)就可進(jìn)行分析比對(duì)[7]。
試驗(yàn)數(shù)據(jù)入庫(kù)模型基于數(shù)據(jù)入庫(kù)通用模型,包括數(shù)據(jù)分類與結(jié)構(gòu)標(biāo)準(zhǔn)化、數(shù)據(jù)解析及入庫(kù)存儲(chǔ)3個(gè)部分[8]。其中,數(shù)據(jù)分類與結(jié)構(gòu)標(biāo)準(zhǔn)化部分,數(shù)據(jù)源按結(jié)構(gòu)可分為非結(jié)構(gòu)化、半結(jié)構(gòu)化及結(jié)構(gòu)化數(shù)據(jù),經(jīng)過結(jié)構(gòu)標(biāo)準(zhǔn)化模塊后數(shù)據(jù)轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù);數(shù)據(jù)解析部分完成結(jié)構(gòu)化數(shù)據(jù)通過附件存儲(chǔ)模塊進(jìn)行原始文件上傳,索引信息生成模塊進(jìn)行參數(shù)索引信息提取,特定規(guī)則下解析規(guī)則模塊實(shí)現(xiàn)數(shù)據(jù)(非時(shí)域、頻域數(shù)據(jù)和時(shí)域頻域數(shù)據(jù))的解析,以及實(shí)現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)通過附件存儲(chǔ)模塊進(jìn)行文件上傳,并通過索引信息生成模塊機(jī)型文件索引信息提??;入庫(kù)存儲(chǔ)部分完成非結(jié)構(gòu)化數(shù)據(jù)的原始文件存儲(chǔ)、文件索引信息存儲(chǔ),以及結(jié)構(gòu)化數(shù)據(jù)的參數(shù)索引信息存儲(chǔ)、結(jié)構(gòu)化數(shù)據(jù)內(nèi)容以關(guān)系數(shù)據(jù)庫(kù)表單形式存儲(chǔ),大數(shù)據(jù)文件解析成多個(gè)*.tdmdf文件并存儲(chǔ)在文件數(shù)據(jù)庫(kù)中。其中試驗(yàn)數(shù)據(jù)解析入庫(kù)模型,如圖1所示。
圖1 試驗(yàn)數(shù)據(jù)解析入庫(kù)模型Fig.1 Model of test data parsing and warehousing
試驗(yàn)整個(gè)周期(試驗(yàn)準(zhǔn)備、試驗(yàn)及試驗(yàn)結(jié)束后工作)獲得數(shù)據(jù)經(jīng)統(tǒng)計(jì)整理后,按照業(yè)務(wù)分類試驗(yàn)數(shù)據(jù)一般包括緩變數(shù)據(jù)、速變數(shù)據(jù)、附件數(shù)據(jù)、資源數(shù)據(jù)及試驗(yàn)過程數(shù)據(jù)。文件類型可分為*.UFF、 *.txt, *.xls, *.doc, *.mdb,*.rar及 *.jpg等格式。數(shù)據(jù)按照文件結(jié)構(gòu)可分為結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)包括時(shí)域數(shù)據(jù)、頻域數(shù)據(jù)及非時(shí)域、頻域數(shù)據(jù);非結(jié)構(gòu)化數(shù)據(jù)包括文檔上傳數(shù)據(jù)和原始數(shù)據(jù)(圖片、視頻、附件)。試驗(yàn)數(shù)據(jù)通過數(shù)據(jù)結(jié)構(gòu)標(biāo)準(zhǔn)化統(tǒng)一轉(zhuǎn)換模塊統(tǒng)一數(shù)據(jù)格式后,轉(zhuǎn)換后形成統(tǒng)一的文件結(jié)構(gòu)標(biāo)準(zhǔn),用于數(shù)據(jù)解析入庫(kù)。
試驗(yàn)數(shù)據(jù)復(fù)雜的文件結(jié)構(gòu)決定了試驗(yàn)數(shù)據(jù)解析難度大,解析規(guī)則多樣性的特點(diǎn)。專門為Web應(yīng)用程序而設(shè)計(jì)的XML(ExtensibleMarkup Language),作為一種可擴(kuò)展性標(biāo)記語(yǔ)言,適用于不同應(yīng)用間的數(shù)據(jù)交換[9]。XML由于具有數(shù)據(jù)描述和數(shù)據(jù)傳送能力,有很強(qiáng)的開放性,使其成為不同應(yīng)用系統(tǒng)之間的數(shù)據(jù)接口標(biāo)準(zhǔn)[10]。數(shù)據(jù)解析通過基于XML技術(shù)建立不同的解析模板,實(shí)現(xiàn)解析規(guī)則描述,完成數(shù)據(jù)在模板選擇后數(shù)據(jù)內(nèi)容對(duì)應(yīng)解析,與頁(yè)面程序完成數(shù)據(jù)交互,對(duì)相應(yīng)數(shù)據(jù)進(jìn)行頁(yè)面顯示,同時(shí)上傳至數(shù)據(jù)庫(kù)或者解析成多通道文件[11]。非結(jié)構(gòu)化數(shù)據(jù)直接以附件形式上傳。針對(duì)結(jié)構(gòu)化數(shù)據(jù)制定相應(yīng)的解析規(guī)則,進(jìn)行分類解析。結(jié)構(gòu)化數(shù)據(jù)即需要解析數(shù)據(jù)進(jìn)行規(guī)則選擇,解析規(guī)則主要有2大類:一類是時(shí)域、頻域的參數(shù)數(shù)據(jù)解析規(guī)則;另一類是非時(shí)域、頻域數(shù)據(jù)解析規(guī)則。
結(jié)構(gòu)化數(shù)據(jù)中的時(shí)域、頻域數(shù)據(jù),主要來(lái)源為*.txt等文件類型的格式化可解析文件,具有特定統(tǒng)一的文件結(jié)構(gòu)。時(shí)域數(shù)據(jù)或頻域數(shù)據(jù)均使用統(tǒng)一的XML模板,在進(jìn)行數(shù)據(jù)結(jié)構(gòu)統(tǒng)一標(biāo)準(zhǔn)后均可使用XML技術(shù)進(jìn)行數(shù)據(jù)解析入庫(kù)。根據(jù)文件參數(shù)個(gè)數(shù)生成多個(gè)文件名稱(原文件名、參數(shù)代號(hào)及日期),在文件數(shù)據(jù)庫(kù)所在磁盤建立一定存儲(chǔ)空間,文件數(shù)據(jù)建立多個(gè)單參數(shù)數(shù)據(jù)文件以文件數(shù)據(jù)庫(kù)所在路徑上傳數(shù)據(jù),并為所上傳數(shù)據(jù)分別生成參數(shù)總數(shù)以時(shí)間列和每個(gè)參數(shù)列構(gòu)成的的*.tdmdf格式文件。
結(jié)構(gòu)化數(shù)據(jù)中的非時(shí)域數(shù)據(jù)、頻域數(shù)據(jù),主要來(lái)源于以*.doc,*.mdb或*.xls文件類型的表格數(shù)據(jù),可解析但無(wú)統(tǒng)一格式,每個(gè)數(shù)據(jù)文件建立專有的XML模板,使用XML技術(shù)建立與之對(duì)應(yīng)的一種解析規(guī)則,該解析具有專有特性。解析完成數(shù)據(jù)內(nèi)容提取后寫入數(shù)據(jù)庫(kù)表空間的對(duì)應(yīng)表單中,創(chuàng)建相應(yīng)關(guān)聯(lián)表單進(jìn)行數(shù)據(jù)存儲(chǔ)。
非結(jié)構(gòu)化數(shù)據(jù),主要數(shù)據(jù)來(lái)源為原始數(shù)據(jù)或文檔上傳數(shù)據(jù)。包括文檔、視頻、圖片及附件類型數(shù)據(jù),它們均有相對(duì)應(yīng)的XML上傳模板,不需要進(jìn)行解析,選擇不同的上傳模板以附件方式上傳存儲(chǔ)在文件數(shù)據(jù)庫(kù)中,同時(shí)在數(shù)據(jù)庫(kù)中將文件索引信息添加在數(shù)據(jù)庫(kù)表記錄中。
數(shù)據(jù)庫(kù)用于存放異構(gòu)試驗(yàn)數(shù)據(jù),根據(jù)試驗(yàn)數(shù)據(jù)的分散特點(diǎn)建立分布式數(shù)據(jù)庫(kù)比較適合,同時(shí)數(shù)據(jù)存儲(chǔ)方式?jīng)Q定了數(shù)據(jù)庫(kù)的構(gòu)成形式,即分布式數(shù)據(jù)庫(kù)由關(guān)系數(shù)據(jù)庫(kù)和文件數(shù)據(jù)庫(kù)共同構(gòu)成[12]。關(guān)系數(shù)據(jù)庫(kù)用于存儲(chǔ)結(jié)構(gòu)化數(shù)據(jù)及其對(duì)應(yīng)的索引信息,文件數(shù)據(jù)庫(kù)用于存儲(chǔ)原始數(shù)據(jù),附件數(shù)據(jù),多通道參數(shù)文件數(shù)據(jù)(格式為*.tdmdf)。系統(tǒng)通過統(tǒng)一接口 (即 WebService+Http)對(duì)數(shù)據(jù)中心的數(shù)據(jù)進(jìn)行訪問或?qū)?shù)據(jù)中心進(jìn)行數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)解析導(dǎo)入、數(shù)據(jù)分析等操作[13]。
結(jié)構(gòu)化數(shù)據(jù)經(jīng)過數(shù)據(jù)解析后,將非時(shí)域、頻域數(shù)據(jù)數(shù)據(jù)內(nèi)容和數(shù)據(jù)索引信息分別存放在數(shù)據(jù)庫(kù)表記錄中,同時(shí)將原始數(shù)據(jù)文件以附件信息存放在文件系統(tǒng)中;將時(shí)域、頻域數(shù)據(jù)數(shù)據(jù)解析后多個(gè)單參數(shù)文件和原始文件(以附件形式)存放在文件系統(tǒng)中,同時(shí)將索引信息分別存放在數(shù)據(jù)庫(kù)表記錄中[14]。
非結(jié)構(gòu)化數(shù)據(jù),包括視頻、圖片等的原始數(shù)據(jù)和文檔數(shù)據(jù),均以附件形式上傳至文件數(shù)據(jù)庫(kù),系統(tǒng)在磁盤中開辟一定的存儲(chǔ)空間,以附件文件數(shù)據(jù)形式存儲(chǔ)在文件數(shù)據(jù)庫(kù)中,進(jìn)行文件名稱的創(chuàng)建和數(shù)據(jù)寫入。同時(shí)數(shù)據(jù)的索引信息將被提取并與試驗(yàn)任務(wù)關(guān)聯(lián)。非結(jié)構(gòu)數(shù)據(jù)同時(shí)在數(shù)據(jù)庫(kù)中將文件索引信息添加在數(shù)據(jù)庫(kù)表記錄中。
為了保證大量的、連續(xù)的、長(zhǎng)時(shí)間的數(shù)據(jù)準(zhǔn)確、快速地入庫(kù),同時(shí)數(shù)據(jù)模板類型多樣,且每個(gè)模板下對(duì)應(yīng)大量數(shù)據(jù)文件,因此針對(duì)同一個(gè)模板的數(shù)據(jù)文件,系統(tǒng)采取批量導(dǎo)入存儲(chǔ)技術(shù)。數(shù)據(jù)經(jīng)過解析后形成多個(gè)數(shù)據(jù)文件,把多個(gè)數(shù)據(jù)文件批量同時(shí)傳輸給服務(wù)器端,服務(wù)器端及時(shí)解析成多個(gè)通道參數(shù)數(shù)據(jù)形式,以批量的方式一次性插入到數(shù)據(jù)庫(kù)中。這樣解決了重復(fù)導(dǎo)入同樣模板的數(shù)據(jù)文件問題,提高了工作效率。
試驗(yàn)速變高頻大數(shù)據(jù)的管理能力決定了試驗(yàn)數(shù)據(jù)管理能力水平,因?yàn)樗僮兏哳l大數(shù)據(jù)具有占存儲(chǔ)空間大,不易解析,解析耗費(fèi)內(nèi)存等特點(diǎn)[15]。因此,一般針對(duì)試驗(yàn)速變高頻數(shù)據(jù)的入庫(kù)方式是僅存放在文件數(shù)據(jù)庫(kù)中,而試驗(yàn)數(shù)據(jù)管理平臺(tái)對(duì)于速變高頻數(shù)據(jù)進(jìn)行了解析導(dǎo)入,它通過時(shí)域、頻域數(shù)據(jù)存儲(chǔ)模塊將速變高頻數(shù)據(jù)解析成多個(gè)*.tdmdf文件,每個(gè)*.tdmdf文件為單通道參數(shù)文件,存放在文件數(shù)據(jù)庫(kù)中,可用于數(shù)據(jù)管理平臺(tái)參數(shù)顯示比對(duì),這樣在選取該數(shù)據(jù)文件的某個(gè)參數(shù)時(shí)就不再調(diào)用源數(shù)據(jù)文件,僅調(diào)用后續(xù)的單通道文件,數(shù)據(jù)顯示效率提高。
通過對(duì)液體火箭發(fā)動(dòng)機(jī)試驗(yàn)數(shù)據(jù)解析入庫(kù)模型的設(shè)計(jì)以及對(duì)解析入庫(kù)關(guān)鍵技術(shù)的研究與應(yīng)用,解決了試驗(yàn)數(shù)據(jù)批量入庫(kù)存儲(chǔ)與大數(shù)據(jù)解析入庫(kù)的問題,為數(shù)據(jù)挖掘利用打下堅(jiān)實(shí)的基礎(chǔ),為相關(guān)領(lǐng)域的試驗(yàn)數(shù)據(jù)解析入庫(kù)提供設(shè)計(jì)參考。
[1]王花梅,羅續(xù)業(yè).海上試驗(yàn)場(chǎng)數(shù)據(jù)管理與應(yīng)用系統(tǒng)的原型設(shè)計(jì)[J].海洋技術(shù),2013,6(4):06-08.
[2]邱麗麗,俞烽.異構(gòu)數(shù)據(jù)動(dòng)態(tài)交互平臺(tái)設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)應(yīng)用與軟件,2013,12(3):182-182.
[3]張冠軍.基于XML異構(gòu)系統(tǒng)間的數(shù)據(jù)交換技術(shù)[J].現(xiàn)代電子技術(shù),2013,24(2):45-47.
[4]陳碩穎,鄭敏信,齊鉑金,等.用于電池管理系統(tǒng)的數(shù)據(jù)存儲(chǔ)系統(tǒng)設(shè)計(jì)[J].單片機(jī)與嵌入式系統(tǒng)應(yīng)用,2014,14(1):65-68.
[5]張恩,張廣弟,蘭磊.基于MongoDB的海量空間數(shù)據(jù)存儲(chǔ)和并行[J].GEOSPATIAL INFORMATION,2014,12(1):22-23.
[6]韓晶,鄂海紅,宋美娜,等.基于主體行為的非結(jié)構(gòu)化數(shù)據(jù)模型[J].計(jì)算機(jī)工程與設(shè)計(jì),2013,12(3):04-08.
[7]韓翠峰.大數(shù)據(jù)帶給圖書館的影響與挑戰(zhàn)[J].圖書與情報(bào),2013,6(5):37-40.
[8]林菲,張萬(wàn)軍,孫勇.一種分布式非結(jié)構(gòu)化數(shù)據(jù)副本管理模型[J].計(jì)算機(jī)工程,2013,12(4):36-38.
[9]辛懷聲,王鵬.基于XML的數(shù)據(jù)解析軟件設(shè)計(jì)與實(shí)現(xiàn)[J].電腦知識(shí)與技術(shù),2014,12(1):18-20.
[10]劉波,苗彩,王國(guó)瓦,等.WITSML數(shù)據(jù)模式分析及應(yīng)用[J].錄井工程,2014,12(1):27-29.
[11]武艷,譚獻(xiàn)海.基于XML的異構(gòu)數(shù)據(jù)轉(zhuǎn)換的研究[J].鐵路計(jì)算機(jī)應(yīng)用,2013,12(10):4-7.
[12]劉斌.基于元數(shù)據(jù)的海量試驗(yàn)數(shù)據(jù)管理系統(tǒng)研究與設(shè)計(jì)[J].微電子學(xué)與計(jì)算機(jī),2012,12(4):08-11.
[13]薛濤,刁明光,李建存,等.資源環(huán)境遙感海量空間數(shù)據(jù)存儲(chǔ),檢索和訪問方法[J].國(guó)土資源遙感,2013,12(2):08-11.
[14]張蕊,李廣云,王力,等.基于HDFS的海量激光點(diǎn)云數(shù)據(jù)分塊存儲(chǔ)方法研究[J].測(cè)繪通報(bào),2014,12(3):21-24.
[15]陳娜,張金娟,劉智瓊,等.基于Hadoop平臺(tái)的電信大數(shù)據(jù)入庫(kù)及查詢性能優(yōu)化研究[J].移動(dòng)通信,2014,12(7):12-14.