蔡映雪,胡松,胡輝,陳伽,尹輝,蔡昭權(quán)
(惠州學(xué)院,惠州516007)
一種面向北斗衛(wèi)星定位技術(shù)的結(jié)構(gòu)化數(shù)據(jù)挖掘模式
蔡映雪,胡松,胡輝,陳伽,尹輝,蔡昭權(quán)
(惠州學(xué)院,惠州516007)
作為我國獨立自主研發(fā)的空間定位技術(shù),北斗衛(wèi)星定位技術(shù)已憑借這高精度高可靠的定位、導(dǎo)航、授時服務(wù)在地理測繪、水利漁業(yè)、交通運輸?shù)阮I(lǐng)域做出顯著的貢獻(xiàn)。由于北斗衛(wèi)星導(dǎo)航系統(tǒng)的使用尚未全面鋪開,市場規(guī)模較小,更多領(lǐng)域的應(yīng)用服務(wù)有待深入開發(fā),北斗衛(wèi)星導(dǎo)航系統(tǒng)的市場前景以及發(fā)展?jié)摿θ匀痪薮?。但基于?shù)量龐大的衛(wèi)星數(shù)據(jù)的數(shù)據(jù)挖掘技術(shù)還相對落后,一定程度上制約北斗衛(wèi)星導(dǎo)航系統(tǒng)的進(jìn)一步發(fā)展。提出一種面向北斗衛(wèi)星定位技術(shù)的結(jié)構(gòu)化數(shù)據(jù)挖掘思路,解決過去針對衛(wèi)星數(shù)據(jù)使用方式過于單一、片面的問題。
北斗衛(wèi)星導(dǎo)航系統(tǒng)是基于北斗衛(wèi)星定位技術(shù)開發(fā)的一套國際一流的集空間定位、導(dǎo)航、授時等功能于一體的衛(wèi)星導(dǎo)航系統(tǒng)[1]。從2000年到2012年,我國已經(jīng)陸續(xù)發(fā)射了20多顆北斗衛(wèi)星并設(shè)立了32個地面站,北斗衛(wèi)星導(dǎo)航系統(tǒng)也正式面向亞太地區(qū)提供服務(wù)。目前,我國正加快北斗衛(wèi)星組網(wǎng)的速度,今年我國計劃發(fā)射6-8顆北斗衛(wèi)星,2018年前后將顆完成對“一帶一路”沿線國家提供服務(wù),預(yù)計到2020年,北斗衛(wèi)星導(dǎo)航系統(tǒng)將可面向全球提供服務(wù)。屆時,北斗衛(wèi)星導(dǎo)航系統(tǒng)的用戶數(shù)量將會達(dá)到二十億以上,由此產(chǎn)生的龐大的衛(wèi)星數(shù)據(jù)將是無價之寶。然而目前空間信息領(lǐng)域的數(shù)據(jù)挖掘技術(shù)相對落后的現(xiàn)狀無疑是對其的極大浪費。如何將龐大而復(fù)雜的衛(wèi)星數(shù)據(jù)轉(zhuǎn)化為商業(yè)價值促使相關(guān)行業(yè)發(fā)展起來反哺用戶群體是目前研究學(xué)者最為關(guān)心的問題[2]。
數(shù)據(jù)挖掘技術(shù)是近年來較為熱門的技術(shù)話題。數(shù)據(jù)挖掘指的是針對現(xiàn)今互聯(lián)網(wǎng)蓬勃發(fā)展帶來的海量數(shù)據(jù)進(jìn)行分析,利用數(shù)據(jù)模型和分析算法將隱藏在海量數(shù)據(jù)中有價值的信息提取出來,使得人們能夠更為貼切的理解生活中的客觀規(guī)律,并由此發(fā)掘更適合人類使用的新思想、新技術(shù)。數(shù)據(jù)挖掘通常會借鑒統(tǒng)計學(xué)的抽樣方法或計算機(jī)技術(shù)領(lǐng)域的人工智能、模式識別、機(jī)器學(xué)習(xí)等分析和學(xué)習(xí)的方法[3]。這些方法往往又依賴信號的接收處理、大規(guī)模的信息檢索、算法的最優(yōu)化或競爭進(jìn)化。因而數(shù)據(jù)挖掘是一個專門而深入的學(xué)科,以海量數(shù)據(jù)為基礎(chǔ)的分析、學(xué)習(xí)和進(jìn)化。
自20世紀(jì)70年代美國成功研制GPS衛(wèi)星定位系統(tǒng)以來,基于GPS衛(wèi)星數(shù)據(jù)的開發(fā)就從未停止過[4]。日本從上世紀(jì)90年代開始籌建GPS連續(xù)觀測網(wǎng),并于次年檢測到北海道東部近海8.1級超強地震。同樣的,衛(wèi)星監(jiān)測在地質(zhì)調(diào)查、礦山遙感等方面的應(yīng)用也毫不落后。1992年,美國開始研制“智能車輛高速公路系統(tǒng)”,以求實現(xiàn)車輛的動態(tài)管理、路線導(dǎo)航、安全檢查、意外救護(hù)等任務(wù)。2000年前后,國外的大型農(nóng)機(jī)制造企業(yè)成功研發(fā)了基于GPS的精細(xì)農(nóng)業(yè)系統(tǒng),實現(xiàn)了農(nóng)業(yè)領(lǐng)域的精細(xì)化管理。在軍事方面,GPS本身即為軍事目的的專門定制產(chǎn)品,可提供軍隊各指揮系統(tǒng)各艦隊甚至各個飛行管理的靈活管理,是美國軍隊強大的根本所在[5]。而娛樂方面,基于地圖的周邊景點和酒店等目標(biāo)的導(dǎo)航更是為GPS的發(fā)展提供了強大的助力,并愈發(fā)深入和細(xì)化。
在我國,北斗衛(wèi)星導(dǎo)航系統(tǒng)正處在起步階段,近年來正處于逐步升級完善的階段,對衛(wèi)星數(shù)據(jù)的使用還處于跟蹤學(xué)習(xí)狀態(tài),然而不可否認(rèn)的是,我國業(yè)界對于北斗衛(wèi)星導(dǎo)航系統(tǒng)的價值挖掘從未停止[6]。無論是2008年汶川地震還是還是北京奧運會,無論是氣象預(yù)報還是交通管理,都無處不有北斗衛(wèi)星導(dǎo)航系統(tǒng)的身影。出色的空間定位技術(shù)將會越來越多的被應(yīng)用到各行各業(yè)中去,此為北斗衛(wèi)星定位技術(shù)在未來的大趨勢[7]。
以車輛為例,車載接收器能夠通過北斗衛(wèi)星從車輛的日常運行過程中獲得大量的狀態(tài)數(shù)據(jù),如偽距、多普勒觀測值、北斗時等。這些數(shù)據(jù)是動態(tài)且實時更新的,反映了車輛實時的運行狀態(tài),數(shù)據(jù)項越多則對車輛狀態(tài)的描述越為準(zhǔn)確。這些狀態(tài)數(shù)據(jù)為道路交通狀況的智能分析提供了基礎(chǔ)。由于數(shù)據(jù)的多樣性及零散性,且數(shù)據(jù)均為狀態(tài)值,并非我們對于描述物體運動狀態(tài)所需要的數(shù)據(jù)值,我們難以從海量的復(fù)雜數(shù)據(jù)中快速且概括性的了解物體本身的運動狀態(tài),因而需要在前期對采集到的數(shù)據(jù)進(jìn)行數(shù)據(jù)的結(jié)構(gòu)化提取。
從衛(wèi)星回傳的數(shù)據(jù)中,包含了衛(wèi)星檢測到物體運動狀態(tài)的所有觀測值,然而當(dāng)我們需要從某一方面描述物體的狀態(tài)是,是不需要將所有觀測到的狀態(tài)值全部用上的,所以挑選必要的數(shù)據(jù)項就顯得尤為重要。舉個例子,當(dāng)需要測算車輛的速度時,就必須知道車輛在規(guī)定時間內(nèi)移動的距離,這就需要獲取車輛在這段規(guī)定時間內(nèi)一系列延續(xù)性的坐標(biāo)變化,進(jìn)而計算出路程,最后利用速度公式計算出車輛的速度。
而當(dāng)需要得到的數(shù)據(jù)約為抽象時,結(jié)構(gòu)化數(shù)據(jù)提取的步驟及層次將會更多。如需要檢測車流量的時候,設(shè)同一路段每小時車流量為M,平均數(shù)為G,計算Mn與G的增量比Vn,則有:
其中車流量M、平均數(shù)G均為多維度計算后得到的結(jié)果。
結(jié)構(gòu)化數(shù)據(jù)的提取只是對零散而基礎(chǔ)的數(shù)據(jù)進(jìn)行初步的聚合或統(tǒng)計,并非深入挖掘不同數(shù)據(jù)項之間的關(guān)聯(lián)性,難以在提升數(shù)據(jù)價值方面取得較為顯著的效果,因此還需要在具有一定擬合的數(shù)據(jù)基礎(chǔ)上利用更具有學(xué)習(xí)能力、更能提取數(shù)據(jù)特征的算法來完成數(shù)據(jù)價值的挖掘。
數(shù)據(jù)挖掘應(yīng)該是一個不斷提升數(shù)據(jù)價值的過程,而不是一門單一的技術(shù)或手段。數(shù)據(jù)挖掘的過程中會不斷的產(chǎn)生新的高維度數(shù)據(jù)及其集合,這個過程一旦開始就將不斷的利用機(jī)器學(xué)習(xí)的原理,不斷地由基礎(chǔ)數(shù)據(jù)形成可描述的數(shù)據(jù)集合,然后利用一些規(guī)定的條件對數(shù)據(jù)集合進(jìn)行提取或清洗,去除冗余無效的數(shù)據(jù),然后根據(jù)數(shù)據(jù)之間展示出來的規(guī)律性或關(guān)聯(lián)性進(jìn)行數(shù)據(jù)聚合,形成一定的數(shù)據(jù)模型,結(jié)合分類思想,得到一批新的數(shù)據(jù),并在此基礎(chǔ)上再次提取或清洗。在這一反復(fù)循環(huán)的過程中,會出現(xiàn)反復(fù)的衍生或歸并,產(chǎn)生不同維度的新數(shù)據(jù),直到數(shù)據(jù)被認(rèn)可為有價值為止。
根據(jù)上述思路,可以形成一種面向結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)挖掘模式,其中包含以下步驟:
(1)數(shù)據(jù)收集。在該步驟中,需要收集一切有效數(shù)據(jù),并根據(jù)結(jié)構(gòu)性進(jìn)行調(diào)整和歸類,使得數(shù)據(jù)看起來顯得更為科學(xué)和合理。
(2)數(shù)據(jù)提取和清洗。在該步驟中,對收集到的有效數(shù)據(jù)進(jìn)行高維度的提取,形成一批新的高維度數(shù)據(jù)作為下一輪數(shù)據(jù)的聚合和分類提供原材料。
(3)數(shù)據(jù)聚合和分類。當(dāng)新的高維度數(shù)據(jù)形成的時候,不同數(shù)據(jù)之間必然會存在一定的規(guī)則關(guān)聯(lián)性或趨向性,是下一輪數(shù)據(jù)挖掘的前提,根據(jù)不同的關(guān)聯(lián)性或趨向性對本次產(chǎn)生的高維度數(shù)據(jù)進(jìn)行分類,有助于數(shù)據(jù)的進(jìn)一步挖掘。
(4)挖掘結(jié)果分支的回溯。數(shù)據(jù)并非維度越高,代表性越強,反而容易因為算法的缺陷使得某些有用數(shù)據(jù)被排斥掉,因而需要對原始數(shù)據(jù)的挖掘操作進(jìn)行回溯,使得相同的原始數(shù)據(jù)在不同數(shù)據(jù)挖掘算法的計算下得到不同的結(jié)果集,形成更多的結(jié)果分支,這樣有利于增加訓(xùn)練集,同時也能讓數(shù)據(jù)挖掘算法自身能夠通過機(jī)器學(xué)習(xí)的方式進(jìn)行自我完善。
結(jié)構(gòu)化數(shù)據(jù)挖掘模式如圖1所示。
圖1 結(jié)構(gòu)化數(shù)據(jù)挖掘模式示意圖
日益完善的北斗衛(wèi)星導(dǎo)航系統(tǒng)具有廣闊的市場前景,然而與之匹配的數(shù)據(jù)挖掘方式效果不盡人意,使得衛(wèi)星數(shù)據(jù)資源造成了巨大的浪費。本文結(jié)合機(jī)器學(xué)習(xí)的思路,提出了一種面向北斗衛(wèi)星定位技術(shù)的結(jié)構(gòu)化數(shù)據(jù)挖掘思路,解決了過去針對衛(wèi)星數(shù)據(jù)使用方式過于單一、片面的問題。
[1]仙桃蒸三元.北斗衛(wèi)星導(dǎo)航系統(tǒng)[J].黑龍江科技信息,2012(12).
[2]張勝茂,程田飛,王曉璇,等.基于北斗衛(wèi)星船位數(shù)據(jù)提取拖網(wǎng)航次方法研究[J].上海海洋大學(xué)學(xué)報,2016,25(1):135-141.
[3]JiaweiHan,MichelineKamber,JianPei,等.數(shù)據(jù)挖掘:概念與技術(shù)[M].機(jī)械工業(yè)出版社,2012.
[4]張治宇.GPS應(yīng)用與發(fā)展[J].新絲路,2016(14):144-144.
[5]張勇,陳正陽.GPS在軍事后勤保障中的應(yīng)用[J].北京測繪,2008(4):56-59.
[6]陳建成.北斗導(dǎo)航系統(tǒng)應(yīng)用在我國社會經(jīng)濟(jì)發(fā)展中的作用[J].中國電子商情:通信市場,2007(Z1):47-48.
[7]閆忠文.中國衛(wèi)星北斗導(dǎo)航應(yīng)用產(chǎn)業(yè)發(fā)展思路[J].衛(wèi)星應(yīng)用,2014(4):7-10.
A Structured Data Mining Model For Beidou Satellite Location Technology
CAI Ying-xue,HU Song,HU Hui,CHEN Jia,YIN Hui,CAI Zhao-quan
(Huizhou University,Huizhou 516007)
As China's independent research and development of space positioning technology,Beidou satellite positioning technology has been relying on this high-precision and reliable positioning,navigation,timing services in the geographical surveying,water conservancy and fisheries,transportation and other fields to make a significant contribution.As the use of Beidou satellite navigation system has not yet fully rolled out,the market size is small,more areas of application services to be in-depth development,Beidou satellite navigation system market pros?pects and development potential is still huge.But based on a large number of satellite data mining technology is still relatively backward,to some extent,constrained the further development of the Beidou satellite navigation system.Presents a structured data mining idea for Bei?dou satellite positioning technology,which solves the problem that the satellite data is used in the past is too single and one-sided.
1007-1423(2017)27-0033-04
10.3969/j.issn.1007-1423.2017.27.008
北斗衛(wèi)星定位技術(shù);結(jié)構(gòu)化;數(shù)據(jù)挖掘;商業(yè)價值
惠州市科技計劃項目(No.2014B020004023、No.2015B010002002)、廣東省普通高校青年創(chuàng)新人才類項目(No.2015 B010002002)
蔡映雪(1983-),女,廣東汕尾人,本科,研究方向為計算機(jī)軟件
胡松(1985-),女,河北秦皇島人,碩士,講師,研究方向為信息系統(tǒng)和信息管理
胡輝(1979-),女,江蘇鹽城人,碩士,講師,研究方向為計算機(jī)軟件
陳伽(1979-),男,廣東惠東人,碩士,研究方向為計算機(jī)軟件和計算機(jī)網(wǎng)絡(luò)
尹輝(1983-),男,廣西桂林人,碩士,研究方向為3S應(yīng)用
蔡昭權(quán)(1970-),男,廣東陸豐人,碩士,教授,研究方向為計算機(jī)網(wǎng)絡(luò)、智能計算、數(shù)據(jù)庫
2017-07-11
2017-09-10
Beidou Satellite Positioning Technology;Structured;Data Mining;Commercial Value