張海瀛
(中國西南電子技術(shù)研究所 成都 610036)
隨著無線傳感網(wǎng)絡(luò)、全球衛(wèi)星導(dǎo)航系統(tǒng)等技術(shù)和設(shè)備的發(fā)展,目標(biāo)時空數(shù)據(jù)(如飛機(jī)、船舶軌跡等)的數(shù)據(jù)量日益增長,及時發(fā)現(xiàn)目標(biāo)時空異常情況并給予實時告警,對于及時科學(xué)決策具有重要的意義[1~3]。“異?!币话闶侵赣^測到的事物與所期望事物有所不同的現(xiàn)象。時空異常判定的目的是在從時空數(shù)據(jù)中發(fā)現(xiàn)偏離正常模式的目標(biāo)。目標(biāo)時空異常情況的研究需要建立在正常模式建模之上,以此為標(biāo)準(zhǔn),將觀測到的數(shù)據(jù)與正常模式相對比,進(jìn)而實現(xiàn)異常情況的判定。
一般來說,從目標(biāo)時空信息來看,主要時空異常情況如圖1所示,包括速度或航向等運(yùn)動狀態(tài)的變化、偏離正常路徑、過于接近或進(jìn)入違禁區(qū)域等[3]。本文主要研究目標(biāo)位置超出歷史或預(yù)設(shè)路徑的異常情況判定,稱之為“航路異?!薄T诖朔N異常情況下,目標(biāo)的正常模式是其正常行駛軌跡,該軌跡可以預(yù)先設(shè)定,也可以從目標(biāo)的歷史活動數(shù)據(jù)中提?。?~6]。
圖1 目標(biāo)時空異常模式
目前,目標(biāo)航路異常判定模式包括在線實時和離線非實時兩種,判定方法可細(xì)分為基于統(tǒng)計挖掘的方法[7~9]、基于距離的方法[10~13]和基于機(jī)器學(xué)習(xí)(包括神經(jīng)網(wǎng)絡(luò))的方法[14~15]三大類。基于統(tǒng)計挖掘的方法主要面向離線非實時場景,旨在發(fā)現(xiàn)大規(guī)模數(shù)據(jù)中的異常目標(biāo),而后兩類方法主要面向在線實時場景,側(cè)重于目標(biāo)異常情況的實時判定和告警?;诰嚯x的方法,主要通過計算目標(biāo)實時特征向量與正常模式下特征向量之間的距離來判斷目標(biāo)是否出現(xiàn)異常?;跈C(jī)器學(xué)習(xí)的方法,主要利用決策樹、支持向量機(jī)、貝葉斯網(wǎng)絡(luò)等模型,自動學(xué)習(xí)復(fù)雜的數(shù)據(jù)結(jié)構(gòu)、已有的異常和正常模式。
基于機(jī)器學(xué)習(xí)的方法是有監(jiān)督方法,需要采集大量的目標(biāo)軌跡數(shù)據(jù),并人工標(biāo)注異常和正常數(shù)據(jù),構(gòu)建訓(xùn)練集,以進(jìn)行模型的訓(xùn)練,同時還面臨樣本不均衡問題。其中,基于神經(jīng)網(wǎng)絡(luò)的方法具有更強(qiáng)大的擬合能力,可對復(fù)雜異常問題進(jìn)行建模,但是其所需要的訓(xùn)練集更大,學(xué)習(xí)到的模型難以解釋,甚至還需要配備專用推理硬件,導(dǎo)致其應(yīng)用場景受限。而基于距離的方法是無監(jiān)督方法,主要從物理特性出發(fā)建模目標(biāo)特征向量,無需構(gòu)建數(shù)據(jù)集和進(jìn)行訓(xùn)練,原理清晰,部署環(huán)境通用,在實際中得到了更加廣泛的應(yīng)用。
基于距離的方法,核心在于如何構(gòu)建特征向量(可由位置、航速、航向、轉(zhuǎn)角等組成),并快速衡量特征向量之間的距離。目前,無論是基于單維特征還是聯(lián)合多維特征的距離方法[10~13],大都基于Hausdorff距離來度量特征距離,需要計算實時特征與每個參考特征之間的距離,時間開銷較大,這嚴(yán)重影響著實時判定的效率。
針對該問題,本文圍繞目標(biāo)航路實時異常判定問題,提出了一種基于集合重合性的在線快速判定方法,并給出了閾值設(shè)定的啟發(fā)式規(guī)則。該方法將實時軌跡相比于正常軌跡的偏離程度度量問題轉(zhuǎn)化為地理網(wǎng)格集合間的重合性計算問題,具有更好的計算效率,更加適合于工程應(yīng)用。
其中,ak為集合元素對應(yīng)的軌跡點數(shù)。當(dāng)相似性參數(shù)小于設(shè)定的門限值時,則認(rèn)為目標(biāo)出現(xiàn)了航路異常。
一般地,從GPS等定位設(shè)備采集的目標(biāo)軌跡點可以用p(x,y,v,t)來表示,其中x表示經(jīng)度,y表示緯度,t表示時間,v表示速度。因此,目標(biāo)軌跡T可以描述為目標(biāo)軌跡點的有序序列:
其中,pi表示目標(biāo)軌跡的第i個軌跡點。在下面的描述中,本文用Ttypical表示表示目標(biāo)正常軌跡,Tr表示目標(biāo)實時軌跡。
一般來說,同一目標(biāo)會存在多條正常軌跡,例如車輛、飛機(jī)、船舶等目標(biāo)在執(zhí)行不同任務(wù)時會形成不同的正常軌跡。本文重點關(guān)注如何計算目標(biāo)實時軌跡與正常軌跡之間的偏離程度,因此,不失一般性,本文以目標(biāo)僅有一條正常軌跡時的情況作為研究對象。
本文基于Geohash編碼[16],根據(jù)目標(biāo)實時軌跡點落入正常軌跡周邊區(qū)域的比例來判斷是否出現(xiàn)航路嚴(yán)重偏離情況。
假設(shè)截止到當(dāng)前時刻,目標(biāo)共有m個軌跡點,則其軌跡序列為
新的個稅法采用了按年納稅,工資薪金個稅預(yù)扣預(yù)繳采用了累計預(yù)扣法,并且還要在年終過后匯算清繳。收入的忽高忽低,對全年應(yīng)繳納的個稅總額不產(chǎn)生任何影響。
針對這種問題,不僅需要引航部門強(qiáng)化對于引航人才的有效培養(yǎng),不斷擴(kuò)大人才招聘范圍,加強(qiáng)與相關(guān)專業(yè)院校之間的有效合作,還需要地方政府加強(qiáng)在相關(guān)教育引導(dǎo)工作中的財政投入,加強(qiáng)教育管理,鼓勵相關(guān)院校強(qiáng)化引航相關(guān)專業(yè)人才的培養(yǎng)與教育工作,為船舶靠離泊航行安全提供更多的人才保障。另外,針對當(dāng)前各引航機(jī)構(gòu)在人才隊伍建設(shè)及管理方面的不足,也要求引航部門優(yōu)化人才管理制度,減少引航員的工作壓力與工作強(qiáng)度,提高工作待遇,保證引航員的良好情緒。
基于上述參數(shù)配置,偏離指標(biāo)隨時間的變化情況如圖4所示。需要說明的是,偏離指標(biāo)越小,表示目標(biāo)實時軌跡偏離其正常軌跡的程度越嚴(yán)重,即出現(xiàn)航路異常。
在對目標(biāo)實時軌跡進(jìn)行Geohash編碼時,統(tǒng)計并記錄每個集合元素對應(yīng)的實時軌跡點數(shù):
合同約定的內(nèi)容主要站在有利我方角度考慮,原則是我方權(quán)利越多越好,義務(wù)越少越好。并視具體合同而設(shè)置應(yīng)有的條款;合同履行條款的設(shè)置原則:合同相對人履行在先,我方履行在后。在約定我方付款期限時,要充分留足公司報銷流程時間,以免不能及時付款而造成違約。
假定目標(biāo)的正常軌跡Ttypical對應(yīng)的GeoHash編碼集合為set(Ttypical):
6)相關(guān)教育部門需要進(jìn)一步落實與完善體教結(jié)合機(jī)制,讓有潛力的學(xué)生在大學(xué)校園里,能夠接受高水平、系統(tǒng)的訓(xùn)練,以為我國女籃在未來的發(fā)展輸送更多的人才。
基于目標(biāo)實時軌跡和正常軌跡GeoHash集合數(shù)據(jù),定義目標(biāo)實時軌跡與目標(biāo)正常軌跡之間的偏離指標(biāo)計算公式,如下所示:
目標(biāo)航路實時異常判定的任務(wù)是:實時判定目標(biāo)是否偏離其正常軌跡,并在嚴(yán)重偏離時給出告警提示。該任務(wù)的關(guān)鍵是如何快速度量目標(biāo)實時軌跡偏離正常軌跡的程度。本文通過將偏離程度度量問題轉(zhuǎn)化為“地理網(wǎng)格集合間的重合性計算問題”,實現(xiàn)偏離程度的快速計算。
再次,培養(yǎng)多種情趣,用精彩的業(yè)余生活調(diào)節(jié)情緒。要有情感寄托的方法,合理地對自己不良情緒轉(zhuǎn)移。利用好教師的假期做好休息,行萬里路如讀萬卷書,游覽祖國名山大川,感受不同的生活方式,開闊視野,開闊胸襟,就能學(xué)會包容學(xué)會理解,就能在教育中營造和諧教育環(huán)境。學(xué)校及工會組織,在全體教師中多組織喜聞樂見的、豐富多彩的有益的體育活動和其它活動,讓教師在各種活動中和諧交往,增進(jìn)互相了解,從而使教師身心得到放松,保持旺盛的精力和飽滿的激情投入到教育教學(xué)中去[4]。
(2)草海濕地沉積物重金屬元素除Cu、As平均含量未超過貴州省土壤元素背景值,其他5種重金屬均超出貴州省土壤背景值含量,尤其是Cd,高達(dá)背景值21倍,可見草海存在嚴(yán)重的Cd污染。根據(jù)潛在生態(tài)危害指數(shù)的綜合分析可知:Cr、As、Pb和Zn污染較嚴(yán)重,其中Cd和Hg污染最嚴(yán)重,已達(dá)到極強(qiáng)的潛在生態(tài)危害程度。
需要注意的是,在目標(biāo)航路異常實時判定過程中,目標(biāo)的軌跡數(shù)據(jù)是不斷更新的,若積累的目標(biāo)軌跡點過多,則容易降低偏離指標(biāo)對航路異常的敏感性。因此,在實際中通常截取距離當(dāng)前時刻一段時間內(nèi)的有限軌跡點進(jìn)行偏離指標(biāo)計算。本文按指定長度Lp,選取截止到當(dāng)前時刻的目標(biāo)實時軌跡點。
本文提出的目標(biāo)航路實時異??焖倥卸ǚ椒ㄌ幚砹鞒倘鐖D2所示。
圖2 目標(biāo)航路實時異??焖倥卸鞒?/p>
在實施目標(biāo)航路實時異常判定時,需要設(shè)置的初始參數(shù)包括參與計算的目標(biāo)實時軌跡序列長度Lp、目標(biāo)軌跡點GeoHash編碼長度Lg和異常告警門限值EL,這些參數(shù)可根據(jù)實際情況設(shè)置。例如,對于參與計算的目標(biāo)實時軌跡序列長度Lp,可綜合考慮時間監(jiān)控窗口、目標(biāo)實時更新速率等因素來確定;對于GeoHash編碼長度,若要求目標(biāo)實時軌跡偏離正常軌跡的平均距離 ≤3km,則Lg可設(shè)置為5。特別地,對于異常告警門限值EL的設(shè)定,可按照以下啟發(fā)式規(guī)則進(jìn)行:
之所以選擇在接受理論視角下看文化缺省的翻譯,是因為在接受理論的核心概念中就包括“視域融合”,“未定點”等概念,這種“未定點”就是作者預(yù)留給讀者引起共鳴的,而文化缺省就是這種有意安排的“未定點”中的一類,同時它在文化構(gòu)建中也起著舉足輕重的作用,所以研究關(guān)于文化缺省翻譯的問題在以讀者為導(dǎo)向的閱讀過程中會更好地促進(jìn)讀者對于不同文化的欣賞同時又在其接受范圍內(nèi),不會影響作者與讀者的交流,從而使得跨文化交際更好更有效地進(jìn)行。
1)對于完全禁止目標(biāo)實時軌跡點偏離正常軌跡指定范圍的情況,可設(shè)置EL值為1;
兩個目標(biāo)的實時軌跡和正常軌跡如圖3所示,從圖中可以看出,空中目標(biāo)和海面目標(biāo)的實時軌跡與正常軌跡均存在嚴(yán)重偏離情況。
例如,若EL設(shè)置為0.8,則允許至多20%例外點出現(xiàn),也就是說當(dāng)80%以上的軌跡點落入正常軌跡區(qū)域時,則認(rèn)為該目標(biāo)沒有出現(xiàn)異常。
1)根據(jù)設(shè)定的GeoHash編碼長度,提取目標(biāo)正常軌跡編碼集合中每個元素的前Lg位編碼,形成參與計算的計算軌跡GeoHash編碼集合。需要說明是,該操作在整個實時判定過程中,僅需進(jìn)行一次,甚至可以提前將正常軌跡編碼集合存儲到相應(yīng)的數(shù)據(jù)庫中,在使用時僅進(jìn)行一次讀取操作即可;
2)根據(jù)設(shè)定的GeoHash編碼長度,計算目標(biāo)每個實時軌跡點的Geohash編碼,并在設(shè)定的軌跡序列長度Lp約束下,形成參與計算的實時軌跡Geohash編碼集合,記錄每個集合元素對應(yīng)的實時軌跡點數(shù);
我曾聽說何副書記原在外地因作風(fēng)問題才調(diào)到這兒來的。對領(lǐng)導(dǎo)干部這種“換地方”懲罰法不理解,只上不下,犯了錯誤就換個地方,就如小孩尿炕,把這床褥子尿了,再換一床,結(jié)果弄得床床都有臊氣,使人近前不得。這次鄉(xiāng)里懲治腐敗,像往常一樣,何副書記只敷衍一下。中央讓干點啥,到縣鄉(xiāng)兩級就松勁了。就像往水里扔石頭,中心激起的水浪高,然后向四周擴(kuò)展開去,越傳得遠(yuǎn)越低,最后波平浪靜。我為女站長擔(dān)起心來,但轉(zhuǎn)念一想,何必多管閑事!這女子如此風(fēng)流,倘若是周瑜打黃蓋——我們豈不成了豬八戒照鏡子?我正想回家,巴克夏卻說:“咱別回去了,反正也不太冷,就在辦公室睡吧!”
3)基于目標(biāo)實時軌跡和正常軌跡的Geohash編碼集合,根據(jù)式(6),完成偏離指標(biāo)Rs的計算。
根據(jù)設(shè)定的異常告警門限值,當(dāng)以下條件成立時:
1)參與計算的目標(biāo)實時軌跡序列長度Lp,設(shè)置為50;2)目標(biāo)軌跡點GeoHash編碼長度Lg,設(shè)置為5;3)異常告警門限值EL,設(shè)置為0.7。
由于本文所提方法基于目標(biāo)實時軌跡偏離正常軌跡的程度來判斷目標(biāo)是否出現(xiàn)航路異常,不涉及復(fù)雜的特征工程,實現(xiàn)原理清晰、可解釋,具有一般性和普適性,因此不需要利用大量數(shù)據(jù)進(jìn)行實驗分析。
利用ArcGIS軟件平臺,以更新后的榮成市第二次全國土地調(diào)查數(shù)據(jù)為本底數(shù)據(jù),以圖斑為最小單元,將收集到的各項數(shù)據(jù)進(jìn)行空間疊加分析及屬性空間化。參照相關(guān)技術(shù)要求計算各項指標(biāo)數(shù)值。
為了驗證所提出方法的有效性,本文利用某典型空中和海面目標(biāo)實測軌跡數(shù)據(jù)進(jìn)行實驗分析,對目標(biāo)軌跡數(shù)據(jù)進(jìn)行了脫敏處理:通過對其真實軌跡進(jìn)行偏移和重采樣作為其實時軌跡,并對實時軌跡進(jìn)行偏移和重采樣等處理,得到目標(biāo)正常軌跡。兩個目標(biāo)的實時軌跡參數(shù)如表1所示。
其中,HU(Hounsfield Unit)為三維空間中每個單元對于二維圖像的CT值,ρa(bǔ)sh為灰度密度值,E為相應(yīng)位置單元材料的彈性模量,單位為MPa。通過Mimics材料賦值模塊,完成骨骼網(wǎng)格模型的非均勻單元賦值。
表1 目標(biāo)實時航跡參數(shù)
2)對于允許目標(biāo)實時軌跡點出現(xiàn)例外的情況,可根據(jù)能夠接受的例外軌跡點數(shù)量占參與計算的目標(biāo)實時軌跡序列長度Lp的比例來計算。
根據(jù)實驗要求和經(jīng)費(fèi)情況可以選擇自己拍攝和專業(yè)公司拍攝:自己拍攝成本低、時間自由、可反復(fù)拍攝修改,但畫面質(zhì)量不如專業(yè)公司拍攝得清晰;專業(yè)公司拍攝畫面更精致,但成本更高,修改、重拍比較費(fèi)事。因此,可以自己簡單地拍攝,操作復(fù)雜的請專業(yè)公司拍攝。
圖3 目標(biāo)實時軌跡與正常軌跡示意圖
基于目標(biāo)航路實時異常判定流程,計算目標(biāo)實時軌跡與正常軌跡間的偏離指標(biāo),采用的初始參數(shù)配置如下:
則判定目標(biāo)出現(xiàn)航路偏離異常,并輸出告警信息。否則,則直接返回,等待新軌跡點的輸入。
其中,n為轉(zhuǎn)換后集合元素個數(shù)為第i個集合元素。需要說明的是,在進(jìn)行實時軌跡Geohash編碼時,編碼長度Lg可根據(jù)監(jiān)測需求給定。
日前,衡陽市不動產(chǎn)登記中心召開會議,通報了全國不動產(chǎn)登記窗口作風(fēng)問題的5個典型案例,同時也通報了群眾反映的該中心個別科室干部有可能收受紅包、參與吃喝宴請的現(xiàn)象,并要求各科室自我對照、自查自糾,堅決防止通報事件和群眾反映的現(xiàn)象發(fā)生。該中心權(quán)籍調(diào)查科科長在參加完上述會議后,召開了科室內(nèi)部會議,會議結(jié)束后,便由日常負(fù)責(zé)撰寫會議紀(jì)要的調(diào)查科科員草擬了上述的這份承諾書。
圖4 目標(biāo)軌跡相似性指標(biāo)隨時間的變化情況
從圖4中可以看出,無論是空中目標(biāo)還是海面目標(biāo),當(dāng)目標(biāo)實時軌跡開始偏離正常軌跡時,按照設(shè)定的門限值,可以很容易判斷出目標(biāo)出現(xiàn)了航路異常;隨著目標(biāo)開始慢慢回歸正常軌跡,其相似性指標(biāo)也逐漸提高,預(yù)示著偏離程度越來越小,與目標(biāo)實時軌跡與正常軌跡之間的距離變化趨勢相吻合。
為了定量評估所提方法的有效性,本文采用精確率、召回率和F1值等三個常用指標(biāo)[17]進(jìn)行評估。本文通過對目標(biāo)實時航跡與正常軌跡間距離設(shè)置門限值來得到真值數(shù)據(jù)。由于本實驗中Geo-Hash編碼長度設(shè)置為5,因此距離門限值設(shè)置為2.5km,即當(dāng)航跡間距離大于2.5km時,則認(rèn)為目標(biāo)出現(xiàn)異常?;陬A(yù)測數(shù)據(jù)和真實數(shù)據(jù),評估結(jié)果如表2所示。
表2 多指標(biāo)評估結(jié)果
從評估結(jié)果可以看出,本文方法在目標(biāo)航路實時異常檢測方面,具有較高的判定準(zhǔn)確率。
在實際中,基于Hausdorff距離的經(jīng)典方法應(yīng)用最為廣泛,在原理上與本文所提方法相同,僅偏離指標(biāo)的計算方式不同。為了驗證所提方法計算的高效性,本文利用上述數(shù)據(jù),對所提方法與基于Hausdorff距離的經(jīng)典方法的計算效率進(jìn)行對比分析。
首先,從理論方面來看,由Hausdorff距離的定義可知,針對目標(biāo)的每個實時軌跡點,基于Hausdorff距離的經(jīng)典方法需要計算實時軌跡點與每個正常軌跡點之間的距離,然后取最小值作為該點到正常軌跡的距離,最后與設(shè)定閾值比對實現(xiàn)航路是否異常的判定,因此其計算量與正常軌跡的點數(shù)正相關(guān);而本文所提方法,僅僅需要計算每個實時軌跡點的GeoHash編碼,然后判斷該編碼是否出現(xiàn)在正常軌跡編碼集合中即可實現(xiàn)航路是否異常的判定。因此,直覺上本文方法具有更高的計算效率。
根據(jù)以上論述,利用時間復(fù)雜度分析理論,對兩種方法一次判定中,關(guān)鍵步驟的最差時間復(fù)雜度進(jìn)行分析,如表3所示,其中M為正常軌跡原始長度,N為正常軌跡編碼集合大小,且N遠(yuǎn)小于M。
表3 時間復(fù)雜度分析結(jié)果
從表3中理論分析結(jié)果可知,基于Hausdorff距離的經(jīng)典方法的時間復(fù)雜度要高于本文所提方法。需要注意的是,實際的運(yùn)行時間還與距離計算時間、GeoHash編碼時間、運(yùn)行環(huán)境配置等因素有關(guān)。
接下來,本文以實驗方式,對兩種方法的計算效率進(jìn)行對比分析。實驗環(huán)境配置如表4所示。
表4 實驗環(huán)境配置
為了減少統(tǒng)計的隨機(jī)性,本文對每條數(shù)據(jù),進(jìn)行10次實驗并取平均值作為實驗結(jié)果。兩種方法全面完成目標(biāo)航路實時異常判定的時間統(tǒng)計結(jié)果如表5所示。
表5 兩種方法實測時間對比
從表中可以看出,本文方法具有更高的計算效率,并且目標(biāo)軌跡點數(shù)越多,計算效率提升越明顯。
針對目標(biāo)航路實時異常判定問題,本文提出了一種基于集合重合性的快速判定方法,將實時軌跡相比于正常軌跡的偏離程度度量問題轉(zhuǎn)化為地理網(wǎng)格集合間的重合性計算問題,并給出了閾值設(shè)定的啟發(fā)式規(guī)則。實驗結(jié)果表明,該方法能夠?qū)崿F(xiàn)目標(biāo)航路異常的實時判定,適用于不同類型目標(biāo),并且具有更好的計算效率。
本文方法是一種面向?qū)崟r監(jiān)測場景、非監(jiān)督式的航路異常判定方法,具有實現(xiàn)簡單、可解釋性好、無需標(biāo)注數(shù)據(jù)、計算效率高等特點,適合于監(jiān)控目標(biāo)明確、目標(biāo)存在預(yù)設(shè)軌跡或經(jīng)典軌跡的監(jiān)控場景,具有一定的工程應(yīng)用價值。但是,面向目標(biāo)經(jīng)典軌跡未知或難以挖掘、多類型異常綜合分析、大數(shù)據(jù)樣本分析等復(fù)雜場景,具有強(qiáng)大規(guī)律挖掘和數(shù)據(jù)擬合能力的基于深度神經(jīng)網(wǎng)絡(luò)的目標(biāo)異常判定方法是未來的主流發(fā)展方向。此外,將深度神經(jīng)網(wǎng)絡(luò)與氣象、水文、航道拓?fù)浣Y(jié)構(gòu)、航行規(guī)則等知識相結(jié)合的情境分析方法將是更加前沿的研究方向。