何俊
摘 要:大數(shù)據(jù)作為計算機互聯(lián)網(wǎng)技術(shù)發(fā)展的特征與產(chǎn)物,對人們的工作、生活和學(xué)習(xí)等各個方面影響日益顯著。在智慧機場建設(shè)過程中,大數(shù)據(jù)為自動化運維帶來海量數(shù)據(jù),為航班正常性提升創(chuàng)造可能、為機場旅客提供個性化服務(wù),但也面臨著互聯(lián)互通存在障礙、數(shù)據(jù)價值稀疏分布以及信息安全問題凸顯的實際挑戰(zhàn)。因此文章提出了建立統(tǒng)一層次架構(gòu)數(shù)據(jù)平臺,運用技術(shù)手段加強分析挖掘,多種措施并舉保障網(wǎng)絡(luò)安全。
關(guān)鍵詞:大數(shù)據(jù);智慧機場建設(shè);數(shù)據(jù)分析
0 引言
民航局在《中國民航四型機場建設(shè)行動綱要(2020—2035年)》文件中指出,綜合運用大數(shù)據(jù)、人工智能等新技術(shù),收集、融合、統(tǒng)計和分析各類數(shù)據(jù),最終實現(xiàn)機場智慧化運行。大數(shù)據(jù)從本質(zhì)上看是一種超過普通計算機硬件和軟件物理存儲空間和運行計算能力的海量數(shù)據(jù)集合,由于其蘊含著人們生產(chǎn)生活進步的潛在知識和價值,對大數(shù)據(jù)的分析使用成為民航高質(zhì)量發(fā)展和民航強國建設(shè)的重要組成部分。智慧機場建設(shè)作為實現(xiàn)未來“四型機場”的關(guān)鍵路徑和重要支撐,要積極適應(yīng)大數(shù)據(jù)所帶來的時代機遇和應(yīng)用挑戰(zhàn)。
1 大數(shù)據(jù)時代智慧機場建設(shè)面臨的機遇
1.1? 為自動化運維帶來海量數(shù)據(jù)
國際數(shù)據(jù)公司(IDC)在其《數(shù)據(jù)時代2025》白皮書指出,伴隨著傳統(tǒng)產(chǎn)業(yè)與移動互聯(lián)網(wǎng)技術(shù)深度融合,傳統(tǒng)產(chǎn)品不斷數(shù)字化轉(zhuǎn)型,數(shù)字經(jīng)濟不斷崛起,核心數(shù)據(jù)、邊緣數(shù)據(jù)、終端數(shù)據(jù)將快速增長,到2025年全球數(shù)據(jù)量預(yù)計達到175ZB,數(shù)據(jù)總量將會是現(xiàn)在的4倍以上。如果將這些數(shù)據(jù)存儲至普通固態(tài)硬盤當(dāng)中并首尾相連擺放,是地球赤道長的12倍多。在大數(shù)據(jù)時代中,紙質(zhì)書籍通過掃描識別成為數(shù)據(jù),交流談話通過模數(shù)變換成為數(shù)據(jù),秀美風(fēng)光通過動態(tài)感應(yīng)成為數(shù)據(jù),當(dāng)一切現(xiàn)象都被數(shù)據(jù)化并抓取后,大量數(shù)據(jù)就會被收集存儲起來,供使用者進行分析挖掘[1]。對于智慧機場而言,候機樓溫度和亮度傳感信息的收集分析,有助于動態(tài)調(diào)節(jié)冷暖設(shè)備和照明設(shè)備的使用功率,在提升旅客舒適性的同時有效降低能耗;航空器離港進港數(shù)據(jù)和機場機位信息的挖掘處理,有利于平衡過夜機位資源,促使區(qū)域內(nèi)機場機位合理設(shè)計規(guī)劃。大數(shù)據(jù)倚靠海量抓取和分布存儲提供了傳統(tǒng)方式難以獲取和收集的海量、客觀、真實數(shù)據(jù),為智慧機場高效、環(huán)保、精細的自動化運維奠定基礎(chǔ)。
1.2 為航班正常性提升創(chuàng)造可能
數(shù)據(jù)有著顯著的時效性特征,對于連續(xù)發(fā)生運動變化的事物,只有在最快的時間單位內(nèi)進行解析,才能更好地利用其中難以挖掘的價值。大數(shù)據(jù)擁有對數(shù)據(jù)高速處理的獨有能力,百度運用大數(shù)據(jù)技術(shù),在1秒鐘之內(nèi)就能對全國人民? ? ? ?1 000萬次的密集服務(wù)器請求進行處理,并保證手機APP應(yīng)用和網(wǎng)站服務(wù)訪問穩(wěn)定流暢。2010—2019年,全國定期航班航線由1 880條增加至5 521條,年旅客吞吐量100萬人次以上的運輸機場由51個上漲至106個,但航班正常率僅從75.8%提高至81.65%,正常率相比穩(wěn)定的公路運輸和鐵路運輸仍具有一定差距。借助大數(shù)據(jù)對天氣信息、空域流量、航空器位置、候機樓旅客人數(shù)等動態(tài)數(shù)據(jù)采取實時監(jiān)控,利用相關(guān)關(guān)系分析建模,合理預(yù)測可能發(fā)生的延誤情況,在關(guān)鍵時間節(jié)點進行主動預(yù)警。一方面可以讓機場服務(wù)人員提前進行應(yīng)急預(yù)案,預(yù)先采取應(yīng)對措施,幫助減少大規(guī)模滯留旅客情形;另一方面也可以讓航空公司及時應(yīng)對,合理調(diào)配資源,降低因各種意外事件而導(dǎo)致航班延誤的經(jīng)濟損失[2]。大數(shù)據(jù)高速分析數(shù)據(jù)的特性使得智慧機場提升航班正常性成為可能。
1.3 為機場旅客提供個性化服務(wù)
大數(shù)據(jù)萬物皆可量化的特性使其內(nèi)容包涵了人們?yōu)g覽網(wǎng)頁歷史、餐廳消費記錄、微博微信評論等,最難能可貴的是這些信息避免了傳統(tǒng)問卷調(diào)查可能造成的主觀影響,是人們內(nèi)心所思所想、動態(tài)變化的真實寫照。在大數(shù)據(jù)背景下,智慧機場“以體驗為導(dǎo)向”的建設(shè)運營理念更容易得以實現(xiàn),來源各異的旅客行為軌跡經(jīng)過清洗和建模形成獨一無二的“旅客畫像”,從而進行有針對性服務(wù)內(nèi)容推送。例如,對行李較少、時間緊促的旅客適當(dāng)提早推送值機提醒,并在其到達候機樓時提示使用自助值機和通過快速安檢通道的路線;對消費較高、時間寬松的商務(wù)旅客推薦專車接送、貴賓室候機服務(wù);對空鐵聯(lián)程旅客則及時發(fā)送航班執(zhí)行情況、鐵路列車運行時刻和公共交通工具線路,幫助他們提前做出規(guī)劃,實現(xiàn)綠色便捷出行。通過大數(shù)據(jù)收集分析和互聯(lián)共享技術(shù),機場部門、航空公司、商業(yè)實體、駐場單位等各個模塊可以緊密聯(lián)系,深度合作,實現(xiàn)“千人千面”的個性化服務(wù),讓旅客體驗全面突破。
2 大數(shù)據(jù)時代智慧機場建設(shè)面臨的挑戰(zhàn)
2.1 互聯(lián)互通存在障礙
當(dāng)前機場部署運行了包括民航管理部門、本場部門、航空公司、駐場保障單位的協(xié)同決策、運行控制、離港航班等各種信息服務(wù)系統(tǒng),每日收集處理著航班起降、貨物轉(zhuǎn)運、現(xiàn)場監(jiān)控等紛繁復(fù)雜的大量數(shù)據(jù)。大數(shù)據(jù)加劇了不同數(shù)據(jù)格式、數(shù)據(jù)維度、數(shù)據(jù)類型的差異性,減少了同一平臺進行數(shù)據(jù)加工分析的兼容性,降低了采用規(guī)模化集成化手段的可能性。同時,不同系統(tǒng)中提取、去重、轉(zhuǎn)換的大數(shù)據(jù)清理流程和手段造成了質(zhì)量各異的數(shù)據(jù),這些信息定義不一、解釋模糊,缺乏統(tǒng)一嚴(yán)格的數(shù)據(jù)標(biāo)準(zhǔn),無法在多機器進行消息互聯(lián)互通時保證其正確性、精準(zhǔn)性和可信度,數(shù)據(jù)價值大大下降。此外,各方對數(shù)據(jù)資源的管理權(quán)、使用權(quán)和共享義務(wù)暫不明確,數(shù)據(jù)擁有者自成體系、各行為政,數(shù)據(jù)交換通道狹窄,邊界效應(yīng)明顯,信息壁壘森嚴(yán);數(shù)據(jù)使用者往往需要經(jīng)歷復(fù)雜漫長的申請審批流程才能獲得原始內(nèi)容,難以挖掘利用具有時效性的數(shù)據(jù)。
2.2 數(shù)據(jù)價值稀疏分布
一方面,隨著人們對數(shù)據(jù)的認(rèn)知不斷更新和計算機軟硬件設(shè)備不斷迭代,來自航站樓的環(huán)境溫度濕度感測,來自機坪的工作人員軌跡數(shù)據(jù)、和來自倉庫物品分揀路徑信息等AOBD精細化數(shù)據(jù)也被大數(shù)據(jù)自動化系統(tǒng)和多陣列硬盤所記錄和存儲,數(shù)據(jù)總量不斷增大,數(shù)據(jù)厚度不斷提升。這些數(shù)據(jù)狀態(tài)不一、內(nèi)容各異,包含的價值也不盡相同,有助于提升智慧機場建設(shè)的有效信息往往只是異構(gòu)多態(tài)大數(shù)據(jù)的滄海一粟,需要運用算法進行分析挖掘。另一方面,集成網(wǎng)絡(luò)架構(gòu)和無人值守設(shè)備的大量投入雖然降低了機房煩瑣人工運營成本,但讓日常調(diào)試信息、設(shè)備告警提示、服務(wù)異常報告等冗余數(shù)據(jù)日積月累。同時,由于傳統(tǒng)介質(zhì)年久失修,部分記錄了航班起降歷史、設(shè)備性能狀態(tài)、旅客出港記錄的紙張和磁盤破損失效,經(jīng)過量化后錯誤進一步增加,具有特定價值的數(shù)據(jù)比例持續(xù)降低。大數(shù)據(jù)時代數(shù)字信息價值密度稀疏,從數(shù)據(jù)提取出為特定目標(biāo)精準(zhǔn)的有效信息難度加大。
2.3 信息安全問題凸顯
在旅客吞吐量迅猛增加的背景下,民航重要信息系統(tǒng)中的離港系統(tǒng)、安監(jiān)系統(tǒng)、運維系統(tǒng)、廣播系統(tǒng)等各種子系統(tǒng)均存儲著海量高維度數(shù)據(jù),這些數(shù)據(jù)內(nèi)容不同、相互依賴、關(guān)系錯綜復(fù)雜,其中不免包含了旅客身份識別、個人消費習(xí)慣、機位調(diào)度信息、貨運交互數(shù)據(jù)等大量重要信息。2017年? 2月,紐約斯圖爾特國際機場包含了電子郵件、政府文件和交易密碼的750GB內(nèi)部敏感數(shù)據(jù)被泄露至互聯(lián)網(wǎng)上;2020年? ?1月,國航員工通過提取航班數(shù)據(jù)將部分明星的乘機信息、活動軌跡等私人信息發(fā)布至微博;2020年3月,舊金山國際機場的兩個網(wǎng)站被黑客攻破,備用航線、機場運營、機場建設(shè)信息被不法人士獲取。大數(shù)據(jù)背景下,越來越多的終端通過無線信號和電纜光纖連接至服務(wù)器上,設(shè)備“接入點”數(shù)量增加、范圍擴大,傳統(tǒng)的內(nèi)外分開、風(fēng)險隔離的邊界防護被打破,一旦出現(xiàn)物理設(shè)備故障、信息系統(tǒng)被攻擊、通信線路干擾等,都會使信息安全受到嚴(yán)重威脅,輕者會造成非正常航班增加、部分旅客信息泄露,重者會危及飛行安全甚至國家安全。
3 大數(shù)據(jù)時代智慧機場建設(shè)的策略
3.1 建立統(tǒng)一層次架構(gòu)數(shù)據(jù)平臺
應(yīng)構(gòu)建以機場為中心的統(tǒng)一智慧大數(shù)據(jù)處理應(yīng)用平臺,自上而下分為5個層級,其中包括具體應(yīng)用層、門戶界面層、支撐服務(wù)層、感知接入層和基礎(chǔ)資源層。具體應(yīng)用層為基于機場、航空公司的旅客服務(wù)、安全生產(chǎn)等業(yè)務(wù)需求而定制開發(fā)的各項服務(wù)應(yīng)用;門戶界面層給不同權(quán)限的平臺應(yīng)用人員和系統(tǒng)支撐人員提供管理接口界面,便于訪問和檢索多維度數(shù)據(jù);支撐服務(wù)層承載平臺收集清洗、變換分析、挖掘建模的大數(shù)據(jù)技術(shù)核心應(yīng)用,同時運行面向事務(wù)消息和過程隊列的中間件,提供資源管理、負(fù)載均衡、故障恢復(fù)等必要服務(wù);感知接入層集合無線局域網(wǎng)、Bluetooth mesh、NB-IoT多途徑通訊模塊,為各種接入設(shè)備建立覆蓋廣闊、安全穩(wěn)定、低延遲低功耗的數(shù)據(jù)傳輸通道;基礎(chǔ)資源層包括客戶端、服務(wù)器硬件設(shè)備資源,基礎(chǔ)操作系統(tǒng)、分布式計算系統(tǒng)及環(huán)境配置等軟件資源,以及結(jié)構(gòu)化和非結(jié)構(gòu)化存在的數(shù)據(jù)資源。同時還要綜合實際業(yè)務(wù)需求、硬件設(shè)備計算能力和預(yù)留未來需要,制定標(biāo)準(zhǔn)化的數(shù)據(jù)采集、處理、儲存的處理流程,規(guī)定數(shù)據(jù)在常用應(yīng)用場景的語義解釋,在平臺內(nèi)建立統(tǒng)一數(shù)據(jù)視圖來減輕和消除數(shù)據(jù)差異,為大數(shù)據(jù)技術(shù)助力智慧機場建設(shè)奠定堅實基礎(chǔ)。
3.2 運用技術(shù)手段加強分析挖掘
在智慧機場建設(shè)的過程中訂座系統(tǒng)、地服系統(tǒng)、監(jiān)控平臺積累了數(shù)以萬計的數(shù)據(jù)和信息,要運用大數(shù)據(jù)技術(shù)手段對其進行處理分析,使數(shù)據(jù)在交叉復(fù)用中發(fā)揮更大價值。對于設(shè)備運行數(shù)據(jù),將服務(wù)器滾動日志、門禁動態(tài)數(shù)據(jù)、硬件告警事件等海量信息進行實時聚類分析,快速定位異常離群點,智能調(diào)度維護人員,提高管理效率,減少運維成本;同時采用相關(guān)關(guān)系分析,找到與系統(tǒng)故障出現(xiàn)高度關(guān)聯(lián)的“標(biāo)示值”,加強對特定數(shù)據(jù)的采集監(jiān)控及管控,促使故障發(fā)生率降低。對于航班狀態(tài)數(shù)據(jù),借助決策樹和隨機森林算法,使飛行路線、機場服務(wù)、氣象預(yù)報、交通管制數(shù)據(jù)流在清洗和轉(zhuǎn)換后經(jīng)個體學(xué)習(xí)和集成學(xué)習(xí),建立航班預(yù)測模型,根據(jù)實際情況細化各個流程的閾值,在超過時間節(jié)點時主動實施響應(yīng)措施,實現(xiàn)航班延誤由“事后處理”到“事前干預(yù)”的轉(zhuǎn)變。對于人員流動數(shù)據(jù),一方面利用離港信息、位置定位、人臉數(shù)據(jù)的互聯(lián)互通,實現(xiàn)候機樓旅客的全流程自助無紙化通關(guān)和便捷改簽機票;另一方面可以使用邏輯回歸把個人基本信息、航班日期時間、交通方式偏好、餐食飲用習(xí)慣等特征映射到向量空間,利用貝葉斯算法構(gòu)建屬于個人獨一無二的“旅客畫像”,借助畫像標(biāo)簽推薦旅客采購當(dāng)?shù)靥厣a(chǎn)品,運用協(xié)同過濾將擁有相似特征旅客的出行工具、便捷通道、貴賓廳服務(wù)進行同步推送,采用自然語言處理分析微信微博中旅程評價的情感傾向,提供個性化服務(wù),完善人性化措施。
3.3 多種措施并舉保障網(wǎng)絡(luò)安全
首先,要加強網(wǎng)絡(luò)攻擊檢測和應(yīng)對。在日常網(wǎng)絡(luò)維護管理時需要進一步加固系統(tǒng),及時更新軟件版本、關(guān)閉危險端口、使用掃描工具進行安全巡檢。同時,運用系統(tǒng)運行日志、監(jiān)控狀態(tài)記錄、異常行為表現(xiàn)進行關(guān)聯(lián)分析,建立攻擊檢測模型框架從而對APT攻擊、DDoS洪泛攻擊等針對大數(shù)據(jù)系統(tǒng)的常見網(wǎng)絡(luò)攻擊進行識別,以便形成快速響應(yīng)特殊情況,最大程度減少損失。其次,要完善數(shù)據(jù)訪問控制。大數(shù)據(jù)場景下,用戶跨系統(tǒng)、跨安全域訪問操作增多,信息流轉(zhuǎn)、分析挖掘等處理流程煩瑣,必須采取有效的訪問控制手段確保數(shù)據(jù)免遭非法用戶的讀取與改寫?;趯傩缘脑L問控制改變了以服務(wù)提供商為分配管理中心的常規(guī)模式,利用主體與客體之間的屬性關(guān)系將訪問結(jié)構(gòu)與密文密鑰高度關(guān)聯(lián),數(shù)據(jù)擁有者只需要通過修改訪問結(jié)構(gòu)即可實現(xiàn)靈活多變的權(quán)限管理[3]。它解決了面對龐大用戶群體頻繁訪問服務(wù)器的問題,無須逐一分發(fā)屬性密鑰,實現(xiàn)了由“一對一”管理向“一對多”管理,有效降低計算開銷和傳輸壓力。最后,要確保數(shù)據(jù)服務(wù)隱私保護及關(guān)鍵信息脫敏。機場在進行數(shù)據(jù)共享和挖掘時不免涉及旅客個人身份、航空器位置、設(shè)備運行日志等隱私信息和關(guān)鍵信息,采用高效可靠的隱私保護與數(shù)據(jù)脫敏技術(shù),為解決隱私泄露問題提供堅實保障。可以在信息交換分析時引入脫敏和k-匿名方法,對數(shù)據(jù)中可以定位到個人的標(biāo)示符值進行保留格式加密或直接刪除,對具有潛在風(fēng)險的準(zhǔn)標(biāo)示符值運用泛化和壓縮脫敏,再將全體數(shù)據(jù)歸為若干個等價組,每個等價組最小包含k條數(shù)據(jù),防止不法分子通過大數(shù)據(jù)鏈?zhǔn)焦魺o法確定與特定用戶相關(guān)的記錄,保護個人隱私。
[參考文獻]
[1][英]維克托·邁爾·舍恩伯格,肯尼思·庫克耶.大數(shù)據(jù)時代[M].杭州:浙江人民出版社,2013.
[2]孫召利,董桂枝,吳艷,等.大數(shù)據(jù)在民航領(lǐng)域應(yīng)用的初步研究[J].空運商務(wù),2014(2):11-16,64.
[3]毋濤,張帆.云計算下基于屬性的訪問控制方法[J].計算機系統(tǒng)應(yīng)用,2016(2):231-234.
(編輯 傅金睿)