左毅 孫卓
摘要:近年,大量的數(shù)據(jù)朝著公開化發(fā)展,很多數(shù)據(jù)已經(jīng)可以在網(wǎng)絡上直接進行存儲、讀寫乃至計算等操作。隨之而來的大數(shù)據(jù)時代和云計算時代,要求學生具備效率的數(shù)據(jù)存儲能力、快速的數(shù)據(jù)處理能力以及有效的數(shù)據(jù)分析能力。因此,在教學中針對以上三個主要問題,將引入云存儲和云計算等新一代信息技術,并結合航海特色對實際數(shù)據(jù)進行存儲、讀寫和分析等處理。使學生在大數(shù)據(jù)時代和云計算時代,掌握實際應用的一系列相關技能和技術。
關鍵詞:云存儲;云計算;大數(shù)據(jù);航海科學與技術;AIS數(shù)據(jù)
21世紀是海洋的世紀,“向海則興,背海則衰”已在世界范疇形成廣泛共識。2019年,交通運輸部聯(lián)合中央網(wǎng)信辦、國家發(fā)改委等7部門發(fā)布《智能航運發(fā)展指導意見》,同樣為智能航運未來30年發(fā)展指明方向,要求以一流的技術、一流的管理為“一帶一路”建設服務好,提升港口碼頭和航運基礎設施的信息化智能化水平。根據(jù)《智能航運發(fā)展指導意見》,將通過融合大數(shù)據(jù)、云計算、人工智能等新一代信息技術、建設“1個平臺+N個應用”的綜合智能航運示范工程,以突破關鍵技術瓶頸,填補國內交叉學科領域的空白。
一、新技術需求下面臨的主要科學與技術問題
在各行各業(yè)都熱烈擁抱人工智能,推動數(shù)字化改革的創(chuàng)新新時代,航運業(yè)的信息化、網(wǎng)絡化乃至智能化的發(fā)展略顯滯后,甚至出現(xiàn)與時代脫節(jié)的種種跡象。究其原因,主要體現(xiàn)在以下幾個方面:
(1)現(xiàn)有的船舶管理多集中于線下服務、以人工為主,航企亟需從傳統(tǒng)的粗放管理模式向信息化的精細管理模式轉變。
(2)由于航運業(yè)務建設的階段性,業(yè)務數(shù)據(jù)呈現(xiàn)出多樣性,采用不同的存儲方式,使得數(shù)據(jù)多源異構問題尚未得到根本解決,航運數(shù)字化進程推展緩慢。
(3)缺乏深度挖掘海事大數(shù)據(jù)價值的系統(tǒng)性技術和智能化方法,在數(shù)據(jù)計算、結果分析以及決策支持等方面仍存在一定的技術性空白亟待填補。
二、新時代引領下航海類創(chuàng)新人才的必備條件
在“十四五”和國家一流學科建設規(guī)劃中,明確提出了“興海強?!卑l(fā)展戰(zhàn)略,并把海事大數(shù)據(jù)以及航運通用人工智能等作為學科建設的重點科研發(fā)展方向。本課程旨在通過整合學校優(yōu)勢資源,圍繞主要研究方向開展聯(lián)合攻關,以高素質拔尖創(chuàng)新人才和學際融合數(shù)據(jù)科學家培養(yǎng)為首要目標,以建成交通運輸工程以及海上信息工程領域航海類人才培養(yǎng)高地為最高遠景。
(1)通過引入數(shù)據(jù)庫基礎知識,使學生掌握數(shù)據(jù)的結構化特點,并能夠掌握效率化的存儲、讀寫等技巧。
(2)通過引入統(tǒng)計學基礎知識,使學生具備數(shù)據(jù)分析能力,并掌握基本的數(shù)據(jù)可視化技術。
(3)應用實驗室的云平臺,使學生掌握云存儲、云計算、機器學習等相關技能。
三、新一代信息技術在教學中的應用實踐
本課程立足于新一代信息技術、交通運輸工程與計算機科學的交叉學科領域,推動技術進程和產(chǎn)業(yè)進程交互發(fā)展,培養(yǎng)航海類學生在大數(shù)據(jù)、云計算和人工智能三個方面的理論應用與實踐創(chuàng)新。
3.1 AIS數(shù)據(jù)的云存儲
AIS(Automatic Identification System)即船舶自動識別系統(tǒng),是一種不依賴于雷達的助航系統(tǒng),將船舶的航行信息包括經(jīng)緯度、航速、航向等信息實時的傳送至AIS基站以及附近船舶,多用于船舶航行監(jiān)管以及會遇預警等方面。在船舶高速行駛中,AIS的傳輸頻次高達2秒/次,即使在使用信息壓縮等技術前提下,依然會產(chǎn)生海量數(shù)據(jù),也使得AIS數(shù)據(jù)成為真正意義上的大數(shù)據(jù)。本課程中,將通過非關系型數(shù)據(jù)庫來對AIS數(shù)據(jù)進行存儲,并將AIS數(shù)據(jù)庫置于云端服務器,解決多用戶同時訪問帶來的高并發(fā)問題。同時,課程給學生提供多樣化的終端訪問,包括個人電腦和智能手機,讓學生可以隨時隨地的訪問AIS數(shù)據(jù),并對數(shù)據(jù)進行各種操作。
3.2 AIS數(shù)據(jù)的云計算
在存儲空間受限、以及通信實效性高等前提要求下,AIS數(shù)據(jù)通常采用了壓縮編碼的方式進行存儲,僅在需要的時候,利用解碼技術將數(shù)據(jù)轉化為實際的AIS數(shù)據(jù)。通常需要轉化的數(shù)據(jù)包括:記錄時間、經(jīng)緯度、航速和航向。授課中,學生可以通過各自的客戶終端對服務器云端的數(shù)據(jù)進行直接訪問,根據(jù)船舶的MMSI(Maritime Mobile Service Identify)水上移動通信業(yè)務標識碼提取目標船舶的航跡信息。之后,根據(jù)各自需求,可以將提取的AIS數(shù)據(jù)下載到本地,以便后續(xù)進行分析。
3.3 AIS數(shù)據(jù)的應用實踐
本課程在應用實踐方面,將引導學生自主完成基于AIS數(shù)據(jù)的航跡預測專家系統(tǒng)建立,包括以下3項內容:
(1)AIS數(shù)據(jù)的預處理:主要是剔除AIS數(shù)據(jù)中異常點的過程,包含位置異常點、航速異常點以及航向異常點。位置異常點通常指航跡位置信息超出目標區(qū)域邊界,通過邊界約束條件來剔除異常點;航速異常點和航向異常點通常指相鄰兩點的航速/航向變化超過規(guī)定閾值,通過閾值來判定并剔除異常點。
(2)航跡的特征提?。和ǔ2捎玫姆椒ㄓ蠨P法(Douglas–Peucker algorithm)和LCSCA(Least-squares Cubic Spline Curves Approximation)最小二乘三次樣條擬合算法,在保持航跡復現(xiàn)率的情況,優(yōu)化航跡的簡化率。
(3)航跡擬合及預測:為學生提供線性回歸、支持向量回歸以及人工神經(jīng)網(wǎng)絡等方法,讓學生自主完成航跡預測模型的建立,形成從數(shù)據(jù)的存儲讀寫、計算分析到應用實踐的體系化閉環(huán)培養(yǎng)模式。
四、結語
隨著大數(shù)據(jù)、云計算、人工智能等技術的推進,各行各業(yè)在規(guī)劃、管理、決策等方面都要以大數(shù)據(jù)分析為基礎,依托云計算平臺的支撐,通過基于人工智能的專家系統(tǒng)來提供決策支持服務。因此,在推動技術進程和產(chǎn)業(yè)進程交互發(fā)展的雙輪驅動下,滿足產(chǎn)業(yè)發(fā)展需求的數(shù)據(jù)科學家成為新一代信息技術時代最為緊缺的人才。所以,本課程以培養(yǎng)能夠科學地分析各行各業(yè)大數(shù)據(jù)的專業(yè)型人才為目標,使學生們掌握云存儲和云計算等實際應用的一系列技能和技術,為學生們提供數(shù)理統(tǒng)計、計算機科學、人工智能等交叉學科領域的跨學科教育體制,拓展他們的學術視野,助力他們成為新一代學際融合數(shù)據(jù)科學家,為各行各業(yè)提供高素質拔尖創(chuàng)新人才。
參考文獻:
[1]交通運輸部.智能航運發(fā)展指導意見.交海發(fā)〔2019〕66號,2019.
[2]李建中、王珊.數(shù)據(jù)庫系統(tǒng)原理.電子工業(yè)出版社,2008.
[3]劉志紅. Excel統(tǒng)計分析與應用.電子工業(yè)出版社,2016.
[4]Christopher M. Bishop. Pattern Recognition and Machine Learning. Springer,2006.
本文系遼寧省教育廳普通高等學校校際合作項目委托課題“研究生聯(lián)合培養(yǎng)”(10151)的成果之一。
作者簡介:
左毅,大連海事大學航海學院特聘教授/海事大數(shù)據(jù)與航運通用人工智能協(xié)同創(chuàng)新中心主任,博士研究生,從事數(shù)據(jù)科學、機器學習、人工智能等研究;
孫卓,大連海事大學交通運輸管理學院教授,博士研究生。