袁 芳
(中國氣象局氣象干部培訓(xùn)學(xué)院湖北分院 湖北武漢 430074 )
美國學(xué)者1956年首次提出“機器能像人那樣理解、思考和學(xué)習(xí)”,百度百科定義人工智能是“研究、開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)”,將其視為計算機科學(xué)的一個分支。筆者理解為“實現(xiàn)借助人類智慧完成任務(wù)的機器所采用的理論,技術(shù)和方法?!?/p>
人工智能分為弱人工智能和強人工智能。弱人工智能不能像人類智能那樣能夠不斷適應(yīng)新環(huán)境并由此產(chǎn)生解決問題的新功能。目前主流研究仍然集中于弱人工智能,如語音識別、圖像處理和機器翻譯。
強人工智能是指能思維的智能機器,并且是有知覺的和自我意識的,科幻電影里已刻畫出鮮明的人物形象。部分專家認為未來幾十年內(nèi)難以真正實現(xiàn)。[1]
1.機器學(xué)習(xí)
機器學(xué)習(xí)是一門涉及眾多學(xué)科的交叉學(xué)科,它涉及統(tǒng)計學(xué)、神經(jīng)網(wǎng)絡(luò)、優(yōu)化理論、計算機科學(xué)、腦科學(xué)等很多領(lǐng)域,傾向于研究計算機如何模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)過程,以自行學(xué)會新的知識或技能。主要從樣本出發(fā)尋找規(guī)律,并對未來數(shù)據(jù)或無法觀測的數(shù)據(jù)進行預(yù)測。
2.知識圖譜
知識圖譜是結(jié)構(gòu)化的語義知識庫,是由節(jié)點和邊組成的圖數(shù)據(jù)結(jié)構(gòu),形象地說,它把各種信息連接在一起而得到的一個圖形數(shù)據(jù)結(jié)構(gòu),提供了用圖形數(shù)據(jù)結(jié)構(gòu)之間的關(guān)系去分析問題的方法。知識圖譜可用于一些公共安全保障領(lǐng)域,在搜索引擎和精準營銷方面有很大的優(yōu)勢。
3.自然語言處理
自然語言處理它是研究如何用自然語言實現(xiàn)人與計算機之間通信的理論和方法,包括機器翻譯、機器閱讀理解和問答系統(tǒng)等內(nèi)容。
4.人機交互
人機交互它是研究人和計算機之間如何進行信息交換,一般包括基本交互、圖形交互、語音交互、情感交互、體感交互和腦機交互等技術(shù)。
5.計算機視覺
計算機視覺是使用計算機來模仿人類視覺系統(tǒng)的科學(xué),讓計算機模擬人類如何提取、分析、處理圖像的能力。機器人、自動駕駛、智能醫(yī)療等都是計算機視覺技術(shù)應(yīng)用的產(chǎn)品。
6.生物特征識別
一般指通過指紋、人臉、聲音、虹膜、步態(tài)、掌紋等生理或行為特征對身份進行識別認證的技術(shù),包括圖像處理、計算機視覺、語音識別、機器學(xué)習(xí)等多項技術(shù)的應(yīng)用。
7.虛擬現(xiàn)實
其以計算機為核心的新型視聽技術(shù),借助設(shè)備和數(shù)字化環(huán)境中的對象進行交互,以此用戶獲得近似真實環(huán)境的體驗。[2]
人工智能在對流風(fēng)暴、雷暴大風(fēng)、雷達降水都建立了相應(yīng)的預(yù)報模型,在空氣質(zhì)量、能見度、土壤濕度、花粉濃度等專項氣象服務(wù)上也建立了預(yù)報模型,但是大部分都是實驗階段,極少數(shù)投入應(yīng)用。2018年8月,“2018 AI Challenger 全球AI挑戰(zhàn)賽”,在世界級實驗賽道平臺上首度提供了基于北京氣象局3年氣象數(shù)據(jù),進行AI天氣預(yù)報,其預(yù)報準確度有了明顯提升。
序號 單位/人員 事件1 俄克拉荷馬大學(xué)Skinner基于NEWS-E 云分辨率集合分析和預(yù)報系統(tǒng),利用隨機決策樹來進行中氣旋強度的大氣環(huán)境監(jiān)測2 俄克拉荷馬大學(xué)Harrison利用隨機森林分類技術(shù)來預(yù)報12 h 時效的對流風(fēng)暴3 芬蘭氣象局 基于對象分析和四步分類方法發(fā)展對流風(fēng)暴鄰近預(yù)報模型4 MIT 林肯實驗室的Mattioli利用卷積神經(jīng)網(wǎng)絡(luò)建立了雷達降水強度預(yù)報模型。5 北卡羅萊納州立大學(xué)的Francisco開發(fā)了概率模型來預(yù)報高切變、低CAPE 值的對流系統(tǒng)環(huán)境6 Cray 公司的Heye 采用Convolutional Long Short-Term Memory 神經(jīng)網(wǎng)絡(luò)來進行臨近降水預(yù)報7 British Columbia大學(xué)的Hsieh利用Occam's Rzaor 的機器學(xué)習(xí)來改善極端事件的預(yù)報利用低于冰凍閾值的溫度、地面風(fēng)、至少1 厘米的雪深、雪的來源,以及雪的新舊、溫度和近地面穩(wěn)定度開發(fā)了極地暴風(fēng)雪的客觀產(chǎn)品9 Innsbruck 的Kneringer 8 加拿大Edmonton的Burrows開發(fā)了用于機場低能見度實時概率預(yù)報的Ordered Hurdle 模型10 NASA GMAO/USRA的Keller 開發(fā)回歸森林模型來預(yù)報空氣質(zhì)量11 韓國氣象局的Yun Am Seo使用深度神經(jīng)網(wǎng)絡(luò)預(yù)報來預(yù)估韓國的橡樹花粉濃度12 賓夕法尼亞大學(xué)的Kuai Fang利用深度學(xué)習(xí)和SMAP衛(wèi)星數(shù)據(jù)來制作土壤濕度的預(yù)報和回報
2017年《新一代人工智能發(fā)展規(guī)劃》明確提出“加強人工智能對自然災(zāi)害的有效監(jiān)測,圍繞地震災(zāi)害、地質(zhì)災(zāi)害、氣象災(zāi)害、水旱災(zāi)害和海洋災(zāi)害等重大自然災(zāi)害,構(gòu)建智能化監(jiān)測預(yù)警與綜合應(yīng)對平臺?!边@在國家層面,為發(fā)展智能化監(jiān)測預(yù)警提供了依據(jù)。[3]
2016年,國家發(fā)改委聯(lián)合中國氣象局印發(fā)《全國氣象發(fā)展“十三五”規(guī)劃》,明確提出要提高氣象信息化水平,加強氣象數(shù)據(jù)資源整合與開放共享、建立安全及可靠的氣象信息系統(tǒng)、推進云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)等信息新技術(shù)在氣象領(lǐng)域的應(yīng)用,為人工智能相關(guān)技術(shù)在氣象領(lǐng)域的應(yīng)用提供了指導(dǎo)。同年發(fā)布的《現(xiàn)代氣象預(yù)報業(yè)務(wù)發(fā)展規(guī)劃(2016-2020年)》對氣象預(yù)報業(yè)務(wù)發(fā)展提出更高目標,要求至2020年空間和時間分辨率分別達到1~2.5km和1h的格點化預(yù)報,且暴雨準確率相對國際先進模式保持10-20%的提高率。
2018年12月中國氣象局制定了《智慧氣象服務(wù)發(fā)展行動計劃(2019-2023年)》,通過強化互聯(lián)網(wǎng)、智能感知、大數(shù)據(jù)挖掘等關(guān)鍵技術(shù)的綜合應(yīng)用,建立以技術(shù)為核心的智慧服務(wù)體系。十四五規(guī)劃會將大數(shù)據(jù)、人工智能、云計算等信息技術(shù)在氣象服務(wù)中得到應(yīng)用,實現(xiàn)全國智慧氣象服務(wù)業(yè)務(wù)初步建立。[4]
隨著大數(shù)據(jù)、計算能力的不斷發(fā)展,人工智能新技術(shù)的快速發(fā)展為突破業(yè)務(wù)能力發(fā)展瓶頸帶來了機遇。
2014年“彩云天氣”APP,成為國內(nèi)第一款用人工智能進行天氣預(yù)報的應(yīng)用。
現(xiàn)有MICAPS4系統(tǒng),基于全局統(tǒng)一的CIMISS技術(shù)數(shù)據(jù)環(huán)境,構(gòu)建了適用于實時氣象預(yù)報業(yè)務(wù)的分布式大數(shù)據(jù)應(yīng)用環(huán)境,集成了數(shù)據(jù)解析、存儲、計算等功能,主要用于支撐短臨、中短期完整的氣象預(yù)報業(yè)務(wù)以及智能網(wǎng)格預(yù)報業(yè)務(wù)。
國家氣象中心將基于集合預(yù)報的最優(yōu)百分位技術(shù)和臺風(fēng)路徑最優(yōu)選取集成方法用于定量降水預(yù)報、臺風(fēng)路徑預(yù)報等方面。
2016年,廣東省氣象局組織開展了智能訂正工具箱(ITB)的技術(shù)框架開發(fā),將主管預(yù)報經(jīng)驗進行數(shù)字化,提升網(wǎng)格預(yù)報制作的自動化和智能化水平;
2017年,中國氣象局公共氣象服務(wù)中心聯(lián)合天津大學(xué)開發(fā)的全國強對流服務(wù)產(chǎn)品加工系統(tǒng)。通過運用圖像識別監(jiān)測,預(yù)警未來30分鐘內(nèi),空間分辨率為1公里范圍內(nèi)強對流情況,通過深度學(xué)習(xí),分析雷達回波上的冰雹特征,從而識別冰雹云,推算出其移速和移向,給出受冰雹影響大致范圍。
2018年,重慶市氣象局與百度智能云共同打造智慧氣象“四天”系統(tǒng)建設(shè)(天樞·智能探測系統(tǒng)、天資·智能預(yù)報系統(tǒng)、知天·智慧服務(wù)系統(tǒng)、御天·智慧防災(zāi)系統(tǒng))取得了階段性成果,僅天資·智能預(yù)報系統(tǒng)利用百度深度學(xué)習(xí)技術(shù),2019年上半年將月氣溫預(yù)測準確率提高了16分,月降水預(yù)測準確率提高了6分。在后期應(yīng)用中,冰雹、大風(fēng)識別命中率可達到100%。
《高等學(xué)校人工智能創(chuàng)新行動計劃》明確提出,到2020年中國要建立至少50家人工智能學(xué)院、研究院或研究中心。截至2019年4月,已有31所高校自主成立了人工智能學(xué)院,24所高校成立了人工智能研究院。很多高端企業(yè)近年陸續(xù)成立研究院、實驗室,依托用戶大數(shù)據(jù)進行測試,加速了機器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)在各部門的應(yīng)用。氣象系統(tǒng)作為垂管部門,中國氣象局應(yīng)在機構(gòu)設(shè)置劃分或職責(zé)功能上明確人工智能關(guān)鍵技術(shù)的研究,落實多級機構(gòu)設(shè)置和人才布局,促進國-省兩級領(lǐng)導(dǎo)、職工思想認識的轉(zhuǎn)變和體制機制的形成。
數(shù)據(jù)、算法、計算能力是人工智能的三大基石,人工智能技術(shù)的研究應(yīng)用主要依賴超強實驗環(huán)境、海量數(shù)據(jù)集和一批專業(yè)化人才。復(fù)雜的算法,海量數(shù)據(jù)的計算必須依靠高性能處理器和存儲。實驗環(huán)境是基礎(chǔ),沒有高性能計算實驗室,所有的研究只能是紙上談兵,只有通過實驗室的內(nèi)部測試和算法的不斷改進,才能摸索和總結(jié)出與實際結(jié)果更接近的技術(shù)與方法,最終應(yīng)用于實際工作。
完成一項特定任務(wù)的實驗測試,需要包括數(shù)據(jù)、工具、評測標準等全流程資源。數(shù)據(jù)更是人工智能技術(shù)研究最寶貴的資源。如果沒有足夠的基礎(chǔ)數(shù)據(jù),就無法取得突破性的科研成果。我國的氣象數(shù)據(jù),主要來源于國家信息中心、各省局CMISS數(shù)據(jù)接口和氣象數(shù)據(jù)資料室,這些部門確實提供了豐富的、海量的數(shù)據(jù)資料類型(包括我國和國際交換數(shù)據(jù)的地面、高空、海洋、輻射、農(nóng)氣、雷達、衛(wèi)星數(shù)據(jù)等),但是從無論從數(shù)據(jù)的時段區(qū)域、時間分辨率還是訪問方式上都存在或多或少的遺憾,無法滿足深度學(xué)習(xí)技術(shù)的海量數(shù)據(jù)集獲取,更沒有摸索出一套實用的工具和評測標準。因此,中國氣象局應(yīng)統(tǒng)籌布局,收集、整理、清洗、建立人工智能公共數(shù)據(jù)集和技術(shù)標準、評價體系,積極主動聯(lián)系其他部門,獲取更廣泛、更全面的基礎(chǔ)觀測數(shù)據(jù),擴充基礎(chǔ)數(shù)據(jù)集。建立滿足需求的基礎(chǔ)數(shù)據(jù)環(huán)境。
人工智能技術(shù)在氣象領(lǐng)域的研究核心因素是人才,國內(nèi)天氣預(yù)報工作者主要強調(diào)他們的專業(yè)方向,應(yīng)該說普遍錄用了基于大氣科學(xué)的研究生、博士生,目前缺乏高水平的應(yīng)用數(shù)學(xué)、數(shù)據(jù)挖掘、機器學(xué)習(xí)的研發(fā)人才;缺乏兼通氣象預(yù)報、人工智能(機器學(xué)習(xí)、深度學(xué)習(xí))的復(fù)合應(yīng)用人才。中央氣象臺天氣預(yù)報技術(shù)研發(fā)室副主任代刊說到“目前大部分AI技術(shù)方法研發(fā)還是以大氣科學(xué)專業(yè)背景人員為主,需要統(tǒng)計學(xué)、計算科學(xué)、大數(shù)據(jù)挖掘等專業(yè)背景的科學(xué)家加入,并積極與相關(guān)高校、科研院所合作?!币虼巳耸滤緫?yīng)牽頭加大引進高端人才的力度,以點帶面,加速專業(yè)人才的跨界發(fā)展。同時引導(dǎo)和落實現(xiàn)有技術(shù)人員在人工智能技術(shù)如圖像識別、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等方面知識的培養(yǎng)計劃和實施方案,加快培訓(xùn)的早日落地,解決人工智能技術(shù)人才的短缺。
氣象預(yù)報的準確度不僅來源于海量的歷史和實時觀測數(shù)據(jù)及預(yù)報產(chǎn)品,而且受整個地球環(huán)境非常多的因子影響,例如氣候變化,地質(zhì)變化、生態(tài)建設(shè)(湖泊改造,環(huán)境綠化)、城市建設(shè)(交通、工業(yè)產(chǎn)業(yè)布局)等的影響,同時其他部門也存在很多實時觀測數(shù)據(jù),打通非氣象部門氣象數(shù)據(jù)因子獲取渠道,獲取更多的可分析數(shù)據(jù)集,通過人工智能關(guān)鍵技術(shù)大規(guī)模測試,探索和分析數(shù)據(jù)的準確性和其與預(yù)報的關(guān)系,以提升AI預(yù)測的準確率。
發(fā)展人工智能技術(shù)在行業(yè)的應(yīng)用和創(chuàng)新也離不開前端的開發(fā)和應(yīng)用,單靠行業(yè)內(nèi)人才的集聚也會陷入部門瓶頸,我們必須與一些高端的企業(yè)和研究院所合作,共同加快技術(shù)在氣象領(lǐng)域的深度研究和應(yīng)用。
人工智能的發(fā)展必然導(dǎo)致原有的工作內(nèi)容、活動時間發(fā)生變化,同時也會衍生出新的工作內(nèi)容,氣象領(lǐng)域也不例外,隨著智能技術(shù)在氣象領(lǐng)域的逐漸深入,各級培訓(xùn)機構(gòu)應(yīng)加強前期調(diào)研和培訓(xùn)設(shè)計,引導(dǎo)和疏通觀測、預(yù)報人員慢慢向復(fù)合型、研究型、應(yīng)用型、保障型發(fā)展,促進部門在信息化發(fā)展中平穩(wěn)過渡和現(xiàn)有職工素質(zhì)的提升。