劉巍巍 劉壽東 范秋丹
(1.南京信息工程大學,江蘇 南京 210044;2.中國氣象局公共氣象服務(wù)中心,北京 100081)
互聯(lián)網(wǎng)時代下的氣象數(shù)據(jù)應用分析
劉巍巍1,2劉壽東1范秋丹2
(1.南京信息工程大學,江蘇 南京 210044;2.中國氣象局公共氣象服務(wù)中心,北京 100081)
運用比較研究法和個案研究法,分析了氣象數(shù)據(jù)的特征及其在互聯(lián)網(wǎng)中的應用效果;總結(jié)歸納出氣象數(shù)據(jù)在互聯(lián)網(wǎng)中應用的3個創(chuàng)新;即思維創(chuàng)新、價值創(chuàng)新、數(shù)據(jù)創(chuàng)新;并提出讓氣象數(shù)據(jù)“發(fā)聲”和強化氣象和行業(yè)的相關(guān)性研究是氣象數(shù)據(jù)在互聯(lián)網(wǎng)中應用的關(guān)鍵點。
氣象數(shù)據(jù); 氣象服務(wù); 互聯(lián)網(wǎng); 大數(shù)據(jù)
2008年《Nature》出版了“Big Data”??痆1],從互聯(lián)網(wǎng)技術(shù)、網(wǎng)絡(luò)經(jīng)濟學、超級計算、環(huán)境科學、生物醫(yī)學等多個方面介紹大數(shù)據(jù)所帶來的挑戰(zhàn)?!禨cience》也在2011年推出數(shù)據(jù)處理“Dealing with Data”??痆2],討論大數(shù)據(jù)所帶來的挑戰(zhàn)和大數(shù)據(jù)科學研究的重要性。而隨著經(jīng)濟利益驅(qū)動,BAT(百度、阿里巴巴、騰訊)是國內(nèi)最早開展大數(shù)據(jù)應用的互聯(lián)網(wǎng)企業(yè)。
2014年5月27日,中國氣象局與互聯(lián)網(wǎng)巨頭阿里巴巴集團建立云平臺戰(zhàn)略合作,共同挖掘氣象數(shù)據(jù)的深層價值,正式開啟了大數(shù)據(jù)應用的大門。2014年11月,第六次全國氣象服務(wù)工作會議提出“發(fā)揮氣象事業(yè)單位和企業(yè)技術(shù)的創(chuàng)新主體作用,推動高時空分辨率氣象服務(wù)數(shù)值模式應用技術(shù)、基于影響的氣象預報預警技術(shù)等關(guān)鍵技術(shù)創(chuàng)新和基于大數(shù)據(jù)、物聯(lián)網(wǎng)、云計算、新媒體等新技術(shù)新手段的應用技術(shù)創(chuàng)新?!敝链?,“大數(shù)據(jù)、物聯(lián)網(wǎng)、云計算、新媒體”等具有時代意義的概念被提升到氣象數(shù)據(jù)服務(wù)應用層面,氣象服務(wù)不再僅僅停留在天氣預報等基礎(chǔ)數(shù)據(jù)應用,而是運用大數(shù)據(jù)思維,利用互聯(lián)網(wǎng)平臺,開展氣象大數(shù)據(jù)的深度挖掘和應用分析,實現(xiàn)氣象數(shù)據(jù)新的價值突破。
2010年,Apache Hadoop組織將大數(shù)據(jù)定義為:“普通的計算機軟件無法在可接受的時間范圍內(nèi)捕捉、管理、處理的規(guī)模龐大的數(shù)據(jù)集”。全球知名咨詢公司麥肯錫給出的定義是: 大數(shù)據(jù)是指大小超出常規(guī)的數(shù)據(jù)庫工具獲取、存儲、管理和分析能力的數(shù)據(jù)集[3]。
隨著大數(shù)據(jù)應用的迅速發(fā)展,其特征也從原來的3v、4v發(fā)展到現(xiàn)在的5v:數(shù)據(jù)體量(Volume)巨大,處理速度(Velocity)快,數(shù)據(jù)種類(Variety)多,數(shù)據(jù)真實性(Veracity),商業(yè)價值(Value)大。大數(shù)據(jù)所蘊藏的信息隱藏在海量數(shù)據(jù)之中,想要從海量數(shù)據(jù)中尋找到所需信息,就要通過高效的計算方法完成數(shù)據(jù)價值提煉,這也是大數(shù)據(jù)時代最需解決的難題。
氣象數(shù)據(jù)是反映天氣的一組數(shù)據(jù),分為氣候資料和天氣資料。氣候資料通常所指的是用常規(guī)氣象儀器所觀測到各種原始資料的集合以及加工、整理、整編所形成的各種資料。天氣資料是為天氣分析和預報服務(wù)的一種實時性很強的氣象資料。目前,由于數(shù)據(jù)安全性等因素限制,大部分開展大數(shù)據(jù)應用和研發(fā)的數(shù)據(jù)主要是氣象資料。
氣象資料主要包括地面觀測、氣象衛(wèi)星遙感、天氣雷達和數(shù)值預報產(chǎn)品等資料,占氣象資料的90%以上。另外,高空探測、農(nóng)業(yè)氣象觀測、沙塵和閃電觀測、風廓線雷達探測等資料也屬于氣象資料。但氣象數(shù)據(jù)的體量與互聯(lián)網(wǎng)、電信、金融、保險等行業(yè)的大數(shù)據(jù)相比至少低3個數(shù)量級,所以說氣象數(shù)據(jù)只是大數(shù)據(jù)的子集,具有大數(shù)據(jù)特征,但有其獨特性。
氣象數(shù)據(jù)作為大數(shù)據(jù)的“子集”,有其獨有特征:
1.數(shù)據(jù)體量(Volume)大,但數(shù)據(jù)量不會無限制擴大
占氣象資料90%以上的地面觀測資料、雷達和衛(wèi)星資料、數(shù)值預報資料雖然具有體量大的“大數(shù)據(jù)”特點,但是仍有氣象數(shù)據(jù)自身的特性。地面觀測站數(shù)量和觀測頻次是根據(jù)氣象業(yè)務(wù)需求有計劃增加,而不是無限制,所以數(shù)據(jù)體量是可以控制的。目前,氣象雷達布網(wǎng)基本完成,已經(jīng)實現(xiàn)全天候全國范圍內(nèi)的不間斷觀測,可以滿足服務(wù)需求。雖然未來我國還會發(fā)射新的氣象衛(wèi)星,但是氣象衛(wèi)星資料在氣象部門有氣象衛(wèi)星業(yè)務(wù)系統(tǒng)實時接收處理,并提供給專業(yè)氣象人員應用分析,其數(shù)據(jù)始終處于可以控制管理的狀態(tài)。數(shù)值預報模式產(chǎn)品資料是專門為預報員和科研人員做天氣預報和氣候預測使用的,不對外,因此也是可以控制的,未來也將始終如此[4]。
2.數(shù)據(jù)種類(Variety)多,但來源和含義單一
按照《氣象資料分類與編碼》行業(yè)標準,氣象資料分為14大類,數(shù)百種小類。雖然氣象資料種類多,但每種資料所表示的信息含義都是單一的,如天氣現(xiàn)象、溫度、相對濕度、能見度、降水量、風向風力等都只是記錄某一個地區(qū)在某個時間的天氣信息,并且這些數(shù)據(jù)都來自氣象部門內(nèi)部的儀器觀測。這與網(wǎng)絡(luò)上的搜索詞條、網(wǎng)購數(shù)據(jù)、社交信息等這些來源繁多的互聯(lián)網(wǎng)大數(shù)據(jù)有很大差異。氣象數(shù)據(jù)是氣象部門內(nèi)部對天氣信息的記錄,而大數(shù)據(jù)是人們在互聯(lián)網(wǎng)上的行為記錄。
3.很難產(chǎn)生直接經(jīng)濟價值,但有巨大的相關(guān)性商業(yè)價值(Value)
正因為氣象數(shù)據(jù)的內(nèi)容單純且來源單一,也決定了其自身很難直接產(chǎn)生經(jīng)濟價值,而是主要應用于氣象業(yè)務(wù),即:天氣預報、氣候預測以及氣象服務(wù)。但是,隨著互聯(lián)網(wǎng)的發(fā)展,在大數(shù)據(jù)時代背景下,農(nóng)業(yè)、交通、旅游、醫(yī)療、購物、飲食等行業(yè)數(shù)據(jù)和氣象數(shù)據(jù),可以通過數(shù)據(jù)挖掘,進一步厘清氣象條件對各行業(yè)的影響,并用于指導相關(guān)行業(yè)的發(fā)展。因此,氣象數(shù)據(jù)的商業(yè)價值主要體現(xiàn)在與其有相關(guān)性的事物上。
可見,氣象數(shù)據(jù)有其獨特性,氣象數(shù)據(jù)的價值體現(xiàn)和價值創(chuàng)新必須要與社會各行業(yè)龐大的大數(shù)據(jù)相結(jié)合,而不能獨立應用。
從1904年皮葉克尼斯提出天氣預報是一個物理初值問題至今,在短短不到一百年的時間里,氣象數(shù)據(jù)的應用實現(xiàn)了質(zhì)的飛躍。特別是近20年來,氣象數(shù)據(jù)增長了近千倍,氣象信息量越大,所蘊藏的有效價值就越多,就越需要深入挖掘分析。而隨著大數(shù)據(jù)時代的來臨,氣象數(shù)據(jù)如何應用就更為關(guān)鍵。
2014-2015年,移動互聯(lián)網(wǎng)迅速崛起,“非常準”、“航旅縱橫”、“滴滴打車”、“一畝田”等互聯(lián)網(wǎng)公司均與氣象部門建立合作,開展氣象大數(shù)據(jù)應用。因此,本文以氣象數(shù)據(jù)在互聯(lián)網(wǎng)中的應用為個案,總結(jié)分析氣象大數(shù)據(jù)應用的效果、創(chuàng)新點及關(guān)鍵點。
天氣和農(nóng)業(yè)生產(chǎn)聯(lián)系尤為緊密,從播種到收獲,溫度、降水、日照、風力、蒸發(fā)量等氣象因子對農(nóng)作物的產(chǎn)量和品質(zhì)都有重要影響。2015年,一畝田與氣象部門建立“氣象+農(nóng)業(yè)”的大數(shù)據(jù)應用分析的合作協(xié)議。經(jīng)過長達3個月的方案研究,最終確定“氣象+農(nóng)業(yè)”的應用場景,包括以下3個方面:
農(nóng)業(yè)生產(chǎn)方面:氣象數(shù)據(jù)可以幫助一畝田指導農(nóng)戶安排農(nóng)業(yè)生產(chǎn),減輕因天氣原因造成的損失。以廣西崇左西瓜為例,由于西瓜喜熱,2015年開春后倒春寒天氣導致大量瓜苗凍死。常年的西瓜上市期,南方普降大雨持續(xù)十幾天,嚴重影響銷售,農(nóng)管家的交易平臺上西瓜周均價一直處于下行。通過分析氣象數(shù)據(jù),在連續(xù)降溫降雨前將天氣預警信息推送給產(chǎn)地用戶,有效地指導了農(nóng)戶安排生產(chǎn)銷售計劃,減輕了農(nóng)戶因天氣原因帶來的經(jīng)濟損失,為農(nóng)戶帶來增收。
物流運輸方面:氣象數(shù)據(jù)可以幫助物流公司選擇最優(yōu)線路,確保交貨時間,提升運輸效率、降低運輸成本。以一畝田物流為例,與阿里巴巴一樣,一畝田采用“第四方物流”,即不建倉庫不建車隊,完全依靠社會運力來解決。一畝田在物流方面同樣扮演的是一個“信息平臺”,向能提供物流服務(wù)的社會運力開放,無論個人或者公司,都可以在一畝田的平臺上發(fā)布使用車輛或者提供車輛服務(wù)的信息。例如2015年上半年,南方地區(qū)強降雨天氣持續(xù),導致北方地區(qū)雞蛋積壓,極大的影響了雞蛋的品質(zhì)與銷量。一畝田“信息平臺”將天氣趨勢和預警信息推送給物流公司,負責物流調(diào)度相關(guān)人員提前安排產(chǎn)品運輸,確保了交貨時間。
銷售終端方面:氣象數(shù)據(jù)可以幫助消費者預估市場供需價格變化,以便合理采購,既提供了精準營銷的參考,也增加了銷量。因為互聯(lián)網(wǎng)終端消費者不僅有公眾,還有大部分用戶是公司,即與公眾日常生活緊密相關(guān)的采購方,包括各種類型和層次的批發(fā)商、飯店、超市、深加工企業(yè)和出口貿(mào)易企業(yè)等用戶。一畝田力圖縮短中間流通環(huán)節(jié),通過強大的線上線下服務(wù)能力,解決了因為信息不對稱而導致的農(nóng)產(chǎn)品流通效率低下和損耗嚴重的問題,讓采購更便捷,食材更新鮮。在這個過程中,向消費端推送天氣信息,有利于采購方評估采購原料,制定采購計劃,安排采購進度。
與傳統(tǒng)的氣象服務(wù)相比,氣象數(shù)據(jù)應用于互聯(lián)網(wǎng)領(lǐng)域有3點創(chuàng)新:
思維創(chuàng)新:互聯(lián)網(wǎng)為氣象數(shù)據(jù)的應用提供了新的契機和廣闊空間,數(shù)據(jù)應用不再僅僅是天氣預報等基礎(chǔ)氣象服務(wù),而是基于互聯(lián)網(wǎng)行業(yè)的大數(shù)據(jù)應用服務(wù)和大數(shù)據(jù)間的相關(guān)性研究。
價值創(chuàng)新:數(shù)據(jù)價值不再僅僅局限于“今天多少攝氏度”,還包括對氣象相關(guān)行業(yè)進行大數(shù)據(jù)研究,挖掘所產(chǎn)生的商業(yè)經(jīng)濟價值,揭開了“今天多少攝氏度”背后的“面紗”。
數(shù)據(jù)創(chuàng)新:數(shù)據(jù)應用不再僅僅是千篇一律,而是從市場需求出發(fā),打造符合各行業(yè)特定需要的定制化氣象大數(shù)據(jù)應用和精細化氣象服務(wù)。
1.讓氣象數(shù)據(jù)發(fā)聲
公眾普遍認為,谷歌、亞馬遜及國內(nèi)的BAT等網(wǎng)站是大數(shù)據(jù)的先驅(qū)者,但事實上,政府才是大規(guī)模信息的原始采集者。在大數(shù)據(jù)時代,知道“是什么”就已經(jīng)足夠了,完全沒必要知道“為什么”。所以,重要的不是現(xiàn)象背后的原因,而是現(xiàn)象是什么,要讓數(shù)據(jù)“發(fā)聲”。而氣象數(shù)據(jù)作為大數(shù)據(jù)的“一員”,也需要通過創(chuàng)新性的應用分析來釋放潛在的數(shù)據(jù)價值。因此,讓氣象數(shù)據(jù)“發(fā)聲”是氣象數(shù)據(jù)應用的關(guān)鍵點。
但由于政府在獲取數(shù)據(jù)中所處的特殊地位,所以有些數(shù)據(jù)應該具有保密性。2015年,中國氣象局建立氣象數(shù)據(jù)公開網(wǎng)站,氣象數(shù)據(jù)開始對公眾開放,即允許私營部門和社會大眾訪問,得到了社會的一致好評,也促進了公眾進一步了解并接受氣象數(shù)據(jù)的價值。但是使用氣象數(shù)據(jù)的一個原則是,少數(shù)可能會危害到國家安全或秘密的數(shù)據(jù)不能公開。
2.強化氣象與行業(yè)的相關(guān)性研究
大數(shù)據(jù)的應用分析有兩個方向:一個是數(shù)據(jù)的處理與表示,主要強調(diào)數(shù)據(jù)采集、存取、加工和可視化方法;另一個是數(shù)據(jù)本質(zhì)特征的提取和模式發(fā)現(xiàn),即數(shù)據(jù)挖掘[5,6]。通過深度挖掘數(shù)據(jù)價值和強化相關(guān)性研究,可以比以前更容易、更快捷、更清楚地分析事務(wù)。
強化相關(guān)性研究應用最好的例子是世界上最大的零售商沃爾瑪。沃爾瑪對包括顧客的購物清單、消費額、購物籃中的物品、具體購買時間和購買當日的天氣等歷史交易記錄大數(shù)據(jù)進行分析。分析研究的結(jié)論是:每當季節(jié)性颶風來襲之前,不僅是手電筒銷售量增加,蛋撻的銷量也同時增加。因此,當季節(jié)性風暴來臨時,沃爾瑪會把庫存的蛋撻放在靠近颶風用品的位置,以方便顧客選購從而提升銷售量。
因此,對氣象數(shù)據(jù)來說,尋找與氣象相關(guān)性強的事物來應用、深度挖掘氣象數(shù)據(jù)的潛在價值是氣象數(shù)據(jù)應用的關(guān)鍵點。
運用比較研究法和個案研究法,分析了氣象數(shù)據(jù)特征及其在互聯(lián)網(wǎng)中的應用效果。結(jié)果表明,氣象數(shù)據(jù)有其獨有特征,主要體現(xiàn)在:數(shù)據(jù)體量大但不會無限制擴大、數(shù)據(jù)種類多但來源和含義單一、很難產(chǎn)生直接經(jīng)濟價值但有巨大的相關(guān)性商業(yè)價值。
氣象數(shù)據(jù)在互聯(lián)網(wǎng)中應用的創(chuàng)新點主要體現(xiàn)在:思維創(chuàng)新即運用互聯(lián)網(wǎng)思維,開展氣象大數(shù)據(jù)應用服務(wù)和大數(shù)據(jù)間的相關(guān)性研究;價值創(chuàng)新即開展“氣象+行業(yè)”大數(shù)據(jù)分析挖掘,創(chuàng)造氣象數(shù)據(jù)應用于行業(yè)的商業(yè)經(jīng)濟價值;數(shù)據(jù)創(chuàng)新即從市場需求出發(fā),研發(fā)定制化的氣象大數(shù)據(jù)應用產(chǎn)品和精細化氣象數(shù)據(jù)。而在保證數(shù)據(jù)安全性的前提下,讓氣象數(shù)據(jù)“發(fā)聲”和強化氣象數(shù)據(jù)的相關(guān)性研究是氣象數(shù)據(jù)在互聯(lián)網(wǎng)中應用的關(guān)鍵點。
[1]Nature.BigData[EB/OL].[2014-08-23].http://www.nature.com/news/pecials/bigdata /index.Htm.
[2]Science.Special Online Collection: Dealing with Data[EB/OL].(2011-02-11).[2014-08-23].http: //www.Sciencemag.org /site /special /data /
[3]Manyika J, Chui M, Brown B, et al.Big Data:The Next Frontier for Innovation,Competition,and Productivity[EB/OL].[2014-09-02].http://www.mckinsey.com/insights/business-technology/bigdata_the_next_frontier_for_innovation.
[4]沈文海.氣象數(shù)據(jù)的“大數(shù)據(jù)應用”淺析[J].中國信息化,2014 (11).
[5]王銳,任慶忠,基于改進后數(shù)據(jù)包絡(luò)模型的省際環(huán)境效率評價[J].管理現(xiàn)代化,2015 (2).
[6]王星.大數(shù)據(jù)分析:方法與應用[M].北京:清華大學出版社,2013.
[7]梅宏,王千祥,張路,等.軟件分析技術(shù)進展[J].計算機學報,2009 (9).
X324;TP391
A
1003-1154(2016)01-0064-03
10.3969/j.issn.1003-1154.2016.01.021
國家自然科學基金面上項目(40975072);江蘇省高校優(yōu)勢學科建設(shè)工程項目(PADA).