亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        氣象數(shù)據(jù)分析相關技術研究

        2019-04-10 07:01:16程曉龍
        科技資訊 2019年36期
        關鍵詞:數(shù)據(jù)分析大數(shù)據(jù)

        程曉龍

        摘 ?要:經過幾十年的發(fā)展,氣象信息技術獲得了極大的進步,也積累了大量來自多方面的氣象數(shù)據(jù)。由于我國氣象大數(shù)據(jù)發(fā)展仍在起步階段,相關方法和技術都需要進一步研究。為充分利用大量的氣象數(shù)據(jù),相關的數(shù)據(jù)分析方法研究成為重中之重。該文結合實際工作,總結數(shù)據(jù)分析方法,介紹氣象數(shù)據(jù)分析存在的相關問題,以期為以后的氣象大數(shù)據(jù)發(fā)展奠定基礎。

        關鍵詞:氣象數(shù)據(jù) ?數(shù)據(jù)分析 ?大數(shù)據(jù)

        中圖分類號:TP311 ? 文獻標識碼:A 文章編號:1672-3791(2019)12(c)-0184-02

        Abstract: With decades of development,meteorological information technology has made great progress,and has accumulated a large number of meteorological data from many aspects.As the development of meteorological big data in China is still in its infancy,relevant methods and technologies need further research.In order to make reasonable use of a large amount of meteorological data, relevant data analysis methods are also essential. This paper combines the actual work, summarizes the data analysis methods, introduces the related problems in meteorological data analysis, and lays a foundation for the future development of meteorological big data.

        Key Words: Meteorological data; Data analysis; Big data

        氣象大數(shù)據(jù)是由網(wǎng)絡上所有和氣象行業(yè)相關的數(shù)據(jù)組成的,包括氣象站觀測數(shù)據(jù)、網(wǎng)民分享的天氣圖片和評論、氣象相關服務收集到的氣象數(shù)據(jù)等[1]。這些數(shù)據(jù)規(guī)模龐大,數(shù)據(jù)量在幾十PB左右,而且仍在增加。為合理地處理這些氣象數(shù)據(jù),研究人員主要將氣象大數(shù)據(jù)分成兩類,即觀測數(shù)據(jù)和預測數(shù)據(jù)。觀測數(shù)據(jù)是“當前的數(shù)據(jù)”表示現(xiàn)在實際觀察到的天氣現(xiàn)象對應的氣象數(shù)據(jù)。預測數(shù)據(jù)是“未來的數(shù)據(jù)”表示通過氣象模式計算得到的用來預測未來天氣的數(shù)據(jù)[2]。而這些氣象數(shù)據(jù)本身晦澀難懂、專業(yè)性強,對普通大眾的服務性差。這就需要利用相關方法去對氣象數(shù)據(jù)進行分析挖掘,凝練出簡單易懂的結論服務大眾。

        1 ?數(shù)據(jù)分析方法

        在任何行業(yè)的數(shù)據(jù)分析當中,數(shù)據(jù)分析方法都是其中的關鍵。不同的分析方法對于相同的數(shù)據(jù)會生成不同的結果,這些結果是原始數(shù)據(jù)某個或某幾個方面的客觀反映。了解常見的數(shù)據(jù)分析方法對氣象數(shù)據(jù)理解和分析有著重要的意義。

        1.1 描述性分析

        所謂描述性統(tǒng)計分析,就是對一組數(shù)據(jù)的各種特征進行分析,以便于描述測量樣本的各種特征及其所代表的總體特征。描述性統(tǒng)計分析的項目很多,常用的如平均數(shù)、標準差、中位數(shù)、頻數(shù)分布、正態(tài)或偏態(tài)程度等。描述性分析的常用指標也較為常見,主要有均值、中位數(shù)、眾數(shù),極差、方差、標準差、偏度、峰度等。其中不同的指標表示數(shù)據(jù)的不同信息。均值、中位數(shù)、眾數(shù)體現(xiàn)了數(shù)據(jù)的集中趨勢。極差、方差、標準差體現(xiàn)了數(shù)據(jù)的離散程度。偏度、峰度體現(xiàn)了數(shù)據(jù)的分布形狀。

        描述性分析是一般數(shù)據(jù)分析方法的匯總,其主要作用為顯示數(shù)據(jù)的基本信息,讓分析人員對數(shù)據(jù)的基本分布有一定了解。具體統(tǒng)計計算方法也是大部分研究者都了解的。利用該方法獲得的結果可以讓研究者對當前數(shù)據(jù)有較深的認識,為深入分析數(shù)據(jù)奠定基礎。

        1.2 回歸分析

        回歸分析是應用范圍非常廣的數(shù)據(jù)分析方法之一。該方法尋求變量之間的相關關系,來揭示數(shù)據(jù)的內在規(guī)律。具體來說,它是研究自變量和因變量之間數(shù)量變化關系的一種分析方法,它主要是通過建立因變量Y與影響它的自變量X之間的回歸模型,表達自變量和因變量存在的內在邏輯,進而可以預測因變量的發(fā)展趨勢。

        回歸分析存在多種具體的回歸方法,這些方法通過自變量的個數(shù),因變量的類型以及回歸線的形狀可以分為以下幾個類別。

        (1)線性回歸。其主要特點是因變量連續(xù),而對應的自變量可以是連續(xù)的也可以是離散的,畫出來的圖像具有線性特點。線性回歸也通過因變量的數(shù)量分為一元線性回歸和多元線性回歸兩類。其中多元線性回歸中有大于1個的自變量,而一元線性回歸只有一個自變量。線性回歸的回歸方程如下所示:

        y=ax+b ? ? ? ?(1)

        為合理使用線性回歸方法,需要待分析的數(shù)據(jù)中因變量和自變量有線性相關關系。除此之外,由于線性回歸方法在擬合回歸曲線時使用了最小二乘法,導致數(shù)據(jù)誤差對線性回歸方法的擬合結果影響較大,甚至能預測出錯誤的結果。因此在使用時,必須事先去除待分析數(shù)據(jù)的誤差從而進一步分析。

        (2)邏輯回歸。邏輯回歸方法用于數(shù)據(jù)的基本分類。該方法是尋求兩類數(shù)據(jù)之間的區(qū)別,用一個函數(shù)作為分類函數(shù)對未知的數(shù)據(jù)進行類別標注,完成數(shù)據(jù)類別的預測。邏輯回歸的公式如下所示:

        (2)

        邏輯回歸方法不要求自變量和因變量是線性相關關系。為了防止數(shù)據(jù)模型出現(xiàn)過擬合現(xiàn)象,在使用邏輯回歸方法時需要篩選自變量以確保自變量和因變量之間存在相關關系。

        (3)聚類分析。該方法主要實現(xiàn)數(shù)據(jù)內部之間的區(qū)分,讓具有相同數(shù)據(jù)屬性的數(shù)據(jù)聚合在一起,從而對待分析數(shù)據(jù)的內涵進行挖掘?;镜木垲惙椒ú襟E如下:第一,確定使用哪些指標來對數(shù)據(jù)進行區(qū)分;第二,計算數(shù)據(jù)指標之間的距離也就是差異程度,一般用空間距離來對比;第三,將差異程度較小的數(shù)據(jù)歸結為一類,形成許多差距明顯的類別[3]。

        聚類分析也是當下眾多研究人員使用的基本分析方法。聚類分析在具體計算時通常使用3種計算方法:Kmeans、密度聚類、層次聚類方法。

        (4)判別分析。判別分析是在已知研究對象分成若干類型并已取得各種類型的一批已知樣品的觀測數(shù)據(jù),在此基礎上根據(jù)某些準則建立判別式,然后對未知類型的樣品進行判別分析。該方法在氣象上應用也非常廣泛,例如利用距離相近的氣象站數(shù)據(jù)來判斷未知站的屬類;在天氣預報中,可以根據(jù)前期的天氣觀測值來判斷是哪種天氣現(xiàn)象或者是未來的火災等級。

        判別分析常常和聚類分析聯(lián)合起來使用。當總體分類不清楚時,可以先用聚類分析對原來的一批樣品進行分類,然后再用判別分析建立判別式對新樣品進行判別。判別分析的具體方法非常豐富,具體包括距離判別法、Fisher判別法、Bayes判別法和逐步判別法等。

        (5)主成分與因子分析。該方法利用降維的思想,在損失信息較小的前提下,將多個判別指標綜合為幾個主要指標。每個主要指標都是原始判別指標的線性組合,而且主要指標之間不相關,從而降低數(shù)據(jù)分析難度,簡化數(shù)據(jù)分析過程,提高分析效率。

        (6)時間序列分析。該方法就是對按照時間順序排列的一組數(shù)據(jù)序列發(fā)現(xiàn)其中的變化規(guī)律并用于預測的統(tǒng)計方法。這種方法具有以下3個基本特點:假設事物發(fā)展趨勢會延伸到未來;預測所依據(jù)的數(shù)據(jù)具有不規(guī)則性;不考慮事物發(fā)展之間的因果關系。在實際進行時間序列預測時,數(shù)據(jù)較為復雜,需要對時間序列的四要素進行分析,這四要素的不同組合就影響著時間序列的未來發(fā)展。這4種要素分別為長期趨勢、季節(jié)變動、循環(huán)變動、不規(guī)則變動。常見的四要素組合方式有兩種:一種是4種因素相互獨立,可用四要素相加來表示。另一種是4種元素相互影響,可用四要素相乘來表示。

        當進行數(shù)據(jù)分析時,需要對上述4種元素從時間序列中分解出來,這樣才能克服其他因素的影響,從而更加客觀地反映事物本來的發(fā)展規(guī)律。總結時間序列分析的預測步驟分為以下4步:

        ①繪制時間序列圖;

        ②分析序列平穩(wěn)性;

        ③建立時間序列模型;

        ④評估模型預測未來結果。

        (6)決策樹分析。該方法主要是在已知各種情況發(fā)生的概率的前提下,通過形成決策樹來計算得到期望值的概率,是直觀運用概率分析的方法之一。該方法模擬了人類在決策過程中對數(shù)據(jù)特征的應用,實現(xiàn)利用少量的數(shù)據(jù)特征類型來將數(shù)據(jù)進行分類,并判斷未知數(shù)據(jù)的所屬類別。

        2 ?氣象數(shù)據(jù)分析存在的相關問題

        隨著氣象大數(shù)據(jù)發(fā)展的相關要求,氣象數(shù)據(jù)分析業(yè)務也逐漸增多。但是由于相關業(yè)務發(fā)展時間較短,相關業(yè)務人員對氣象數(shù)據(jù)的理解程度不同,導致不同氣象數(shù)據(jù)的分析效果大不相同,大量氣象數(shù)據(jù)沒有充分利用。經總結,以上問題的主要原因主要包括以下幾個方面。

        (1)氣象數(shù)據(jù)存儲較為雜亂。由于氣象數(shù)據(jù)采集途徑不同,導致不同氣象數(shù)據(jù)的對應存儲方式也不同。一旦進行氣象數(shù)據(jù)分析時,有可能沒有快速及時地獲取到全部所需的氣象數(shù)據(jù)信息,影響了氣象數(shù)據(jù)分析的有效性。

        (2)氣象數(shù)據(jù)的數(shù)據(jù)格式不統(tǒng)一。氣象數(shù)據(jù)時間跨度大,不同時期的氣象數(shù)據(jù)的存儲格式并不相同。不同格式的氣象數(shù)據(jù)的數(shù)據(jù)整理相較于相同格式的氣象數(shù)據(jù)更為困難。這就導致了在氣象數(shù)據(jù)分析時,歷史數(shù)據(jù)的使用存在天然的劣勢,分析報告質量也受到一定影響。

        (3)部分氣象業(yè)務人員業(yè)務不熟練。氣象數(shù)據(jù)分析對業(yè)務人員的要求非常高,需要他們能基本了解氣象業(yè)務同時深度了解氣象數(shù)據(jù)格式和數(shù)據(jù)特點。但目前氣象業(yè)務人員的個人能力參差不齊,導致甚至出現(xiàn)不同業(yè)務人員對相同氣象數(shù)據(jù)處理得到不同的分析結果。

        3 ?結語

        該文對氣象數(shù)據(jù)分析中使用的基本數(shù)據(jù)方法進行了介紹,分析了不同方法對于待分析數(shù)據(jù)的要求以及該方法的特點,對今后的工作有一定的指導作用。針對氣象數(shù)據(jù)分析出現(xiàn)的相關問題,相關業(yè)務人員應該及時排查自身問題,提高氣象業(yè)務水平,為今后高效地完成工作打下堅實的基礎。

        參考文獻

        [1] 劉喆玥.我國氣象大數(shù)據(jù)的發(fā)展趨勢研究[J].電腦知識與技術,2019,15(21):252-254.

        [2] 王麗,李云鵬,甄熙.淺析互聯(lián)網(wǎng)大數(shù)據(jù)在氣象行業(yè)的應用[J].電腦知識與技術:學術版,2018,14(24):218-219.

        [3] 王德青,朱建平,劉曉葳,等.函數(shù)型數(shù)據(jù)聚類分析研究綜述與展望[J].數(shù)理統(tǒng)計與管理,2018,37(1):51-63.

        猜你喜歡
        數(shù)據(jù)分析大數(shù)據(jù)
        我校如何利用體育大課間活動解決男生引體向上這個薄弱環(huán)節(jié)
        體育時空(2016年8期)2016-10-25 18:02:39
        Excel電子表格在財務日常工作中的應用
        淺析大數(shù)據(jù)時代背景下的市場營銷策略
        新常態(tài)下集團公司內部審計工作研究
        中國市場(2016年36期)2016-10-19 04:31:23
        淺析大數(shù)據(jù)時代對企業(yè)營銷模式的影響
        基于讀者到館行為數(shù)據(jù)分析的高校圖書館服務優(yōu)化建議
        科技視界(2016年22期)2016-10-18 14:37:36
        大數(shù)據(jù)環(huán)境下基于移動客戶端的傳統(tǒng)媒體轉型思路
        新聞世界(2016年10期)2016-10-11 20:13:53
        基于大數(shù)據(jù)背景下的智慧城市建設研究
        科技視界(2016年20期)2016-09-29 10:53:22
        數(shù)據(jù)+輿情:南方報業(yè)創(chuàng)新轉型提高服務能力的探索
        中國記者(2016年6期)2016-08-26 12:36:20
        熟女少妇内射日韩亚洲| 视频在线播放观看免费| 午夜男女靠比视频免费| 潮喷失禁大喷水aⅴ无码| 在教室伦流澡到高潮h麻豆 | av免费资源在线观看| av色综合久久天堂av色综合在| 97精品依人久久久大香线蕉97| 精精国产xxxx视频在线播放器| 亚洲97成人精品久久久| 风流老太婆大bbwbbwhd视频| 久久午夜无码鲁丝片直播午夜精品 | 日本一区二区三区精品免费| 欧美人与动性xxxxx杂性| 免费国精产品自偷自偷免费看| 中文亚洲AV片在线观看无码| 青青草手机免费播放视频| 亚洲精品tv久久久久久久久久 | 国产成人av在线影院无毒| 亚洲av天堂一区二区| 欧美成人www在线观看| 色偷偷一区二区无码视频| 一本色道久久综合狠狠躁中文 | av无码一区二区三区| aaaaa级少妇高潮大片免费看 | 日韩成人高清不卡av| 国产精品永久在线观看| 亚洲一区av无码少妇电影| 国产一级做a爱视频在线| 一本久道竹内纱里奈中文字幕| 国产成人精品无码一区二区老年人 | 久久精品国产亚洲AⅤ无码| 亚洲一区视频中文字幕| 4hu四虎永久免费地址ww416| 中文亚洲av片在线观看不卡 | 国产精品自在线免费| 日韩一区二区,亚洲一区二区视频| 91九色老熟女免费资源| 久久伊人色av天堂九九| 亚洲av人妖一区二区三区| 一区二区高清视频免费在线观看|