【摘要】本文研究了相關性分析的幾種主流方法,從定性到定量、從簡單到復雜,研究了圖表法、協方差方法、相關系數法和回歸分析法,并探討了這幾種方法之間的區(qū)別和聯系。以兩個經濟指標之間的相關性為例,對這幾種方法進行實踐應用,從而說明數學知識在實際應用中的重要價值。
【關鍵詞】相關性 協方差 相關系數 線性回歸
【中圖分類號】G633.6 【文獻標識碼】A 【文章編號】2095-3089(2019)07-0134-02
1.研究背景簡介
在統(tǒng)計學中,對事物之間的相關關系的分析幾乎是研究任意一組變量時的首要步驟。通常情況下,我們不僅關心事物自身是如何變化的,也關心事物之間相互影響的關系,才能夠全方位、多角度地認知事物。研究事物之間相關影響的關系需要借助相關性分析的方法。相關性分析在經濟金融、媒體、醫(yī)療、氣象等領域都有著廣泛的應用。識別不同的相關性分析的方法,把握其數學本質和內在聯系與區(qū)別,精確區(qū)分不同的方法適用于怎樣的實際問題,對于相關性分析方法的推廣使用有顯著的實用價值。
2.相關性分析方法
本節(jié)將詳細介紹四種相關性分析的方法,并以兩個經濟指標——全國公共財政收入和國內生產總值(GDP)之間的關系為例,說明這幾種方法的應用,探討其區(qū)別和聯系,區(qū)分不同的方法適用于怎樣的實際問題。
2.1圖表法
做相關性分析最簡單直觀的方法就是圖表法。圖表法,顧名思義,即通過繪制圖表,觀察圖表的形態(tài),來分析兩個變量之間的相關性。常用的圖表包括兩種,一種是散點圖,即:將其中一個變量繪制在橫軸,另一個變量繪制在縱軸,通過分析散點圖中散點分布的形態(tài),判斷兩個變量間的關系是直線相關、曲線相關或不相關等。另一種常見的圖表是折線圖,即:將兩個變量都繪制在縱軸,將影響這兩個變量的因素(通常是時間)繪制在橫軸,觀察這兩個變量隨著相同的影響因素變化的方式來確定它們之間的相關性。以下我們繪制了GDP與全國公共財政收入的散點圖和以時間為自變量的折線圖。觀察可以發(fā)現,散點圖均落在一條直線附近,折線圖走勢也高度相似,說明兩個變量不僅呈正相關,且相關關系接近線性。
散點圖的優(yōu)點是簡單直觀,幾乎適用于所有的相關性分析問題。缺點是缺乏量化的判斷標準,因此,還需其他定量的分析方法作為補充。
2.2 協方差法
協方差方法進行相關性分析的原理是通過協方差來衡量兩個變量的變化趨勢。方差在用于單變量分析時,可以體現變量的取值脫離總體的誤差程度;協方差用于多變量分析時,可以體現多個變量脫離總體的變化趨勢。如果協方差為正,說明兩個變量變化趨勢一致,即呈正相關。反之則呈負相關。協方差為0說明兩個變量不相關。
為了計算GDP及全國公共財政收入的協方差,我們通過Excel中COVAR函數獲得兩組數據的協方差值為3818553586是一個很大的正值,可以說明兩組數據的變化趨勢一致,即這兩個變量是正相關的。
協方差方法計算較簡單,但計算結果僅能體現兩個變量之間相關性的正負,而不能體現相關性的大小,因此,還需要其他方法來衡量兩個變量之間相關性的大小。
2.3 相關系數法
由此我們可知兩個變量呈線性相關且有很強的相關性。相比于協方差方法和相關系數法,回歸法給出了一種利用相關性做預測的方式:通過構建線性回歸方程,可以在已知一個變量x后,對另一個變量y進行預測。但該方法僅適用于兩個變量間線性相關關系較強的情況,有一定的局限性。
3.小結
從上述分析中我們發(fā)現,不同的方法具有不同的適用性。圖表法適用于所有的相關性分析問題,但沒有定量的判斷標準;協方差方法可以判斷相關性的正負,相關系數法在協方差方法的基礎上,還可以判斷相關性的大小。在線性相關性較強的情況下,可以利用回歸分析法構建線性回歸方程,從而對變量做進一步的預測。
參考文獻:
[1]沈家芬,馮建軍,謝利,林燕,莫測輝.廣州市大氣能見度的特征及其影響因子分析[J]. 生態(tài)環(huán)境. 2007(04).
[2]第35屆中國氣象學會年會 S14 大數據、互聯網、融媒體時代氣象服務的創(chuàng)新與變革——第八屆氣象服務發(fā)展論壇[C].中國氣象學會:中國氣象學會,2018:1.
[3]廣發(fā)期貨發(fā)展研究中心 農產品研究小組. 巴西雷亞爾匯率與人民幣匯率的相關性分析[N]. 期貨日報,2018-09-25(003).
作者簡介:
楊雨龍(2001.7.3-),男,陜西岐山人,就讀于北京市第一六一中學,高中在讀,研究方向:數學。