嚴忠權
(黔南民族師范學院,貴州 都勻 558000)
對隨機變量相依性度量的研究和文獻很多,常見的有度量變量線性相依的Pearson相關系數(shù)[1],基于Copula的非線性相依變量的度量指標 kendall’s tau,Spearman’s rhos、Gini’s系數(shù)等[2],且這些相依性度量指標在金融、保險、可靠性理論、統(tǒng)計推斷與決策等方面得到了廣泛應用[3]??v觀所有文獻,對隨機事件的相依性度量僅有張堯庭的《定性資料的的統(tǒng)計分析》[4]聯(lián)中將隨機事件變量化用列聯(lián)表,通過卡方檢驗討論二事件間的相依與獨立。何蘊理[5]對相依事件的度量作了一個簡單討論,在概率與統(tǒng)計的其它文獻中僅在討論獨立隨機事件時提及“當兩個事件不獨立時稱之為相依”這一概念,沒有給出二相依隨機事件的度量指標,而相依隨機事件卻大量存在,建立怎樣的指標來度量兩個隨機事件的相依性及相依程度,這顯然是一個很有實際意義和理論意義的問題,本文給出了度量兩個相依隨機事件的三個相依度量指標:關聯(lián)系數(shù)、相依系數(shù)和相關系數(shù),論述了這三個指標的性質,從三個指標所具有的性質可見三個指標定義的合理性和科學性。
定義1 設A,B是同一樣本空間下的兩個隨機事件,若P(A∩B)=P(A)P(B),則稱隨機事件 A,B 相互獨立。 若 P(A∩B)≠P(A)P(B),則稱隨機事件 A,B 是相依的。
定義2 設A,B是同一樣本空間下的兩個隨機事件,稱數(shù)量 δ(A,B)=P(A∩B)-P(A)P(B)為隨機事件 A 與隨機事件B的關聯(lián)系數(shù)。若δ(A,B)>0,則稱隨機事件A與隨機事件B是正相依的,若δ(A,B)<0,則稱隨機事件A與隨機事件B是負相依的。
由關聯(lián)系數(shù)的定義可得如下基本性質:
定理1 設A,B是同一樣本空間下的兩個隨機事件,則A與B的關聯(lián)系數(shù)具有性質:
(1)δ(A,B)=0當且僅當隨機事件A與隨機事件B相互獨立;
(2)δ(A,B)=δ(B,A);
(4)δ(ΣAj,B)=Σδ(Aj,B)(ΣAj表示有限或可數(shù)個兩兩相互排斥的事件);
(5)δ(A∪C,B)=δ(A,B)+δ(C,B)-δ(A∩C,B)。
證明:(1)、(2)由 δ(A,B)的定義顯然成立。
(4):對于有限或可數(shù)個兩兩相互排斥的事件Aj,j=1,2,…,有
(5):δ(A∪C,B)=P(A∪C)∩B)-P(A∪C)P(B)=P((A∩C)∪(C-B))-P[P(A)+P(C)-P(A∪C)]P(B)=δ(A,B)+δ(C,B)-δ(A∩C,B)
證畢。
由關聯(lián)系數(shù)的定義和定理1有:對任意兩個隨機事件通過關聯(lián)系可知它們是獨立、正相依、負相依。且兩個隨機事件獨立當且僅當它們的關聯(lián)系數(shù)等于零,關聯(lián)系具有對稱性和類似概率可加性。除此之外,關聯(lián)系數(shù)還有如下系列性質。
由關聯(lián)系數(shù)定義可得如下性質。
系 1:若 A?B,A≠φ,則 δ(A,B)=P(A)=P(A)>0,即若 A?B,A≠φ,則隨機事件A與隨機事件B是正相依的;若A與B是互斥事件且均不是不可能事件,則δ(A,B)<0,即互斥事件是負相依的。后面將會看到,其逆不真。
系3:由乘法公式和關聯(lián)系數(shù)的定義有:P(A|B)=P(A)+,從這一表達式可知,當A與B是正相依時,在其中一事件發(fā)生的情況下會使另一個事件發(fā)生概率增大,而當A與B是負相依時,其中一個事件發(fā)生的情況下會使另一個事件發(fā)生的概率減小。
定理2 同一樣本空間下的任意兩個兩個隨機事件A與B的關聯(lián)系數(shù)滿足不等式max{-P(A)P(B),-[1-P(A)][1-P(B)]}≤δ (A,B)≤min{P(A)[1-P(B)],[1-P(A)]P(B)}稱 之 為Freshe-Hoefding不等式。 由此得δ(A,B。
由定理1(3),可得如下性質:
系 2:δ(A,A)=-δ(A,A) =P(A)[1-P(A)],即任一事件與它自身是正相依的,而與它的對立事件是負相依的;δ(A,B)=δ(A,B),即任一事件組與它的對立事件組有相同的相依性。
證明:因為 P(A∩B)≤min{P(A),P(B)},所以有
δ(A,B)=P(A∩B)-P(A),P(B)≤P(A)-P(A)P(B)=P(A)[1-P(B)]同時又有:δ(A,B)≤P(B)[1-P(A)]
所以有 δ(A,B)≤min{P(A)[1-P(B)],[1-P(A)]P(B)}
另一方面:由 P(A∩B)≥0、P(A∪B)≤0 有:
δ(A,B)=P(A∩B)-P(A)P(B)≥-P(A)P(B)和
因此有 δ(A,B)≥max{-P(A)P(B),-[1-P(A)][1-P(B)]
如果我們對任一事件A發(fā)生與不發(fā)生用一個示性指標變量表示:當事件A發(fā)生時令IA=1,當事件A不發(fā)生令IA=0,則有 E(IA)=P(A),且
Cov(IA,IB)=E(IA,IB)-E(IA)E(IB)=E(IA∩B)-P(A)P(B)=δ(A,B)
因此,兩個隨時機事件的關聯(lián)系數(shù)是它們的示性指標變量的協(xié)方差。
關聯(lián)系數(shù)描述了兩個事件的相依關系:獨立、正相依、負相依,不能描述兩個隨機事件的相依程度,因為兩個隨機事件最強相依應是在A=B的情況,此時,它們的關聯(lián)系數(shù)為
δ(A,B)=P(A)-P2(A)
假如有 A=B 且 P(A)=0.05,則 δ(A,B)=0.0475,又假如 P(A)=0.3,P(B)=0.4,P(A|B)=0.6 則 δ(A,B)=(0.6-0.3)(0.4)=0.12。顯然,后者沒有前者的相依性強,而后者的關聯(lián)系數(shù)卻比比前者的要大。為此,我們定義一個相依度系數(shù)用來度量相個隨機事件的相依程度。
由條件概率P(A|B)的定義,當P(B)=0時,條件概率P(A|B)沒有定義,為了定義相依度系數(shù),我們規(guī)定,當P(B)=0時,P(A|B)=P(A)。
定義3 對同一樣本空間下的任意兩個兩個隨機事件A與B,定義rB(A)=P(A|B)-P(A|B)為事件A關于事件B的相依度系數(shù)(簡稱相依系數(shù))。
由相依系數(shù)的定義可得計算公式:
由相依系數(shù)的定義我們有
定理3 設A、B是同一樣本空間下的兩個隨機事件,則它們的相依系數(shù)具有如下性質:
(1)rB(A)=rA(B)=0成立當且僅當與相互獨立;
(2)rA(A)=1,rA(A)=-1;
(3)rS(A)=rφ(A)=0;
(4)rB(ΣAj)=ΣrB(Aj);
(5)對任意的 A≠B 有 rBˉ(A)=-rB(A),rB)=-rB(A);
(6)對任間兩個隨機事件 A、B 有-1≤rB(A)≤1;-1≤rA(B)≤1。
由相依系數(shù)的定義和定理3可得如下的系。
系4:
(1)當 rB(A)=1 時,由 rBˉ(A)=P(A|B)-P(A)的定義,當且僅當 P(A|B)=1,P(A)=0,由此得到 A=B,此時也有 rA(B)=1。因此當rB(A)=rA(B)=1時,A與B最強正相依(當A=B時稱A與B最強正相依)。
(2)同理,當 rB(A)=-1 時有 B=,當 rA(B)=-1 有 A=,此時表明A與B是最強負相依。
(4)等式rB(A)=rA(B)成立的充分必要條件是P(A)[1-P(A)]=P(B)[1-P(B)]。
(5)由 rB(A當A與B是正相依時有rB(A)>0、rA(B)>0,而 A當 B與負相依時有 rB(A)<0、rA(B)<0。
(6)當 A?B 時,δ(A,B)=P(A)[1-P(B)]=P(A)P(B)>0,則 A與B正相依,且由rB(A)=P(A)/P(B),則有A關于B的相依系數(shù)隨事件A發(fā)生的概率增大而增大且有rB(A)→1(表示向著1方向變化)。 與此同時,,rA(B)=P()。 從而 B 關于 A的相依系數(shù)是隨事件B的概率的增大而減小。
(7)當 A∩B=φ 時,δ(A,B)=-P(A)P(B),即 A 與 B 互斥時,A與B負相依,且由rB(A)=-P(A)/P),則有A關于B的相依系數(shù)的絕對值隨事件A的概率的增大而增大且有rB(A)→-1。同樣的rA(B)=-P(B)/P(A),此B關于A的相依系數(shù)的絕對值也是隨事件B的概率的增大而增大且有rA(B)→-1。
(8)當A∩B≠φ時,A與B可以是正相依也可以是負相依。例如:若P(A)=P(B)=0.5,P(A∩B)=0.3,此時A與B是正相依的;但若P(A)=P(B)=0.5,此時A與B是負相依的。
由由定理3和系3可知,相依系數(shù)是相依性度量的一個有效指標,正負相依和相依系數(shù)的絕對值的變化是與A?B,A?B,A∩B≠φ以及兩個事件獨立的程度變化是一致的。
按照相依系數(shù)與零的距離,可將隨機事件的相依性分為五個等級:當|rB(A)|≤0.05時,A與B幾乎獨立;當0.05<|rB(A)|≤0.2時,A 與 B為弱相依;當 0.2<|rB(A)|≤0.45時,A 與 B為適度相依;當0.45<|rB(A)|≤0.8時,A與B為一般相依的;而當0.8<|rB(A)|時為強相依的。有了這五個級后,我們在作統(tǒng)計推斷決策時就可采用相應的策略。
定理4 相依系數(shù)具有下列不等式:
該不等式稱之為相依系數(shù)的Freshe-Hoefding不等式。
定義4 設A是B兩個隨機事件,稱
為隨機事件A與B隨機事件的相關系數(shù),其符號與正負相依的符號相同。
對于相關系數(shù)有如下計算公式
定理4 設A、B是同一樣本空間下的兩個隨機事件,則它們的相關系數(shù)具有如下性質:
(1)RA,B=0當且僅當隨機事件A與隨機事件B相互獨立。
(2)-1≤RA,B≤1,且 RA,B=1當且僅當 A=B,即 A 與 B 最強正相依,RA,B=-1當且僅當A=,即A與B最強負相依。
(3)RA,B=RA,B=-RA,B;RA,B=RA,B。
由相關系數(shù)的定義和定理可得
系5
(1)兩個隨機事件的相關系數(shù)RA,B等于隨機事件A與隨機事件B的示性指標變量IA與IB的相關系數(shù)ρIA,IB。
(2)RAA=1,RAA=-1,RA,S=RA,θ。
(3)相關系數(shù) RA,B可用于計算后驗概率 P(B|A)
兩個隨機事件相依關系的度量指標:關聯(lián)系數(shù)、相依系數(shù)、相關系數(shù)分別都是由的概率表示,因此我們可在重復試驗下得到它們的估計值。
設在N次獨立試驗或觀測中,事件A發(fā)生了kA次,事件B發(fā)生了kB次,事件A∩B發(fā)生了kA∩B次。則各相依指標的估計分別為:
可以證明上述估計是有效的,無偏的和一致的。
通過上面對隨機事件三個相依指標的討論,對于同一樣本空間下的任意兩對隨機事件(A,B)和(A,C),我們可用相依系數(shù)的絕對值的大小來比較兩對事件的相依程度,若
|rB(A)|≤|rC(A)|
則有隨機事件A對C的相依程度大于隨機事件A對B的相依程度。通過相依程度的比較和上面對相依程度的分級,我們建立相依事件的度量指標可用于公共社會學管理,決策科學、醫(yī)學統(tǒng)計推斷、刑事犯罪偵探學等學科領域的應用。
[1]周概容.概率論與數(shù)理統(tǒng)計[M].北京:高等教育出版社,1985.
[2]Roger B.Nelsen Antroduction to Copulas[M].New York:Springer,2006.
[3]張堯庭.連接函數(shù)(copula)技術與金融風險分析[J].統(tǒng)計研究,2002,(4).
[4]張堯庭.定性資料的的統(tǒng)計分析[M].南寧:廣西大學出版社,1991.
[5]何蘊理.隨機事件的相依性[J].西安統(tǒng)計學院學報,1994,(2).