廖文輝
(廣東金融學(xué)院 應(yīng)用數(shù)學(xué)系, 廣州 510521)
論因子分析中因子個數(shù)與矩陣秩的關(guān)系
廖文輝
(廣東金融學(xué)院 應(yīng)用數(shù)學(xué)系, 廣州 510521)
因子分析模型中遺留了較多的問題, 如通常我們利用公共因子的信息率的大小來確定因子的個數(shù), 這樣一般是個近似解. 本文試圖從矩陣秩的角度來確定因子分析中因子個數(shù), 同時用實例說明了這種確定答案的計算思路.
正交因子; 秩; 公共因子; 特殊因子
因子分析是將多個實測變量轉(zhuǎn)換為少數(shù)幾個不相關(guān)的綜合指標(biāo)的多元統(tǒng)計方法. 在教育領(lǐng)域和若干其它領(lǐng)域的科學(xué)研究中, 往往需要對反映事物、現(xiàn)象從多個角度進行觀測, 設(shè)計出多個觀測變量, 并對多個變量收集大量數(shù)據(jù)以便進行分析, 從而尋找規(guī)律. 多變量大樣本雖然會為我們的科學(xué)研究提供豐富的信息, 但也增加了數(shù)據(jù)采集和處理的難度. 更重要的是在大多數(shù)情況下, 許多變量之間存在一定的相關(guān)性,從而增加了問題分析的復(fù)雜性.
因子分析就是將大量的彼此可能存在相關(guān)性的變量轉(zhuǎn)換成較少的、彼此不相關(guān)的公共因子變量和特殊因子變量, 從而減少變量維數(shù). 在公因子個數(shù)的確定上, 目前通用的方法有兩種, 一是根據(jù)實際問題的意義或?qū)I(yè)知識來確定; 二是用確定主成分個數(shù)的原則來確定. 這兩種方法都是一種經(jīng)驗的判別, 無法給出精確結(jié)果. 本文試圖推出數(shù)學(xué)上的因子個數(shù)的精確解.
設(shè)可觀測變量Z1,Z2,…,Zm中存在p個獨立的公共因子F1,F2,…,Fp(m≥p ), 每個可觀測變量Zi含有獨特因子εi(i=1,…,m), 它們的關(guān)系可以由下面的公式表達:
用矩陣形式可表示為
其中且滿足:
(Ⅰ) p≤m;
(Ⅱ) COV(F,ε)=0, 即F與ε是不相關(guān)的;
(Ⅲ) E( F)=0, D( F)=Ip, 即F1,…, FP不相關(guān), 且方差皆為1, 均值皆為0;
式(2)中的A是因子負荷矩陣, 其元素aij表示第i個變量Zi在第j個公共因子Fj上的負荷. 把Zi看成p維因子空間的一個向量, 則aij表示Zi在坐標(biāo)軸Fj上的投影. 因子分析就是以F代Z, 由于一般有p≤m, 從而能達到簡化分析問題的目的.
因子分析中公因子的個數(shù)(即上面模型中的p)到底應(yīng)該如何確定呢?可由下面的定理解決.
定理正交因子模型: Z?μ=A? F+ε中, 公共因子F1, F2,…, Fp(m≥p), D( Z)=∑, D(ε)=則
其中R(∑?D)表示矩陣∑?D的秩.
證明∑=D( Z)=E[( Z?μ)(Z?μ)T]=E[( AF+ε)(AF+ε)T]=AD( F) AT=AAT+D ,
從上述定理可以看出, 降維就是在D( Z)=∑中提取特殊因子方差矩陣D后, 使得新的矩陣的秩降低的過程. 通常因子的個數(shù)越少模型越簡單, 所以因子分析的最優(yōu)過程應(yīng)該是用最少的因子個數(shù)p把D( Z)=∑中的公共信息提取干凈為準(zhǔn)則.
定義在正交因子模型: Z?μ=A? F+ε中, 公共因子的個數(shù)其中∑=D( Z), D=D(ε)=
存在性說明因為D( Z)=∑是正定的, 所以它有特征值為λ1≥λ2≥…≥λm≥0, 相應(yīng)特征向量為l1, l2,…,lm, 則∑有譜分解式:
所以上面定義的p肯定是存在的, 并且有1≤p≤m, 最糟糕的情況是δ1=δ2=…=δm=0, p=m.
有了這個定義, 我們確定因子分析的因子數(shù)就是很明確了. 那么, 如何從一個已知的D( Z)=∑中計算出因子個數(shù)p來? 這個計算過程較復(fù)雜, 下面通過兩個例題來說明具體的計算思路.
例1已知Z=(Z1,…,Z4)的協(xié)方差矩陣∑為
試求因子個數(shù)p、因子載荷矩陣A和特殊因子的協(xié)方差矩陣D.
解設(shè)協(xié)方差矩陣D=D(ε)=則
根據(jù)秩的定義有, 如果R( A)=r, 則矩陣A的所有的r +1級子式全為零.
1°因為所以R(∑?D)≥2.
2°然后找3級子式中含矩陣D元素最少的一個首先計算.
從計算過程可以看出, 這個結(jié)果并不唯一, 我們只是取了其中最簡單的形式. 有的時候算起來比較簡單, 結(jié)果也是唯一的. 例如:
例2已知Z=(Z1,…,Z5)的協(xié)方差矩陣∑為
試求因子個數(shù)p和特殊因子的協(xié)方差矩陣D.
解設(shè)協(xié)方差矩陣D=D(ε)=則
公因子個數(shù)是因子分析模型的關(guān)鍵結(jié)論, 只有先確定因子的個數(shù), 才能用待定系數(shù)來確定因子載荷矩陣, 以及相應(yīng)的因子得分問題. 目前通用的方法一是根據(jù)實際問題的意義或?qū)I(yè)知識來確定; 二是用確定主成分個數(shù)的原則來確定; 這兩種都是一種經(jīng)驗的判別, 有較強的實用價值, 但是從理論上說無法給出準(zhǔn)確的解釋. 本文用矩陣的秩的概念從理論上完全解釋了因子個數(shù)的確定問題, 但是含有未知數(shù)的高階矩陣的秩的計算是一個較繁雜的問題, 所以在對待高階矩陣上, 算法還需要進一步改進.
[1] 劉肇軍, 林海明. 初始因子與旋轉(zhuǎn)后因子的異同[J]. 統(tǒng)計與決策, 2008 (19)
[2] 高惠璇. 應(yīng)用多元統(tǒng)計分析[M]. 北京: 北京大學(xué)出版社, 2005
[3] 余錦華,楊維權(quán). 多元統(tǒng)計分析與應(yīng)用[M]. 廣州: 中山大學(xué)出版社, 2005
[4] 胡 偉, 魏復(fù)盛. 中國4城市空氣顆粒物元素的因子分析[J]. 中國環(huán)境監(jiān)測, 2003(03)
The Number of Factors in Factor Analysis to the Matrix Rank
LIAO Wen-hui
(Department of Applied Mathematics, Guangdong University of Finance, Guangzhou 510521, China)
Factor analysis model still have some problems: such as we usually use the size of the information rate to determine the number of factors, which in general is a myopic solution. This article attempts from the angle of matrix rank, to determine the number of factors in factor analysis, at the same time use the example illustrates the calculation process.
orthogonal factor; rank; common factor; special factor
O212
A
1672-5298(2014)04-0010-03
2014-10-15
廣東金融學(xué)院重點學(xué)科培育項目; 廣東金融學(xué)院“創(chuàng)新強?!睌?shù)學(xué)建模教學(xué)團隊建設(shè)項目
廖文輝(1980? ), 男, 湖南雙峰人, 廣東金融學(xué)院應(yīng)用數(shù)學(xué)系副教授. 主要研究方向: 數(shù)據(jù)分析與數(shù)值模擬