劉湘云
(東南大學(xué) 機(jī)械工程學(xué)院,江蘇 南京 211189)
如今,市場上的橙汁品牌越來越多,每種品牌橙汁的營養(yǎng)成分基本相同,如能量、碳水化合物、蛋白質(zhì)等,但含量各異,價(jià)格也大相徑庭。本文應(yīng)用主成分分析法針對橙汁的各種營養(yǎng)成分含量相關(guān)性進(jìn)行研究,對市面上常見品牌橙汁的營養(yǎng)成分指標(biāo)進(jìn)行歸納總結(jié)。主成分分析法作為分析和歸納數(shù)據(jù)類型的一種主流方法已被應(yīng)用于多個(gè)領(lǐng)域,都取得了很好的效果。將不同品牌的橙汁營養(yǎng)成分指標(biāo)進(jìn)行主成份分析,可以在初步檢測中選取主成分中易于檢測的指標(biāo)來代表整個(gè)主成分的含量,進(jìn)而可以通過3個(gè)主成分含量來代表樣本整體的成分含量情況,同時(shí)也利于消費(fèi)者合理地選擇橙汁的品牌,在不丟失營養(yǎng)的同時(shí)選擇更加經(jīng)濟(jì)的商品。
本文所有的數(shù)據(jù)都收集自不同品牌橙汁外包裝,廠方自己標(biāo)明的指標(biāo)無法完全代表其產(chǎn)品中成分的含量,但是就研究而言有一定價(jià)值。對于一些未標(biāo)明的成分,為了使得分析更為精確,用此類指標(biāo)的平均數(shù)值進(jìn)行代替,同時(shí)也能使得其對整個(gè)分析造成的影響最小。橙汁營養(yǎng)成分指標(biāo)原始數(shù)據(jù)見表1。表中只列出了常規(guī)的特征性指標(biāo),而一些較少的指標(biāo),對于分析研究沒有很大影響,便沒有在表中列出,且當(dāng)廠方標(biāo)明的特征性指標(biāo)處于某一范圍時(shí),為了數(shù)據(jù)分析的準(zhǔn)確,取其范圍中的平均值。
主成分分析法(Principal Component Analysis,PCA)也稱主分量分析或矩陣數(shù)據(jù)分析,通過變量變換的方法把相關(guān)的變量變?yōu)槿舾刹幌嚓P(guān)的綜合指標(biāo)變量。若某研究對象有兩項(xiàng)指標(biāo)ζ1和ζ2,從總體ζ(ζ1,ζ2)中抽取了N個(gè)樣品,它們散布在橢圓平面內(nèi)(圖1),指標(biāo)ζ1與ζ2有相關(guān)性。η1和η2分別是橢圓的長軸和短軸,η1⊥η2,故η1與η2互不相關(guān)。其中η1是點(diǎn)ζ(ζ1,ζ2)在長軸上的投影坐標(biāo),η2是該點(diǎn)在短軸上的投影坐標(biāo)。從圖1可以看出點(diǎn)的N個(gè)觀測值的波動大部分可以歸結(jié)為η1軸上投影點(diǎn)的波動,而η2軸上投影點(diǎn)的波動較小。若η1作為一個(gè)綜合指標(biāo),則η1可較好地反映出N個(gè)觀測值的變化情況,η2的作用次要。綜合指標(biāo)η1稱為主成分,找出主成分的工作稱為主成分分析。
表1 橙汁特征性指標(biāo)原始數(shù)據(jù)
可見,主成分分析即選擇恰當(dāng)?shù)耐队胺较?,將高維空間的點(diǎn)投影到低維空間上,且使低維空間上的投影盡可能多地保存原空間的信息,就是要使低維空間上投影的方差盡可能地大。
圖1 主成分分析法示意
由于原始數(shù)據(jù)矩陣龐大,如對全部指標(biāo)進(jìn)行分析,將會導(dǎo)致主次要成因相混淆;若僅選其中部分指標(biāo),又可能會影響分析結(jié)果的代表性和完整性。此外,為了克服不同變量數(shù)值差異過大而造成的主成分分析誤差,按照主成分分析法要求,應(yīng)對原始數(shù)據(jù)矩陣進(jìn)行標(biāo)準(zhǔn)化,進(jìn)而得到進(jìn)行主成分分析的變量的相關(guān)系數(shù)矩陣,見表2。
表2 變量相關(guān)性
主成分分析的計(jì)算結(jié)果中,新變量所代表的方差(即對應(yīng)的特征值)貢獻(xiàn)率和由原變量變換為新變量的線性變換系數(shù)(即對應(yīng)的特征向量)就成為進(jìn)行綜合分析的重點(diǎn).在主成分分析中一般要求少數(shù)新變量的累積方差貢獻(xiàn)率應(yīng)大于70%。表3、表4和表5分別給出了原始數(shù)據(jù)的公因子方差、各個(gè)主成分的解釋的總方差和主成分的計(jì)算結(jié)果,圖2則是各個(gè)主成分的特征值。
表4表明,前3個(gè)主成分積累方差貢獻(xiàn)率達(dá)到81%,根據(jù)主成分分析法的一般原理,可取前3個(gè)具有明顯代表性的主成分,原有的6個(gè)變量可用3個(gè)主成分表示,如表5所示。
根據(jù)橙汁特征性指標(biāo)的實(shí)際狀況和主成分分析的要求,本文取前3個(gè)主成分來反映原來的6個(gè)變量,其方差的累計(jì)貢獻(xiàn)率已達(dá)到81.45%,3個(gè)主成分的貢獻(xiàn)率分別為39%、22%和20%,3個(gè)主成分在81.45%的程度上反應(yīng)了某一樣本的營養(yǎng)成分情況與離子條件??梢哉J(rèn)為,這3個(gè)主成分基本上能夠反映出原變量的變化所代表的橙汁營養(yǎng)標(biāo)準(zhǔn)。
表3 原始數(shù)據(jù)公因子方差
在第一主成分中,能量和碳水化合物兩個(gè)指數(shù)所占權(quán)系數(shù)較大,并且兩個(gè)指標(biāo)變化方向一致,呈正相關(guān),說明引起這兩個(gè)指標(biāo)變化的原因相似,而處理的方式也相關(guān)。實(shí)際上,攝入碳水化合物是快速補(bǔ)充能量的最佳途徑,它是能量的直接來源,所以能量和碳水化合物的含量可以用第二主成分來表示,將其命名為糖能量成分。
表4 各成分解釋的總方差
表5 成分矩陣
圖2 主成分特征值(碎石圖)
在第二主成分中,蛋白質(zhì)和脂肪兩個(gè)指數(shù)所占權(quán)系數(shù)較大,并且兩個(gè)指標(biāo)變化方向一致,呈正相關(guān),說明二者的來源相似,處理相近。蛋白質(zhì)和脂肪所具有的能量極高,蛋白質(zhì)是橙汁中脂肪的唯一來源,因而蛋白質(zhì)、脂肪的含量直接決定了能量的高低,所以蛋白質(zhì)和脂肪指標(biāo)的含量可以用第一主成分來表示,將其命名為蛋白脂肪成分。
在第三主成分中,Na和維生素C兩個(gè)指數(shù)所占權(quán)系數(shù)較大,并且兩個(gè)指數(shù)變化方向一致,呈正相關(guān),說明二者來源相似,處理相近。Na是人體所必須的元素,缺乏相應(yīng)的鹽會導(dǎo)致人體不適,而維生素C也是人體必須的有機(jī)物質(zhì),必須經(jīng)常從飲食中攝取,故pH值與偏硅酸含量可以用第三主成分表示,將其命名為維生素Na成分。
主成分分析法結(jié)果表明,飲用水的成分可以分為三類:第一能量成分、第二能量成分和維生素Na成分.每種成分中所包含的變量都是正相關(guān)的,故在橙汁初步檢測時(shí),可以僅抽取主成分中的一個(gè)變量進(jìn)行檢測,以代表整個(gè)主成分的含量,所得出的結(jié)論與完全檢測所有指標(biāo)得出的結(jié)論相近程度達(dá)81.45%,可以大大減少初步檢測的成本和工作量。主成分分析法是進(jìn)行產(chǎn)品質(zhì)量檢測的一種很好的工具,其分析結(jié)果對橙汁生產(chǎn)廠家具有指導(dǎo)作用,同時(shí)對消費(fèi)者經(jīng)濟(jì)的消費(fèi)也具有導(dǎo)向作用。數(shù)據(jù)和品牌證明,并不是純的橙汁所含的營養(yǎng)成分就高,也不是含營養(yǎng)成分高價(jià)格也高。消費(fèi)者可以根據(jù)自身對營養(yǎng)成分的需求,合理選擇自己想要的橙汁品牌,當(dāng)然,最好的營養(yǎng)攝入其實(shí)是直接食用新鮮橙子,無添加易吸收。
[1]汪應(yīng)洛.系統(tǒng)工程[M].北京:機(jī)械工業(yè)出版社,2009.54~60.
[2]方開泰.實(shí)用多元統(tǒng)計(jì)分析[M].上海:華東師范大出版社,1989.
[3]王學(xué)仁,王松桂.實(shí)用多元統(tǒng)計(jì)分析[M].上海:上海科技出版社,1990.