丁鶴洋
摘 要 本文根據(jù)相關(guān)數(shù)據(jù),運(yùn)用主成分分析及聚類分析法找出了影響移動(dòng)端考研產(chǎn)品發(fā)展的主要因素。首先,對數(shù)據(jù)信息進(jìn)行量化分析,運(yùn)用Spss軟件通過主成分分析法找出影響移動(dòng)端考研產(chǎn)品發(fā)展的相關(guān)因素;然后,對這些主要因素進(jìn)行層次分析進(jìn)一步得出影響移動(dòng)端考研產(chǎn)品的主要因素;最終,篩選出影響移動(dòng)端考研產(chǎn)品的發(fā)展的主要因素為所在的城市、考研類型及在考研學(xué)習(xí)上花費(fèi)的總時(shí)長。
關(guān)鍵詞 主成分分析;聚類分析;移動(dòng)端考研產(chǎn)品發(fā)展;影響因素
中圖分類號(hào) TP2 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 2095-6363(2017)16-0158-01
移動(dòng)信息技術(shù)的快速發(fā)展,移動(dòng)設(shè)備的迅速普及以及人們對教育的重視程度的加深,為移動(dòng)端產(chǎn)品的出現(xiàn)與發(fā)展創(chuàng)造了廣闊的條件。如今考研教學(xué)和培訓(xùn)的市場發(fā)生了巨大的變化,移動(dòng)互聯(lián)網(wǎng)時(shí)代的到來,使得許多考研教學(xué)活動(dòng)轉(zhuǎn)移到了手機(jī)等移動(dòng)互聯(lián)網(wǎng)平臺(tái)。而且移動(dòng)端產(chǎn)品的使用人數(shù)較PC端更高,使用時(shí)長更長。所以說,合理的確定影響移動(dòng)端考研產(chǎn)品發(fā)展的主要因素對于市場發(fā)展十分重要。
1 模型準(zhǔn)備
量化分析時(shí),將每條記錄中的各項(xiàng)數(shù)據(jù)進(jìn)行具體量化,本文采用聚類分析將數(shù)據(jù)經(jīng)行劃分。聚類分析根據(jù)“物以類聚”的思想,將各項(xiàng)統(tǒng)計(jì)指標(biāo)或者變量劃分為若干類,聚類分析主要分為系統(tǒng)聚類和動(dòng)態(tài)聚類等兩大類。但是,考慮到需要進(jìn)行分類處理的數(shù)據(jù)多達(dá)196個(gè),若使用系統(tǒng)聚類會(huì)因?yàn)闃颖军c(diǎn)數(shù)量過多,計(jì)算量過大,導(dǎo)致最后的結(jié)果過于復(fù)雜。因此,本文采用動(dòng)態(tài)聚類分析方法,也稱K均值聚類分析。聚類分析的具體過程如下圖1所示。
本文使用2016年各省市的(GDP,人均GDP,人口規(guī)模,城市居民收入,財(cái)政收入)等數(shù)據(jù)作為統(tǒng)計(jì)依據(jù),并以最新年度的城市評價(jià)標(biāo)準(zhǔn)為劃分指標(biāo),將其他類型答案劃分為四類,分別對應(yīng)到原有的選項(xiàng),即北上廣深等一線城市、二線城市、三線城市及其他。處理過程中,往往由于數(shù)據(jù)量綱的不同,不同類的數(shù)據(jù)類型差異過大,因此將數(shù)據(jù)進(jìn)行數(shù)據(jù)的標(biāo)準(zhǔn)化處理就顯得十分重要。
2 模型建立
本文給出聚類分析結(jié)果如表1所示。
由表1進(jìn)行方差分析,各個(gè)分類各個(gè)變量在不同類間的差異都是顯著的,即分為4類比較合理。在研究中并非越多越好,例如在進(jìn)行回歸分析時(shí),變量間的多重共線性會(huì)導(dǎo)致最終得到的回歸方程會(huì)存在很大的誤差。因此,變量過多會(huì)導(dǎo)致信息的交叉重疊,各個(gè)變量間可能存在高度的相關(guān)性。因此,需要減少變量個(gè)數(shù),即降維,采用主成分分析。因子分析的基本原理在于保證信息的最小損失的情況下,將每個(gè)原始變量分解成兩個(gè)部分,一部分含有的是幾個(gè)少數(shù)公共因子的線性組合,另一部分是該變量所特有的特殊因子。KMO和Bartlett球形度檢驗(yàn)是判斷數(shù)據(jù)是否適合因子分析的檢驗(yàn)方法
之一。
下面給出因子分析結(jié)果,如表2所示。
經(jīng)分析檢驗(yàn)得KMO為0.556,表示該數(shù)據(jù)不適合進(jìn)行因子分析,不能借助因子分析進(jìn)行降維處理,故轉(zhuǎn)而采用主成分分析進(jìn)行降維處理。
3 模型的求解
主成分分析的基本原理在于保證信息的最小損失的情況下,以多個(gè)原始變量通過變換轉(zhuǎn)變?yōu)槿舾蓚€(gè)綜合指標(biāo)。變量過多會(huì)導(dǎo)致信息的交叉重疊,各個(gè)變量間可能存在高度的相關(guān)性。因此,需要減少變量個(gè)數(shù),即降維,采用主成分分析。
本文模型利用Spss軟件進(jìn)行主成分分析,其結(jié)果如圖2所示。
由圖2可以看出,最終經(jīng)過主成分分析篩選出影響移動(dòng)端考驗(yàn)產(chǎn)品的發(fā)展的主要因素為所在的城市、考研類型及在考研學(xué)習(xí)上花費(fèi)的總時(shí)長。
4 結(jié)論
本文針對移動(dòng)端考研產(chǎn)品的影響因素所建立的分析模型,將樣本數(shù)據(jù)中的“降維”具體城市用相應(yīng)的幾維城市代替,給模型分析和解釋帶來了便利。對數(shù)據(jù)信息進(jìn)行了合理的量化分析,通過KMO檢驗(yàn)可知,相比于因子分析,運(yùn)用Spss軟件通過主成分分析法找出影響移動(dòng)端考研產(chǎn)品發(fā)展的相關(guān)因素較為準(zhǔn)確。對于模型的后續(xù)改進(jìn)可以結(jié)合遺傳算法的全局搜索能力,在聚類分析中找到最佳分類。
參考文獻(xiàn)
[1]姜啟源等.數(shù)學(xué)模型[M].3版.北京:高等教育出版社,2003.
[2]韓中庚.數(shù)學(xué)建模方法及其應(yīng)用[M].北京:高等教育出版社,2006.
[3]吾建國.數(shù)學(xué)建模案例精編[M].北京:中國水利水電出版社,2005.endprint