摘要:本研究運用神經(jīng)網(wǎng)絡檢驗了一般能力傾向成套測驗(GATB)對不同學科大學生專業(yè)成績的預測效度。對1022名大學生均施測GATB,并隨機選取其中652名,將其期末專業(yè)考試成績作為衡量專業(yè)成績的指標,建立人工神經(jīng)網(wǎng)絡(ANN)模型。研究發(fā)現(xiàn):對文、理、工三類專業(yè)大學生專業(yè)成績預測的ANN模型估計的準確率均在90%以上, GATB分數(shù)可以用來預測不同專業(yè)學生的專業(yè)成績。文科大學生最敏感的能力因子是言語能力,系數(shù)為0.523;理科大學生最敏感的能力因子是數(shù)理能力,系數(shù)為0.471;工科大學生最敏感的能力因子是空間判斷能力,系數(shù)是0.594。
關鍵詞:心理學;效度;一般能力傾向成套測驗(GATB);人工神經(jīng)網(wǎng)絡(ANN)模型;大學生
一、問題提出
一般能力傾向成套測驗(General Aptitude Test Battery,GATB)是美國勞工部就業(yè)保險局歷時50年,耗資數(shù)億美元,研究了美國上萬種職業(yè)后編制而成的著名測驗。這套測驗應用較廣,已被大量研究證明具有良好的信效度,能夠很好地預測職業(yè)成功和學術成就。GATB是適用于初三以上年級的中學生及成年人的團體測驗,包含15種分測驗(11種紙筆測驗,4種操作測驗),可在120~130分鐘內(nèi)測量9種與職業(yè)關系密切并有代表性的能力因素。這9種能力傾向因素為:一般智力、言語能力、數(shù)理能力、空間關系理解力、形狀知覺能力、文書知覺能力、動作協(xié)調(diào)能力、手指靈活性及手部靈巧性。Hammond1984年對GATB的結構進行因素分析發(fā)現(xiàn),GATB測量的其實是4種更普遍、更高層次的能力:言語能力、數(shù)理能力、工具組合能力和空間能力[1]。GATB在國外應用廣泛,是升學、就業(yè)指導以及人員選擇與安置的重要工具。而Droege等研究發(fā)現(xiàn):GATB的一般智力、言語能力、數(shù)理能力和書寫知覺測驗可以作為預測學業(yè)成績的良好工具[2]。R.L.Thorndike和E.P.Hagen報告,用GATB預測工程學校學生的專業(yè)成績的R2最低0.46,最高0.58[3]。
個體在大學期間的專業(yè)學習將奠定他們一生職業(yè)生涯的基礎。在美國,大學生入學之初,要進行一項學術能力測驗(SAT),通過這種學術能力測驗,可以預測大學生在大學期間的專業(yè)學習成績。也有研究者應用一般能力傾向成套測驗(GATB)來預測大學生的專業(yè)成績。在預測方法方面,以前的研究大都是運用傳統(tǒng)的多元回歸算法。如果應用神經(jīng)網(wǎng)絡模型新技術,效度是否會有提高呢?這值得我們來探索一番。
人工神經(jīng)網(wǎng)絡(Artificial Neural Network, ANN)是近年來發(fā)展起來的一門新興學科、新技術。它應用了一種信息處理系統(tǒng)或計算機模仿大腦的結構和功能,可稱之為人腦處理信息方式的簡化模型[4]。ANN今天已經(jīng)成為世界關注的熱點,引起各國政府與軍界的高度重視。
目前人工神經(jīng)網(wǎng)絡(ANN)的算法基本成熟。人工神經(jīng)網(wǎng)絡包括三部分:輸入層(input layer),隱藏層(hidden layer),輸出層(output layer)。輸入的數(shù)據(jù)顯示在第一層,其值從每個神經(jīng)元傳播到下一層的每個神經(jīng)元,最終從輸出層輸出結果。ANN是功能強大的函數(shù)估計器,只需基本的統(tǒng)計或數(shù)學知識就能夠進行訓練,并加以應用[4]。特別值得注意的是,它是一種非線性系統(tǒng),具有一個隱藏層的神經(jīng)網(wǎng)絡算法,可以擬合輸入和輸出之間的任意非線性關系,而不要求資料滿足正態(tài)分布或其他特殊分布,可以自由估計模型(即非參數(shù)模型)。因此,神經(jīng)網(wǎng)絡具有很強的綜合能力,輸入和輸出間的聯(lián)系可由訓練習得,再運用于計算中[5]。
BP(back propagation)神經(jīng)網(wǎng)絡是ANN的一種,由James McClelland和David Rumelhart在1986年提出[6]。它是一種典型的前饋神經(jīng)網(wǎng)絡,其權重的調(diào)整采用反向傳播的學習算法,神經(jīng)元的變換函數(shù)是S型函數(shù),輸出量是0~1之間的連續(xù)量,可以實現(xiàn)從輸入到輸出的任意非線性映射[7]。通過對網(wǎng)絡參數(shù)的選取,在確定了網(wǎng)絡層數(shù)、隱含層神經(jīng)元數(shù)、初始權重、學習速率、期望誤差及最大步長后,構建神經(jīng)網(wǎng)絡模型。確定網(wǎng)絡的結構后,利用輸入輸出樣本進行訓練,也就是對網(wǎng)絡進行調(diào)整,多次反復,直到樣本收斂,使網(wǎng)絡實現(xiàn)給定的輸入輸出映射關系,從而獲知最重要的影響因素。
從ANN誕生之日起,它與心理學就有著千絲萬縷的聯(lián)系。神經(jīng)網(wǎng)絡的靈感來自于神經(jīng)元的信息處理功能,神經(jīng)網(wǎng)絡的訓練則可以反映感覺、記憶、學習等認知過程[8]。ANN已被研究者廣泛應用于視知覺識別[9]、技能培養(yǎng)[10]、語言發(fā)展[11]等認知領域。研究者發(fā)現(xiàn),ANN對于內(nèi)隱記憶、內(nèi)隱學習等無意識認知過程有著極強的適應性[12,13],對神經(jīng)網(wǎng)絡來說,外界環(huán)境的每一次輸入都可能會引起網(wǎng)絡結構的重新調(diào)整(權重變化),從而改變該網(wǎng)絡下一次的加工模式。
社會認知與ANN有著類似的信息加工過程。社會認知過程中,人們會按照某種規(guī)則對所經(jīng)驗的事件進行組織,從而影響他們在類似環(huán)境下對待相似對象的印象與態(tài)度。因此,許多研究者針對印象形成[14]、歸因[15]、認知矛盾[16]、群體印象[17]等建立了各具特色的神經(jīng)網(wǎng)絡模型。
由于ANN的模仿對象是人腦神經(jīng)系統(tǒng)的處理方式,因此,它在功能上也具有某些智能的特點。神經(jīng)網(wǎng)絡主要有以下幾個基本功能:非線性映射、分類識別、知識處理。目前,神經(jīng)網(wǎng)絡已經(jīng)廣泛應用于信息領域、自動化領域、工程領域、醫(yī)學領域、經(jīng)濟學領域等各知識領域中,其智能化的特征解決了許多傳統(tǒng)信息處理方法無法解決的問題[18]。目前,學術界已經(jīng)普遍認同,人工神經(jīng)網(wǎng)絡方法是一種有效的研究工具,能夠代替?zhèn)鹘y(tǒng)的回歸分析方法,并可以在不同的領域進行廣泛應用。然而,心理測量學領域內(nèi)運用人工神經(jīng)網(wǎng)絡方法的研究還相當少見。
本研究將使用神經(jīng)網(wǎng)絡算法,取代傳統(tǒng)的回歸分析,嘗試檢驗一般能力傾向成套測驗預測不同學科大學生的專業(yè)成績的效度。
二、研究方法與研究過程
1.研究工具
以戴忠恒等修訂的一般能力傾向成套測驗(GATB)為研究工具,該測驗共包括15種分測驗,其中11種為筆試,分別為: 圓內(nèi)打點測驗、記號記入測驗、形狀相配測驗、名稱比較測驗、圖案相配測驗、平面圖判斷測驗、計算測驗、詞義測驗、立體圖判斷測驗、句子完成測驗、算術應用測驗;4種為器具測驗:插入測驗、轉(zhuǎn)動測驗、組裝測驗、拆卸測驗。
本研究采用團體施測方式,每次施測有2名以上熟悉本測驗所有項目的主試,最多對38名被試同時施測。首先由主試朗讀指導語,在所有被試明白測驗的要求和具體做法后開始測驗。因11項紙筆分測驗均為速度測驗,所以由主試使用秒表準確計時。
2.研究對象
在江蘇、安徽、上海等省市的7所院校對在校大學生進行團體施測。共施測1022人。其中男生521人(51.0%),女生501人(49.0%);“211工程”院校569人(55.7%),普通本科院校453人(44.3%);大一464人(45.4%),大二104人(10.2%),大三321人(31.4%),大四133人(13.0%);文科446人(43.7%),理科221人(21.6%),工科355人(34.7%)。
3.數(shù)據(jù)收集
隨機選取其中652名大學生,對他們期末考試中的專業(yè)課成績求出平均分并以班級為單位進行標準化,以此標準分作為衡量其專業(yè)成績的標準。在652名大學生中,文科專業(yè)268人,占41.1%;理科專業(yè)218人,占33.4%;工科專業(yè)166人,占25.5%;年齡17~24歲,平均20±1歲;男生320人,占46.3%,女生371人,占53.7%。
三、構建神經(jīng)網(wǎng)絡模型
使用專業(yè)軟件Clementine12.0構建神經(jīng)網(wǎng)絡模型。首先對樣本數(shù)據(jù)進行歸一化處理,以便更好地對數(shù)據(jù)關系進行映射,從而使其參數(shù)都落在(0,1)之間。歸一化選用以下公式:
P=(p-pmin)/(pmax-pmin)
公式中,pmin,pmax分別表示歸一化之前的最小值和最大值,P為歸一化值,p為歸一化之前的值。經(jīng)過歸一化轉(zhuǎn)換的結果在本研究中以P表示,例如P專業(yè)課均分。
經(jīng)過歸一化處理后,開始正式建模。在Clementine中應用神經(jīng)網(wǎng)絡進行能力傾向?qū)I(yè)成績預測的過程如下:首先選擇數(shù)據(jù)源,將GATB的7項能力傾向數(shù)據(jù)選為輸入變量,將標記專業(yè)課均分項選為輸出變量。然后在字段選項中選擇其中的分區(qū)節(jié)點,設置訓練、測試、驗證區(qū)域樣本比例,這是構建神經(jīng)網(wǎng)絡模型所需要的一個設置??傮w挖掘過程如圖1 所示。
圖1 數(shù)據(jù)挖掘過程
接著在模型里選擇神經(jīng)網(wǎng)絡模型的訓練方法。Clementine提供了快速、動態(tài)、多重、修剪、RBFN和窮舉型修剪六種用于構建神經(jīng)網(wǎng)絡模型的訓練方法(Silverston,數(shù)據(jù)模型資源手冊)。選擇快速的訓練方法,即使用數(shù)據(jù)的簡明規(guī)則和特征來選擇適合的網(wǎng)絡形狀(拓撲)。
此后在模型中設置預防過度訓練,將數(shù)據(jù)隨機分割為訓練集合和檢驗集合兩部分,設置70%的樣本為訓練集合,并將隨機種子設置為18。特定的隨機種子通常會生成相同的隨機值序列,產(chǎn)生相同的生成模型,從而使結果模型具有精確的可再現(xiàn)性。本研究中的預防過度訓練與隨機種子設置見圖2。
圖2 模型設置結果
四、結果分析
1.文科大學生一般能力傾向?qū)I(yè)成績的預測模型
本模型顯示出模型在生成前的選項和生成后的統(tǒng)計情況。結果顯示模型對建模數(shù)據(jù)估計的準確率達90.247%,其中輸入層有7個神經(jīng)元,隱藏層有1∶3個神經(jīng)元,輸出層有1個神經(jīng)元。
對各輸入點的敏感度進行分析顯示,各輸入字段的相對重要性參數(shù),按重要性排序為言語能力、一般智力、形狀知覺、運動協(xié)調(diào)、數(shù)理能力、書寫知覺、空間判斷能力,其敏感性系數(shù)依次為0.523、0.191、0.09、0.053、0.05、0.047、0.045。
將Neural Net結果結點連接在數(shù)據(jù)流中的分區(qū)結點后,向數(shù)據(jù)流中增加分析節(jié)點,模型分析結果見圖3,由圖可知,文科學生一般能力傾向?qū)I(yè)成績模型的平均預測誤差在-0.004到0.036之間,絕對平均誤差在0.103到0.105之間,該模型的預測誤差在可以接受的范圍之內(nèi)。
圖3 文科大學生一般能力傾向?qū)I(yè)成績的預測模型分析結果
再向數(shù)據(jù)流中增加導出結點。將導出結點連接到Neural Net結果結點。設置該結點屬性,將增添的字段的值設置為【abs(P專業(yè)課均分 - '$N- P專業(yè)課均分') / P專業(yè)課均分】 * 100,其中$N- P專業(yè)課均分是由神經(jīng)網(wǎng)絡生成的預測結果,如圖4所示。該圖形的橫坐標為導出值,縱坐標表示一共有多少個樣本的導出值落在相對應的橫坐標上。由導出的定義公式可知,導出值越小,則表明預測值與實際值的差別越小。由輸出圖形可以看出,該模型已達到一定的精度。
圖4 文科大學生一般能力傾向?qū)I(yè)成績的預測模型精度直方圖
2.理科大學生能力傾向?qū)I(yè)成績的預測模型
理科大學生一般能力傾向?qū)I(yè)成績預測模型顯示模型對建模數(shù)據(jù)估計的準確率達90.979%,輸入層、隱藏層、輸出層的神經(jīng)元個數(shù)與文科大學生模型的數(shù)量相同,分別為7個、1∶3個、1個。
理科大學生一般能力傾向?qū)I(yè)成績預測的各輸入點的敏感度分析顯示:按重要性排序為數(shù)理能力、一般智力、空間判斷能力、書寫知覺、言語能力、形狀知覺、運動協(xié)調(diào),其敏感性系數(shù)依次為0.471、0.233、0.132、0.073、0.046、0.042、0.003。
圖5 理科大學生一般能力傾向?qū)I(yè)成績的預測模型分析結果
模型分析結果見圖5,由圖可知,理科學生一般能力傾向?qū)I(yè)成績模型的平均預測誤差在-0.022到0.006之間,絕對平均誤差在0.091到0.097之間,結合圖6可知,模型達到了一定的精度。
圖6 理科大學生一般能力傾向?qū)I(yè)成績的預測模型精度直方圖
3.工科大學生能力傾向?qū)I(yè)成績的預測模型
工科大學生一般能力傾向?qū)I(yè)成績的預測模型顯示模型對建模數(shù)據(jù)估計的準確率達90.381%,輸入層、隱藏層、輸出層的神經(jīng)元個數(shù)與之前相同,分別為7個、1∶3個、1個。
工科大學生一般能力傾向?qū)I(yè)成績預測的各輸入點的敏感度分析結果顯示:按重要性排序為空間判斷能力、一般智力、言語能力、書寫知覺、形狀知覺、數(shù)理能力、運動協(xié)調(diào),其敏感性系數(shù)依次為0.594、0.202、0.084、0.048、0.035、0.029、0.008。
模型分析結果(見圖7)顯示,工科學生一般能力傾向?qū)I(yè)成績模型的平均預測誤差在-0.044到0.008之間,絕對平均誤差在0.106到0.115之間。模型精度直方圖(見圖8)顯示,由圖可知,導出值集中在一個很小的范圍之內(nèi),模型達到了一定的精度。
圖8 工科大學生一般能力傾向?qū)I(yè)成績的預測模型精度直方圖
五、討論
神經(jīng)網(wǎng)絡具有的非線性映射、自適應學習、并行性、知識分布存儲、逼近任意復雜連續(xù)函數(shù)等信息處理能力,克服了傳統(tǒng)預測方法對于數(shù)據(jù)處理方面的缺陷,使神經(jīng)網(wǎng)絡能夠在心理測量領域發(fā)揮重要作用。值得注意的是,回歸分析要求數(shù)據(jù)正態(tài)分布、線性,以及連續(xù)變量這些比較嚴苛的條件,在神經(jīng)網(wǎng)絡模型中卻不需要這些前提條件。也就是說,神經(jīng)網(wǎng)絡的算法具有非線性的特點。這可以大大彌補傳統(tǒng)統(tǒng)計方法的線性模型的局限。
本研究以人工神經(jīng)網(wǎng)絡建模為統(tǒng)計手段,分別建立文、理、工三類大學生一般能力傾向?qū)ζ鋵I(yè)成績的預測模型,由建網(wǎng)信息和模型分析結果可知,三個模型對建模數(shù)據(jù)估計的準確率均達到90%以上,預測的平均預測誤差在0.091到0.115之間,三個模型均達到了一定的精度。
首先, GATB的7項能力傾向?qū)ξ目茖I(yè)成績的影響按重要性排序依次為言語能力、一般智力、形狀知覺、運動協(xié)調(diào)、數(shù)理能力、書寫知覺、空間判斷能力,這一結果也可與文科專業(yè)大學生優(yōu)勢能力傾向互為佐證。言語能力的敏感性系數(shù)達到0.523,是影響文科專業(yè)成績表現(xiàn)的關鍵能力,這一結果也符合我們研究前的假設和實際情況。文科類專業(yè)的學生通常對文字、語言更有興趣,擁有較好的文字功底,將來所從事的職業(yè)多以文字工作為主,專業(yè)課程的設置與考核也是以此職業(yè)方向為導向,因而言語能力上得分突出的學生更有可能在文科專業(yè)的課程學習中達到優(yōu)秀水平。
其次,對理科大學生而言,數(shù)理能力、一般智力和空間判斷能力對其專業(yè)成績預測的敏感性系數(shù)分別為0.471、0.233和0.132。數(shù)理能力是利用算術知識解決實際問題的能力,一般智力則是需要根據(jù)原理進行推理和判斷的能力,而空間判斷能力是要求在心理空間進行圖形轉(zhuǎn)換進而進行推理、判斷的能力,這三類能力對學生的邏輯思維能力有較高要求,理科類專業(yè)側重于理論研究和科學培養(yǎng),尤需學生的理性思維、邏輯思維能力,因此,數(shù)理能力、一般智力和空間判斷能力是理科學習關鍵之所在,理科專業(yè)要求報考者在這些能力上的發(fā)展達到一定的水平,而在這些能力傾向上得分較低的被試可能需要付出相當?shù)呐Σ拍軌騽偃卫砜茖I(yè)的學習。
最后,工科類專業(yè)學生的專業(yè)成績7項能力傾向按重要性排序依次為:空間判斷能力、一般智力、言語能力、書寫知覺、形狀知覺、數(shù)理能力、運動協(xié)調(diào)。另外,空間判斷能力也是工科類大學生的優(yōu)勢能力傾向,以往相關研究也表明,空間想象和空間思維能力對于工科學習是不可或缺的[19],尤其是機械制圖等相關專業(yè)。工科專業(yè)側重技術應用,學生動手能力較強,心理空間的運動能力依賴于實際動手能力的發(fā)展,動手能力的鍛煉也會促進其空間想象能力的發(fā)展。值得注意的是,空間判斷能力對于工科學生專業(yè)成績的預測敏感性系數(shù)達到了0.594的水平——該項能力對工科學習十分重要,若發(fā)展良好,更可能在工科學習中脫穎而出。
縱觀三類專業(yè)大學生一般能力傾向?qū)ζ鋵I(yè)成績的預測情況,不難發(fā)現(xiàn),一般智力對于任何一類專業(yè)來說都是基礎性的能力傾向。國外相關研究結果也發(fā)現(xiàn),人們的智力和知識只要達到一定的水平,人們智力的高低差異對于工作效率不再有明顯的影響,然而與專業(yè)緊密相關的能力傾向與工作效率之間始終有顯著的正相關。本研究的結論在一定程度上驗證了這一觀點:對于不同的專業(yè)方向來說,每種專業(yè)類型都各有其關鍵的能力傾向。該專業(yè)的潛在報考者能否勝任該專業(yè)的學習和考核,關鍵能力傾向是至關重要之因素。
總而言之,人工神經(jīng)網(wǎng)絡模型對三類專業(yè)的專業(yè)成績預測都具有較高的準確性,說明本研究整體的技術路線可行,GATB所測得的7項能力傾向的不同組合可以用來預測不同專業(yè)學生的專業(yè)成績。通過人工神經(jīng)網(wǎng)絡模型,中學生可以根據(jù)自己在GATB的7項能力傾向上的得分情況預測自己報考三類專業(yè)的成績水平,從而判斷自己適合報考的專業(yè)方向。如能早日實現(xiàn)推廣,將是教育界及廣大學子喜聞樂見之事。
項目基金:全國教育規(guī)劃課題(DIA080131)
[1] Hammod, M.. An investigation into the factor structure of the General Aptitude Test Battery[J]. Journal of Occupational Psychology,1984,57(1):43–48.
[2] Droege, R. C.. GATB aptitude intercorrelations of ninth and twelfth garders: A study in organization of mental abilities[J]. Personnel Guidance Journal, 1968,46(7):668–672.
[3] 桑代克, R.L.,哈根, E.P.. 心理與教育的測量與評價[M]. 葉佩華,等,譯. 北京:人民教育出版社,1985.
[4] 林耀斌,杜友福.基于Clementine神經(jīng)網(wǎng)絡的商品促銷效果預測模型應用[J].電腦知識與技術,2009,5(34):90-92.
[5] 張菊英,韋健,楊樹勤.神經(jīng)網(wǎng)絡模型在住院費用影響因素分析中的應用[J].中華醫(yī)院管理雜志,2002,18(3):143-145.
[6] 嚴武.基于BP算法的住院天數(shù)神經(jīng)網(wǎng)絡模型建模研究[J].中國病案, 2009,10(11): 38-40.
[7] 易東,王文昌.回歸分析的人工神經(jīng)網(wǎng)絡算法模型研究[J].中國衛(wèi)生統(tǒng)計,1998,15(5).
[8] 郭秀艷,朱磊,魏知超.內(nèi)隱學習的人工神經(jīng)網(wǎng)絡模型[J].心理科學進展,2006,14(6):837-843.
[9] Martin, G. L.. Encoder: A connectionist models of how learning to visually encode fixated text images reading fluency[J]. Psychological Review, 2004,111(3):617–639.
[10] Berthier, N.E., Rosenstein, M. T., Barto, A.G..Approximate optimal control as a model for motor learning[J]. Psychological Review, 2005,69(2):329–346.
[11] Seidenberg, M. S..Connectionist models of word reading[J]. Current Directions in Psychological Science, 2005,14(5):1238–1242.
[12] 郭秀艷,鄒玉梅,李強,孫怡.中學生顏色內(nèi)隱學習特征的實驗研究[J].心理與行為研究, 2003,1(2):122-127.
[13] 郭秀艷,朱磊.神經(jīng)網(wǎng)絡模型對內(nèi)隱學習的探索[J].心理科學,2006,29(2):410-415.
[14] Kashima,Y., Kerekes, Andrew. R.Z.. A distributed memory model of averaging phenomena in person impression formation[J]. Journal of Experimental Social Psychology, 1994,30(5):407-455.
[15] Read, S. J., Montoya, J. A.. An auto associative model of causal reasoning and causal learning: Reply to Van Overwalle’s critique of Read and Marcus-Newhall[J]. Journal of Personality and Social Psychology,1996, 76(5):728–742.
[16] Shultz, T., Lepper,M.. Cognitive dissonance reduction as constraint satisfaction[J]. Psychological Review,1996, 103(2): 219–240.
[17] Gureckis, T.M., Love, B.C.. Common mechanisms in infant and adult category learning[J]. Infancy, 2004,5(2):173–198.
[18] 楊富勇.神經(jīng)網(wǎng)絡模型在股票投資中的應用[J].計算技術與自動化,2010,29(3):108-112.
[19] 黃俊紅.機械、自動化專業(yè)與非專業(yè)高年級學生能力傾向的比較研究[J].天津職業(yè)技術師范學院學報,2000,10(4):15-18.