溫學(xué)兵, 劉 洋, 王秋萍
(1. 沈陽師范大學(xué) 學(xué)報編輯部, 沈陽 110034;2. 鐵嶺市私立求實(shí)中學(xué) 數(shù)學(xué)組, 遼寧 鐵嶺 112000; 3. 沈陽師范大學(xué) 國際教育學(xué)院, 沈陽 110034)
期刊量化評價指標(biāo)有數(shù)十種,其中有些指標(biāo)對期刊的評價方面有重疊性,各個指標(biāo)間的相關(guān)性強(qiáng)弱差別也很大。本文目的是削減對期刊某一方面性質(zhì)的刻畫有重疊性和相關(guān)性很弱的指標(biāo),即去除冗余指標(biāo),而這恰巧是粗糙集屬性約簡理論最擅長的應(yīng)用。
粗糙集(rough sets,RS)是由Pawlak[1]于1982年提出的一種知識發(fā)現(xiàn)與數(shù)據(jù)挖掘的方法,主要對信息系統(tǒng)含有的不夠準(zhǔn)確的數(shù)據(jù)或數(shù)據(jù)缺損情況進(jìn)行研究。經(jīng)過近10年的研究發(fā)展,粗糙集理論開始在數(shù)據(jù)挖掘、人工智能、模式識別等各個領(lǐng)域得到廣泛應(yīng)用。
本文先利用粗糙集理論將期刊評價指標(biāo)約簡,去除冗余指標(biāo),再根據(jù)指標(biāo)理論意義進(jìn)行分類,最后利用結(jié)構(gòu)方程模型原理進(jìn)行指標(biāo)間的相關(guān)性和因果關(guān)系認(rèn)定[1]。
《中文核心期刊要目總覽》是由近萬名專家遴選出的學(xué)術(shù)影響力較高的期刊,本文選取2014版《中文核心期刊要目總覽》[2]和2017版《中國科技期刊引證報告(擴(kuò)刊版)》[3]中共有的工程技術(shù)類347種期刊,采用2017版《中國科技期刊引證報告(擴(kuò)刊版)》的具體數(shù)據(jù)。
1) 數(shù)據(jù)離散化
經(jīng)典粗糙集[4]只能處理離散數(shù)據(jù),故分析前需將量化指標(biāo)數(shù)據(jù)進(jìn)行離散,這里采用等距離散化方法。
2) 粗糙集屬性約簡
屬性約簡是在保持?jǐn)?shù)據(jù)分類能力不變的前提下, 對數(shù)據(jù)進(jìn)行約簡, 刪除冗余指標(biāo), 得到知識的最小表達(dá)。 決策表的屬性約簡是通過定義屬性的重要度函數(shù)或差別函數(shù)的一類啟發(fā)式算法, 通過該算法得到?jīng)Q策表的相對約簡, 比如, 基于屬性重要度的屬性約簡算法、 基于差別矩陣的屬性約簡算法、 基于差別函數(shù)的屬性約簡算法、 基于互信息的屬性約簡算法等。 本文選用基于差別函數(shù)的屬性約簡算法。
統(tǒng)合結(jié)構(gòu)模型是包含測量模型和結(jié)構(gòu)模型在內(nèi)的結(jié)構(gòu)方程模型,可以說是結(jié)構(gòu)方程模型各個基本模型的整合運(yùn)用,也可以說是路徑分析和驗(yàn)證性因素分析的綜合分析,同時也稱為結(jié)構(gòu)回歸模型[5-6]。
當(dāng)路徑分析與驗(yàn)證性因素分析的概念融合在結(jié)構(gòu)方程模型分析過程時,驗(yàn)證性因素分析的潛變量分析技術(shù)恰好充實(shí)了被路徑分析縮減的非具體概念的測量以及相應(yīng)誤差項(xiàng)的解決問題,同時也加強(qiáng)了路徑模型的測量理論。擅長因果分析的路徑分析方法將因素分析的格局?jǐn)U大了。
利用知網(wǎng)和萬方兩家數(shù)據(jù)各自的優(yōu)勢,把二者的量化評價指標(biāo)結(jié)合在一起使用,基于結(jié)構(gòu)方程模型方法,利用AMOS 20.0軟件,首次獲得了滿足結(jié)構(gòu)方程模型方法所要求的所有擬合指標(biāo)滿意度的統(tǒng)合結(jié)構(gòu)模型。特別對粗糙集約簡后的指標(biāo)進(jìn)行統(tǒng)合模型分析,并得到了相關(guān)關(guān)系。
考慮到2017版《中國科技期刊引證報告(擴(kuò)刊版)》的量化評價指標(biāo)比較多,且把新出現(xiàn)的一些量化評價指標(biāo)納入了其報告中,故參照2014版《中文核心期刊要目總覽》所列期刊,并選擇2017版《中國科技期刊引證報告(擴(kuò)刊版)》中共同含有的工程技術(shù)類期刊的相應(yīng)數(shù)據(jù)作為下一步約簡選用的數(shù)據(jù)。
首先對這些數(shù)據(jù)進(jìn)行離散化,然后進(jìn)行粗糙集屬性約簡[7]。粗糙集約簡結(jié)果見表1,這些指標(biāo)就是下一步結(jié)構(gòu)方程模型方法所要用到的指標(biāo)。
表1 粗糙集約簡結(jié)果Table 1 Rough set parsimony results
把約簡結(jié)果的指標(biāo)作為一級指標(biāo)下設(shè)的二級指標(biāo),并將它們歸為3類一級指標(biāo),即影響力、傳播力、期刊特征。影響力下屬的4個二級指標(biāo)與期刊總的量化指標(biāo)有關(guān),傳播力下屬的4個二級指標(biāo)反映了期刊在各個方面的影響程度和廣度,期刊特征下屬的4個二級指標(biāo)都是與時間相關(guān)的期刊量化指標(biāo)[8]。指標(biāo)分類見表2。
注意粗糙集約簡只是選擇了結(jié)構(gòu)方程模型要用的指標(biāo),指標(biāo)對應(yīng)的數(shù)據(jù)仍為原始數(shù)據(jù)。
此處數(shù)據(jù)規(guī)范化處理與驗(yàn)證性因素分析的數(shù)據(jù)規(guī)范處理方法相同[9]。
初始模型假設(shè)和最終初始模型[10-11]見文獻(xiàn)[12]。
AMOS軟件不僅可以對測量模型進(jìn)行分析檢驗(yàn),也可以對結(jié)構(gòu)模型進(jìn)行分析驗(yàn)證。本文應(yīng)用AMOS 20.0軟件進(jìn)行擬合檢驗(yàn)[13],根據(jù)檢驗(yàn)結(jié)果發(fā)現(xiàn),盡管所有指標(biāo)都滿足顯著性p<0.05,但是各項(xiàng)配適度指標(biāo)并不滿足優(yōu)秀擬合結(jié)果。見表3。
由于配適度指標(biāo)并未達(dá)到優(yōu)秀,對照MI修正指標(biāo)對模型修正處理。修正后的配適度指標(biāo)見表4,基本上都滿足優(yōu)秀配適度,說明修正合理[14]。
表4 修正后配適度檢驗(yàn)表Table 4 Revised accessories degree inspection table
根據(jù)標(biāo)準(zhǔn)化結(jié)果可以計算出潛在變量的組合信度[15],用來表示測量變量與潛在變量之間的結(jié)束程度。一般組合信度的檢驗(yàn)值為0.5,若其大于0.5,則認(rèn)為組合信度良好。計算結(jié)果見表5。
表5 修正模型擬合檢驗(yàn)Table 5 Modified model fitting test
從模型的配適度檢驗(yàn)表以及估計值報表可以看出,EXT(傳播力)與擴(kuò)展引用刊數(shù)、地區(qū)分布數(shù)、機(jī)構(gòu)分布數(shù)之間存在結(jié)構(gòu)關(guān)系,因子載荷量分別為0.539,0.714,0.991,組合信度為0.805,表示其解釋能力較強(qiáng),可信度高;DIS(期刊指標(biāo))與其下設(shè)的3個二級指標(biāo)平均作者數(shù)、平均引文數(shù)、基金論文比之間也具有結(jié)構(gòu)關(guān)系,因子載荷量分別為0.545,0.970,0.584,組合信度為0.756;INF(影響力)與其下設(shè)的3個二級指標(biāo)擴(kuò)展總被引頻次、擴(kuò)展學(xué)科影響指標(biāo)、擴(kuò)展影響因子之間也存在結(jié)構(gòu)關(guān)系,因子載荷量分別為0.733,0.463,0.870,組合信度為0.742。
本文將粗糙集理論與結(jié)構(gòu)方程模型理論結(jié)合使用[16]。采用2017版《中國科技期刊引證報告(擴(kuò)展版)》工程技術(shù)類期刊量化指標(biāo)數(shù)據(jù),首先運(yùn)用粗糙集方法對其進(jìn)行約簡,去除冗余指標(biāo),然后利用結(jié)構(gòu)方程模型方法對約簡后的指標(biāo)數(shù)據(jù)進(jìn)行分析,最終得到了其中12個指標(biāo)間的結(jié)構(gòu)模型。