〔摘 要〕與因果分析等一樣,相關(guān)分析也是信息資料分析的基本工作。典范相關(guān)分析用于分析兩組變量之間的關(guān)系,在情報信息的相關(guān)性分析方面有潛在的應(yīng)用價值。本研究介紹了典范相關(guān)分析方法,給出了典范相關(guān)分析的Java網(wǎng)絡(luò)算法軟件,可用于計算典范相關(guān)系數(shù),典范變量對,以及典范相關(guān)系數(shù)的統(tǒng)計顯著性。該軟件可在兼容Java的網(wǎng)絡(luò)瀏覽器上運行。同時,用該算法對國內(nèi)情報信息論文的發(fā)文和引文統(tǒng)計數(shù)據(jù)進行了分析,得到了一些結(jié)論。
〔關(guān)鍵詞〕典范相關(guān)分析;情報信息;網(wǎng)絡(luò)算法;軟件;應(yīng)用
〔中圖分類號〕G353.1 〔文獻標識碼〕B 〔文章編號〕1008-0821(2009)01-0134-06
Web Implementation of Canonical Correlation Analysis and Its Applications in Information Researches
Qi Yanhong Xu Lihui
(Library,Sun Yat-sen University,Guangzhou 510275,China)
〔Abstract〕Similar to regression analysis,cluster analysis,etc.,correlation analysis is also the basic work for information researches.Canonical correlation analysis can be used to analyze the relationship between two groups of variables,and thus worth for using in information science.Method of canonical correlation analysis was presented in present study.A Java-based network algorithm of canonical correlation analysis was developed,which can be used to calculate the canonical correlation coefficients,canonical variable pairs,and statistical significance of canonical correlation coefficients.The algorithm may be run on Java-compatible web browser.At the same time,paper publishing information and citation statistics in information science of China in past years were analyzed using the algorithm,and a number of conclusions were drawn.
〔Key words〕canonical correlation analysis;information;network algorithm;software;applications
與因果分析,聚類分析等一樣(齊艷紅,2003,2004,2006),相關(guān)分析是情報信息資料分析的基本工作(齊艷紅等,2003)。對情報信息資料進行相關(guān)分析,可檢測各種因素之間的相互關(guān)系,有助于發(fā)掘隱藏的信息,分析原因,并制訂相應(yīng)的對策。典范相關(guān)分析是相關(guān)分析的一種,用于分析兩組變量之間的關(guān)系,在情報信息的相關(guān)性分析方面有特別應(yīng)用價值。另外,網(wǎng)絡(luò)上運行的計算軟件具有平臺無關(guān),可隨時更新等優(yōu)點,已在有關(guān)領(lǐng)域得到了成功的應(yīng)用(齊艷紅,2002-2004,2006;齊艷紅等,2003)。鑒于此,本文研制了典范相關(guān)分析的網(wǎng)絡(luò)算法軟件,旨在為各類情報信息資料的分析工作提供一種在線計算工具。
4 討 論
值得指出的是,在典范相關(guān)分析中,典范相關(guān)系數(shù)反映兩個典范變量的取值隨觀測樣品的變化趨勢吻合情況。變量取值大小與典范相關(guān)系數(shù)大小并無必然的聯(lián)系。
Java是優(yōu)秀的網(wǎng)絡(luò)程序設(shè)計工具,其程序可運行于多種Java兼容瀏覽器上;Java程序穩(wěn)定性和安全性好,不易導(dǎo)致系統(tǒng)崩潰。前述典范相關(guān)分析的Java算法代碼短小,很符合網(wǎng)絡(luò)程序設(shè)計的基本要求。因此,有進一步研究應(yīng)用的價值。
參考文獻
[1]齊艷紅.圖書期刊評價分析的混合優(yōu)序圖及網(wǎng)絡(luò)計算軟件研究[J].現(xiàn)代計算機,2002,151:14-16,56.
[2]齊艷紅.JavaPCA:情報信息壓縮抽取分析的一種網(wǎng)絡(luò)共享軟件[J].情報雜志,2003,22(11):33-34.
[3]齊艷紅.圖書期刊評定分析的一種網(wǎng)絡(luò)分布式計算軟件[J].情報雜志,2003,22(1):43-45.
[4]齊艷紅.網(wǎng)絡(luò)計量學(xué)的一種Internet分布式聚類分析軟件[J].情報科學(xué),2003,21(10):1069-1071,1079,
[5]齊艷紅,張文軍.CorreDetector:一種用于信息資料相關(guān)性分析的網(wǎng)絡(luò)共享軟件[J].情報學(xué)報,2003,23(Suppl.):266-268.
[6]齊艷紅.情報信息因果分析的多變量回歸模型網(wǎng)絡(luò)軟件MultiVarRegr[J].情報科學(xué),2004,22(1):104-106,114.
[7]齊艷紅.多變量情報信息的統(tǒng)計假設(shè)檢驗網(wǎng)絡(luò)軟件研究[J].情報雜志,2006,25(1):96-97.
[8]齊艷紅.情報信息的判別分析網(wǎng)絡(luò)計算軟件研究[J].情報雜志,2006,25(11):64-65.
[9]邱均平,王宏鑫,馮新霞.《情報學(xué)報》與我國情報學(xué)發(fā)展(Ⅰ)——《情報學(xué)報》創(chuàng)刊20年來發(fā)文的計量分析[J].情報學(xué)報,2002,21(5):514-523.
[10]邱均平,王宏鑫,馮新霞.《情報學(xué)報》與我國情報學(xué)發(fā)展(Ⅱ)——《情報學(xué)報》創(chuàng)刊20年來引用文獻的計量分析[J].情報學(xué)報,2002,21(6):642-655.
[11]夏旭.《人大復(fù)印報刊資料G9分冊》收錄論文的計量分析[J].高校文獻信息研究,2000,7(1):52-59.
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文