亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于復(fù)旦大學(xué)ERU數(shù)據(jù)的學(xué)科交叉程度與研究熱點(diǎn)分析

        2015-09-08 02:01:28張春梅張計(jì)龍殷沈琴汪東偉郭耀東
        現(xiàn)代情報(bào) 2015年3期
        關(guān)鍵詞:動(dòng)態(tài)數(shù)據(jù)學(xué)科交叉聚類分析

        張春梅 張計(jì)龍 殷沈琴 汪東偉 郭耀東

        [摘要]本文利用復(fù)旦大學(xué)ERU數(shù)據(jù)采集平臺,從底層網(wǎng)絡(luò)數(shù)據(jù)中獲取用戶訪問圖書館電子資源時(shí)檢索行為的動(dòng)態(tài)數(shù)據(jù),運(yùn)用Sesson ID關(guān)系、因子分析和聚類分析等方法,分析我國高校學(xué)術(shù)研究的學(xué)科交叉程度及研究熱點(diǎn)。結(jié)果表明,學(xué)科交叉研究采用動(dòng)態(tài)數(shù)據(jù)源進(jìn)行分析,可以拓展學(xué)科交叉研究的深度和寬度,彌補(bǔ)以往研究中僅針對靜態(tài)數(shù)據(jù)分析研究的不足,促進(jìn)學(xué)術(shù)研究和科學(xué)創(chuàng)新上獲得新的生長點(diǎn)。

        [關(guān)鍵詞]學(xué)科交叉;動(dòng)態(tài)數(shù)據(jù);Session ID;因子分析;聚類分析

        DOI:10.3969/j.issn.1008-0821.2015.03.013

        [中圖分類號]G250.73 [文獻(xiàn)標(biāo)識碼]A [文章編號]1008-0821(2015)03-0068-09

        當(dāng)前學(xué)科交叉研究已成為科學(xué)技術(shù)發(fā)展的一個(gè)重要趨勢。自20世紀(jì)初學(xué)科交叉研究的萌芽在美國出現(xiàn)后,人們便開始認(rèn)識到學(xué)科交叉產(chǎn)生的新興學(xué)科,因?yàn)槠淠軌虼蚱苽鹘y(tǒng)學(xué)科研究束縛,為學(xué)科發(fā)展創(chuàng)造新的生長點(diǎn),為科技進(jìn)步提供新動(dòng)力的特點(diǎn),引起世界各國的廣泛關(guān)注。學(xué)科交叉借助其研究領(lǐng)域的獨(dú)特優(yōu)勢在新技術(shù)開發(fā)、新興產(chǎn)業(yè)應(yīng)用研究等領(lǐng)域產(chǎn)生極大的影響力,其科學(xué)技術(shù)創(chuàng)新的能力也被置于極其重要的地位。

        發(fā)現(xiàn)學(xué)科研究的交叉點(diǎn),無異于找到學(xué)科研究的新起點(diǎn),許多科研人員、學(xué)者都希望獲得本學(xué)科與其他學(xué)科的交叉點(diǎn)、學(xué)科研究新的增長點(diǎn)和研究熱點(diǎn)的信息,那么如何從海量文獻(xiàn)數(shù)據(jù)中發(fā)現(xiàn)這樣的信息,為科學(xué)發(fā)展、研究創(chuàng)新提供動(dòng)力呢?從目前已有的文獻(xiàn)可以看出幾種研究思路:第一種是以期刊引文關(guān)系為基礎(chǔ)研究學(xué)科交叉關(guān)系;第二種是通過關(guān)聯(lián)規(guī)則挖掘、文本挖掘等現(xiàn)代數(shù)據(jù)挖掘技術(shù)手段研究學(xué)科間的相關(guān)性和交叉知識;第三種是以期刊關(guān)鍵詞為基礎(chǔ)研究學(xué)科交叉的熱點(diǎn);第四種是以不同的研究對象為基礎(chǔ),從不同的視角研究學(xué)科之間的交叉關(guān)系。以上文獻(xiàn)多以靜態(tài)數(shù)據(jù)為基礎(chǔ)切入不同的分析角度探討學(xué)科之間的交叉關(guān)系,但是對學(xué)科交叉的程度以及研究熱點(diǎn)缺少量化分析。

        本文將以復(fù)旦大學(xué)ERU數(shù)據(jù)采集平臺所獲得的用戶使用電子文獻(xiàn)行為的動(dòng)態(tài)數(shù)據(jù)為基礎(chǔ)進(jìn)行數(shù)據(jù)分析。ERU全稱為“圖書館電子資源使用統(tǒng)計(jì)分析軟件”,一般部署在高校核心網(wǎng)絡(luò)交換機(jī)的鏡像口,從旁路出發(fā),基于網(wǎng)絡(luò)底層采集用戶信息行為的數(shù)據(jù),ERU軟件可以對圖書館實(shí)現(xiàn)電子資源知識庫定制管理,對圖書館所使用的數(shù)據(jù)庫和數(shù)據(jù)庫中的文獻(xiàn)內(nèi)容進(jìn)行用戶使用行為的數(shù)據(jù)采集,并以此為基礎(chǔ)實(shí)現(xiàn)電子資源使用情況的多維統(tǒng)計(jì)和用戶訪問行為的統(tǒng)計(jì)分析。通過ERU數(shù)據(jù)采集平臺獲取的動(dòng)態(tài)數(shù)據(jù),實(shí)現(xiàn)挖掘?qū)W科之間可能存在的交叉關(guān)系,為更好地揭示學(xué)科交叉關(guān)系提供一種新思路,不僅通過網(wǎng)絡(luò)用戶使用電子文獻(xiàn)資源的行為研究探討學(xué)科之間的交叉程度,而且深入挖掘數(shù)據(jù)的潛在關(guān)系對學(xué)科交叉的研究熱點(diǎn)也進(jìn)行分析,為師生、學(xué)者和科研人員的研究提供數(shù)據(jù)參考,幫助其找到學(xué)科研究上新的創(chuàng)新點(diǎn)和突破口。

        1.研究方法

        學(xué)科交叉程度的研究分析運(yùn)用Session ID關(guān)系,通過將SessionID中出現(xiàn)的文獻(xiàn)之間的關(guān)系轉(zhuǎn)換為學(xué)科之間的關(guān)系。以此建立起學(xué)科之間交叉關(guān)系的基礎(chǔ),以學(xué)科之間交叉出現(xiàn)的頻次作為學(xué)科交叉關(guān)系程度的反映。學(xué)科交叉熱點(diǎn)的研究分析則是利用因子分析,將學(xué)科交叉出現(xiàn)的高頻關(guān)鍵詞提取出具有代表性的因子,以這些因子為類,分析得出學(xué)科交叉的熱點(diǎn)區(qū)域,再結(jié)合聚類分析,將結(jié)果進(jìn)行比較,獲得較為滿意的學(xué)科交叉研究熱點(diǎn)的分析結(jié)果。

        1.1Session ID關(guān)系運(yùn)用分析

        本文學(xué)科之間的交叉關(guān)系是建立在Session ID關(guān)系的基礎(chǔ)之上獲得的。在Web中Session是指用戶在瀏覽某個(gè)網(wǎng)站時(shí),從進(jìn)入網(wǎng)站到瀏覽器關(guān)閉所經(jīng)過的一段時(shí)間,也就是用戶瀏覽這個(gè)網(wǎng)站所花費(fèi)的時(shí)間。Session在用戶第一次訪問服務(wù)器的時(shí)候自動(dòng)創(chuàng)建,其生成后,只要用戶繼續(xù)訪問,服務(wù)器就會(huì)更新Session的最后訪問時(shí)間,并維護(hù)該Session。服務(wù)器會(huì)把長時(shí)間沒有活動(dòng)的Session從服務(wù)器內(nèi)存中清除,此時(shí)Session便失效。服務(wù)器會(huì)分配SessionⅢ給不同的用戶,每個(gè)Session ID都是惟一的。文中設(shè)Session ID為一個(gè)分析對象,在這個(gè)分析對象中,所有出現(xiàn)的文獻(xiàn)被認(rèn)為是存在關(guān)聯(lián)關(guān)系的,它們之間的關(guān)聯(lián)關(guān)系將作為學(xué)科之間建立交叉關(guān)系的基礎(chǔ)。

        (1)明確一個(gè)Session ID中包含的每篇文獻(xiàn)的學(xué)科分類。文獻(xiàn)學(xué)科分類確定好之后,Session ID中出現(xiàn)的文獻(xiàn)之間的關(guān)系轉(zhuǎn)換為學(xué)科之間的關(guān)系。

        (2)再以Session ID為基礎(chǔ),交叉運(yùn)算每一個(gè)Session ID當(dāng)中存在的兩學(xué)科、三學(xué)科甚至多學(xué)科之間的相互交叉關(guān)系。假設(shè)一個(gè)Session ID當(dāng)中有若干篇文獻(xiàn),每篇文獻(xiàn)都有學(xué)科歸屬。文獻(xiàn)1學(xué)科分類為A,文獻(xiàn)2學(xué)科分類為C,文獻(xiàn)3學(xué)科分類既屬于學(xué)科A又屬于學(xué)科B,此時(shí)認(rèn)為A和B學(xué)科之間存在交叉關(guān)系,A和C學(xué)科,B和C學(xué)科,A、B和c學(xué)科之間都存在學(xué)科交叉關(guān)系。在同一篇文獻(xiàn)中出現(xiàn)的交叉關(guān)系定義為內(nèi)在關(guān)系,同一個(gè)Session ID中出現(xiàn)的交叉關(guān)系定義為外在關(guān)系。學(xué)科之間每出現(xiàn)1次交叉計(jì)算1次出現(xiàn)頻次,以學(xué)科之間交叉出現(xiàn)的頻次作為學(xué)科交叉關(guān)系程度的反映。

        (3)學(xué)科交叉的研究的熱點(diǎn)分析,也同樣引入Session ID關(guān)系影響因素,擴(kuò)大文獻(xiàn)中出現(xiàn)的關(guān)鍵詞關(guān)聯(lián)關(guān)系,同一個(gè)Session ID的用戶使用文獻(xiàn)的學(xué)科關(guān)鍵詞,關(guān)鍵詞的共現(xiàn)頻次不僅需要計(jì)算在同一篇文獻(xiàn)中兩兩共現(xiàn)的次數(shù),‘而且還要計(jì)算同一個(gè)Session ID中關(guān)鍵詞的兩兩共現(xiàn)次數(shù)。同一篇文獻(xiàn)中出現(xiàn)的關(guān)鍵詞的共現(xiàn)關(guān)系定義為內(nèi)在關(guān)系,同一Session ID出現(xiàn)的關(guān)鍵詞的共現(xiàn)關(guān)系定義為外在關(guān)系。

        1.2因子分析

        因子分析最早是由英國心理學(xué)家斯皮爾曼提出的,是一種從變量群中提取共性因子的數(shù)據(jù)簡化統(tǒng)計(jì)技術(shù)。因子分析通過研究眾多變量間的內(nèi)部依賴關(guān)系,探求觀測數(shù)據(jù)中的基本結(jié)構(gòu),找出變量中隱藏的具有代表性的因子,將相同本質(zhì)的變量歸入一個(gè)因子中,減少變量的數(shù)目,同時(shí)檢驗(yàn)變量間的假設(shè)關(guān)系,用假想的變量能夠反映出原來眾多變量的主要信息。換句話說,因子分析是尋找潛在的、起支配作用因子的方法。通過因子分析,將學(xué)科交叉出現(xiàn)的高頻關(guān)鍵詞提取出具有代表性的因子,以這些因子為類,分析得出學(xué)科交叉的熱點(diǎn)區(qū)域。

        1.3聚類分析

        聚類分析又稱群分析,起源于分類學(xué),是一種探索性分析方法,能夠分析事物的內(nèi)在特點(diǎn)和規(guī)律,并根據(jù)相似性原則對事物進(jìn)行分組,是數(shù)據(jù)挖掘中常用的一種技術(shù)。它特別適用于沒有先驗(yàn)知識的分類。如果沒有這些事先的經(jīng)驗(yàn)或一些標(biāo)準(zhǔn),分類便會(huì)顯得隨意和主觀,這時(shí)只要設(shè)定比較完善的分類變量,就可以通過聚類分析法得到較為科學(xué)合理的類別。學(xué)科之間交叉后會(huì)產(chǎn)生怎樣的知識分類,事先是無法得知的,通過聚類分析,可以分類得出,這樣就可以與因子分析的結(jié)果進(jìn)行比較,獲得較為滿意的學(xué)科交叉研究熱點(diǎn)的分析結(jié)果。

        2.數(shù)據(jù)采集與分析

        本文以復(fù)旦大學(xué)ERU數(shù)據(jù)采集平臺所獲得的用戶使用電子文獻(xiàn)行為的動(dòng)態(tài)數(shù)據(jù)為基礎(chǔ),從底層網(wǎng)絡(luò)數(shù)據(jù)中獲取用戶對學(xué)校訂購的所有中文數(shù)據(jù)庫的檢索、瀏覽、下載等信息行為的日志數(shù)據(jù),及對應(yīng)數(shù)據(jù)庫文獻(xiàn)信息,如關(guān)鍵字、作者、引用、發(fā)表時(shí)間等數(shù)據(jù)。數(shù)據(jù)采集時(shí)間為2013年8月到2014年2月的有效數(shù)據(jù)共241 464條,有48 000多個(gè)Session ID,平均每個(gè)Session ID有5條左右記錄。

        2.1學(xué)科交叉程度分析

        在數(shù)據(jù)分析中學(xué)科分類采用的是《中國圖書館分類法》,以此為基礎(chǔ)揭示學(xué)科之間的交叉情況。將采集到的有效數(shù)據(jù)與Session ID結(jié)合,按照上文介紹的運(yùn)算規(guī)則分析,并且對于同一篇文獻(xiàn)中學(xué)科交叉頻次,賦值為0.6,同一Session ID出現(xiàn)的學(xué)科交叉頻次,賦值為0.4,獲得的學(xué)科交叉程度結(jié)果如下(見表1):endprint

        猜你喜歡
        動(dòng)態(tài)數(shù)據(jù)學(xué)科交叉聚類分析
        云計(jì)算環(huán)境下動(dòng)態(tài)數(shù)據(jù)聚集算法研究
        顳下頜關(guān)節(jié)三維動(dòng)態(tài)數(shù)據(jù)測量的初步研究
        新形式下計(jì)算機(jī)輔助翻譯實(shí)驗(yàn)室建設(shè)探究
        亞太教育(2016年33期)2016-12-19 03:12:29
        創(chuàng)新創(chuàng)業(yè)設(shè)計(jì)人才培養(yǎng)導(dǎo)向的學(xué)科專業(yè)交叉融合策略
        農(nóng)村居民家庭人均生活消費(fèi)支出分析
        基于省會(huì)城市經(jīng)濟(jì)發(fā)展程度的實(shí)證分析
        中國市場(2016年33期)2016-10-18 12:16:58
        基于聚類分析的互聯(lián)網(wǎng)廣告投放研究
        科技視界(2016年20期)2016-09-29 12:32:48
        大學(xué)科技社團(tuán)關(guān)于學(xué)科交叉建設(shè)的探索和思考
        “縣級供電企業(yè)生產(chǎn)經(jīng)營統(tǒng)計(jì)一套”表輔助決策模式研究
        《機(jī)電傳動(dòng)控制》課程教學(xué)改革的探索
        考試周刊(2016年18期)2016-04-14 19:13:28
        亚洲a∨好看av高清在线观看 | av一区二区三区高清在线看| 中文字幕日本av网站| 精品一区二区av天堂色偷偷| 亚洲高清在线免费视频| 午夜少妇高潮在线观看| 情人伊人久久综合亚洲| 久久久久久亚洲av无码蜜芽| 精品三级av无码一区| 天堂aⅴ无码一区二区三区| 成全高清在线播放电视剧| 69av在线视频| 亚洲一区二区三区av色婷婷 | 白嫩少妇激情无码| 久久频这里精品99香蕉| 亚洲av日韩一区二三四五六七| 国产美腿丝袜一区二区| 亚洲成av人片乱码色午夜| 精品无码av一区二区三区| 国产大学生粉嫩无套流白浆| 人与嘼av免费| 色婷婷精品综合久久狠狠| 久久99国产精品久久99密桃| 国产精品国产三级国产密月| 国产亚洲一本大道中文在线| 国产熟人av一二三区| 亚洲 欧美 影音先锋| 国产呦系列视频网站在线观看 | 国内老熟妇对白xxxxhd| 日本亚洲欧美在线观看| 男女视频在线一区二区| 中文字幕日韩熟女av| 99久久婷婷国产精品网| 国产亚洲精品av久久| 免费网站看v片在线18禁无码| 日本www一道久久久免费榴莲| 久久亚洲精品国产精品婷婷| 日本av天堂一区二区三区| 色窝窝无码一区二区三区| 色狠狠色噜噜av天堂一区| 欧美另类高清zo欧美|