亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于關聯(lián)規(guī)則挖掘的多學科知識融合研究
        ——以新冠肺炎研究領域為例

        2023-03-01 01:33:06溫芳芳鄭詩嘉
        現(xiàn)代情報 2023年3期
        關鍵詞:學科知識參考文獻關聯(lián)

        溫芳芳 鄭詩嘉

        (河南科技大學管理學院,河南 洛陽 471023)

        新冠病毒全球肆虐,全世界的科學家都在開展應對這一重大公共衛(wèi)生危機的相關研究。鑒于新冠肺炎疫情的突發(fā)性、復雜性和多變性,單一學科無力應對,需要多學科的交叉與融合。挖掘新冠肺炎研究領域的強關聯(lián)性學科組合,并揭示其知識融合特征,有助于科學家更好地開展跨學科研究,通過廣泛的知識融合以便有效地應對新冠肺炎疫情帶來的挑戰(zhàn)??鐚W科研究是不同學科領域之間知識的相互影響和滲透,從知識來源的多學科角度可以展示這一屬性,一篇論文中參考文獻的學科分布可以在一定程度上反映該論文吸收和整合來自不同學科知識的程度,因此,引文分析成為考察多學科知識融合的常用方法[1]。在傳統(tǒng)的共被引分析以外,關聯(lián)規(guī)則作為數(shù)據(jù)挖掘的經典模型,提供了考察多學科知識融合的一種新思路?;谛鹿诓《菊撐乃膮⒖嘉墨I及其來源學科信息,通過關聯(lián)規(guī)則算法計算多個學科共現(xiàn)的概率,據(jù)此挖掘出強關聯(lián)性學科組合,在此基礎之上結合關鍵詞聚類方法揭示多學科知識融合所形成的熱門主題,從而為考察新冠病毒研究的跨學科性以及該領域的多學科知識融合的規(guī)律與趨向,開拓出一種新的分析維度。

        1 文獻綜述

        1)關聯(lián)規(guī)則挖掘在文獻計量學中的應用。關聯(lián)規(guī)則挖掘是從大量數(shù)據(jù)中發(fā)現(xiàn)事物的特征或數(shù)據(jù)之間頻繁出現(xiàn)的相互依賴關系和關聯(lián)關系。邱均平等[2]基于AltmetricTOP榜文獻,采用K-Means聚類及Apriori算法的關聯(lián)規(guī)則探討了不同情況下的文獻傳播特征。阮光冊等[3]利用Apriori算法提取高關聯(lián)主題詞集,通過對這些關聯(lián)規(guī)則進行共詞分析,挖掘出文獻之間的知識關聯(lián)。Li M N[4]基于關聯(lián)規(guī)則挖掘將共詞分析與突發(fā)術語檢測相結合,通過挖掘熱門關鍵詞與突發(fā)術語間的聯(lián)系,探索技術預見相關研究的前沿和趨勢。屈文建等[5]運用雙聚類分析方法進行作者與主題雙向聚類,再運用關聯(lián)規(guī)則挖掘算法,揭示了核心作者與前沿主題之間的關聯(lián)關系。李海林等[6]運用Apriori算法探究期刊論文引用過程中隱藏的關聯(lián)規(guī)則。Xu M等[7]綜合采用LDA模型和關聯(lián)規(guī)則挖掘進行了新興主題檢測。周磊等[8]從專利IPC規(guī)模和專利前向引用兩個角度分別構建加權關聯(lián)規(guī)則,建立基于加權關聯(lián)規(guī)則的技術融合探測方法。

        2)基于引文分析方法的知識融合研究。理論發(fā)展的知識基礎很大程度上是通過學術研究中所引用的文獻來反映的。在一定時期內,一個學科領域被已發(fā)表的論文所反復引用的文獻代表了該學科相對活躍的知識成分[9]。參考文獻的多樣性從邏輯上來說是知識整合的最好測度,研究領域的引文表達了其他領域的知識和信息輸入該領域的情況,可以很好地測度該領域知識與信息的交叉融合情況[10]。黃穎等[11]指出,知識融合度是跨學科的核心特征,揭示了相關跨學科研究的內在知識基礎,參考文獻視角下的跨學科測度是當前跨學科測度的主要思路。Porter A L等[12]基于論文參考文獻學科分布的“知識融合度(Integration)”指標,結合“專業(yè)度(Specialization)”指標對研究人員的“跨學科度”進行測度和分析。李長玲等團隊開展了跨學科知識組合識別方法的系列研究,從跨學科引用[13]、弱引文關系[14]等多個維度進行跨學科潛在知識組合以及知識生產點識別。

        3)研究述評與本文的創(chuàng)新之處。當前,學科交叉與知識融合研究的重心正在從單純地測度學科交叉度和知識融合度轉向預測和識別潛在的學科交叉與知識融合。關聯(lián)規(guī)則是數(shù)據(jù)挖掘領域的經典模型,在預測實體之間關聯(lián)性方面具有重要價值,可以作為探索知識融合趨勢的有效工具。關聯(lián)規(guī)則挖掘在文獻計量學已經有所應用,但尚未用于考察多學科知識融合問題。學科交叉與知識融合的主流研究仍是以共引、共被引等傳統(tǒng)的引文分析,再結合主題模型、社會網(wǎng)絡分析及可視化等手段來實現(xiàn),通過計算學科兩兩之間的相似性與關聯(lián)度來考察學科交叉和知識融合現(xiàn)象,研究維度和方法有待進一步革新。鑒于此,本文以國際期刊上發(fā)表的新冠肺炎主題論文為對象,依據(jù)其參考文獻的學科分布,采用關聯(lián)規(guī)則挖掘方法考察新冠病毒研究領域的多學科知識融合特征。相較于以往研究,本文的研究重點和創(chuàng)新之處主要包括:一是采用關聯(lián)規(guī)則挖掘方法對引文數(shù)據(jù)進行處理,計算多學科(組合)的共現(xiàn)概率,而不是僅僅測度學科兩兩之間的關聯(lián)性。二是挖掘具有強關聯(lián)性的學科組合,建立起知識輸入與知識輸出的關聯(lián),預測知識融合的趨向,識別潛在的知識生長點。

        2 數(shù)據(jù)與方法

        2.1 數(shù)據(jù)來源

        從Web of Science(WoS)的核心集合(SCI-E/SSCI/A&HCI)中獲取發(fā)文及引文數(shù)據(jù),世界衛(wèi)生組織和國際病毒分類委員會分別將新冠病毒命名為“COVID-19”和“SARS-CoV-2”,本文以此為檢索詞,采用“COVID-19 or SARS-CoV-2”進行主題檢索,文獻類型限定為“Article”,文獻發(fā)表的時間區(qū)間不作限制。檢索時間是2022年2月24日,共獲得檢索記錄115 267篇,將其題錄信息以全記錄形式下載并匯總。經初步篩選,其中516篇論文不提供參考文獻信息,將其予以剔除,最終獲得目標文獻114 751篇,從目標文獻的CR字段中提取出4 483 881篇參考文獻,將其中著錄信息不完整的情況予以剔除,保留4 365 012篇。科學研究的過程,參考文獻和目標文獻分別被視為知識輸入和知識輸出,其中,參考文獻所對應的學科被稱為知識來源學科。為確定參考文獻的歸屬學科,從JCR(《期刊引證報告》)中下載期刊目錄。期刊論文類的參考文獻能夠根據(jù)其來源期刊判斷學科歸屬,而其他類型的參考文獻,如報紙、專著、報告等,因沒有統(tǒng)一的學科分類標準而難以判定其所屬學科。據(jù)統(tǒng)計,樣本集合中期刊論文類的參考文獻共3 555 637篇,其他類型的參考文獻僅占全部參考文獻的18.54%,本文只將具有確切學科來源的期刊論文類參考文獻納入計量分析。

        2.2 數(shù)據(jù)處理

        WoS核心集共涵蓋252個學科,目標文獻的歸屬學科根據(jù)其題錄信息中WC字段判定,據(jù)統(tǒng)計,新冠主題論文涉及全部252個學科。參考文獻的學科歸屬還需結合每篇文獻來源期刊的學科類別來判定,從JCR數(shù)據(jù)庫獲得期刊的全稱、縮寫和學科類別,部分期刊信息還需要訪問其主頁進行手工補充,最后建立起“期刊全稱—期刊縮寫—所屬學科類別對照表”?;谠搶φ毡?,利用MySQL數(shù)據(jù)庫將所下載的參考文獻根據(jù)其來源期刊映射至1個或多個WoS學科類別中,若一篇參考文獻的來源期刊同時歸屬多個學科,相應的該篇參考文獻被分別計入多個學科。共得到4 838 020條映射記錄,分布在113 779篇目標文獻中,成功匹配的參考文獻占樣本集合中參考文獻總量的87.87%,參考文獻涉及229個學科。

        2.3 關聯(lián)規(guī)則挖掘方法

        關聯(lián)規(guī)則挖掘是當前數(shù)據(jù)挖掘的主要模式之一,是指在給定數(shù)據(jù)集中查找存在于項目集合之間的頻繁模式、相關性或因果結構,可以發(fā)現(xiàn)隱藏在數(shù)據(jù)之中不易被發(fā)現(xiàn),甚至與人的意識相違背的關聯(lián)事件[15]。本文采用經典的關聯(lián)規(guī)則Apriori算法進行挖掘分析,涉及到的核心概念包括:

        事務集(transactset):每一條數(shù)據(jù)稱為一個事務tk,所有事務組成的集合D={t1,t2,…,tn}稱為事物集D,事務集中所包含的事務數(shù)量為事務集的長度|D|。

        項集(itemset):事務中的元素稱為項目i,事務集D中所出現(xiàn)的全體項目組成的集合I={i1,i2,…,im}稱為項目集。I的任何子集X稱為D中的項目子集,X中項目的數(shù)量為項目子集的長度|X|,若|X|=k,則稱項目子集X為K-項集。

        支持度(support):設tk和X分別為D中的事務和項目子集,如果X?tk稱事務tk包含項目子集X。全體事務集D中包含項目子集X的事務數(shù),記為δx,δx在事務集D中所占的百分數(shù)(D包含X的概率)稱為事務集D對項目子集X的支持度,用support(X)表示,即support(X)=δx/lDI*100%;可以設定一個最小支持度用minsupport表示。

        頻繁項目集:對于某項目子集X,若滿足support(X)≥minsupport,則稱X為頻繁項目集。且若X?Y,Y是頻繁項目集,則X也是頻繁項目集。

        置信度(confidence):設X1、X2為項目子集,并且X1∩X2=Ф,則全體事務集D中同時支持X1與X2(即包含X1∪X2項目子集)的事務數(shù),在支持X1的所有事務中所占的比值(包含X1的事務中也包含X2的條件概率),稱為X1與X2關聯(lián)的置信度,用confidence(X1,X2)表示,即confidence(X1,X2)=support(X1∪X2)/support(X1)*100%;可以根據(jù)關聯(lián)規(guī)則挖掘需要指定最小置信度用minconfidence表示。

        關聯(lián)規(guī)則:對于規(guī)則X1=>X2,X1稱為前件,X2稱為后件。大于或等于最小支持度閾值和最小置信度閾值的規(guī)則叫做強關聯(lián)規(guī)則。即需滿足support(X1?X2)=support(X1∪X2)≥minsupport且confidence(X1?X2)=support(X1∪X2)/support(X1)≥minconfidence。關聯(lián)分析的最終目標就是要找出強關聯(lián)規(guī)則。

        提升度(Lift):即X2在包含X1的事務集中出現(xiàn)的概率與X2在事務集D中出現(xiàn)的概率的比值,Lift(X1?X2)=confidence(X1?X2)/support(X2)。Lift反映了關聯(lián)規(guī)則中的X1與X2的相關性,Lift>1且越高表明正相關性越高,Lift<1且越低表明負相關性越高,Lift=1表明沒有相關性。

        3 研究結果

        3.1 目標文獻與參考文獻的學科分布

        提取目標文獻和參考文獻的來源學科,分別計算各個學科包含的目標文獻和參考文獻的數(shù)量,根據(jù)目標文獻與參考文獻之間的對應關系,繪制出新冠論文的知識來源分布圖。因頁面限制,在252個學科當中,只顯示了發(fā)表新冠論文數(shù)量前10%的主要學科25個。如圖1所示,箭頭由目標文獻學科指向參考文獻學科,整體展示了新冠研究領域的知識來源學科的組成情況。

        圖1 新冠論文參考文獻的學科分布圖

        1)新冠肺炎疫情是人類社會百年未遇的全球重大災難,自暴發(fā)以后迅速引起了各個學科的共同關注。從目標文獻的學科分布來看,研究主題非常廣泛,涉及252個學科,覆蓋了WoS核心集的全部學科類別。其中,發(fā)文量最高的學科是公共、環(huán)境與職業(yè)衛(wèi)生,其次是多學科科學,說明綜合類和多學科科學類國際期刊是刊載新冠研究成果的主要平臺。此外,免疫學、醫(yī)學內科、環(huán)境科學、傳染病學等學科也發(fā)表了大量的新冠論文。整體而言,新冠研究主力來自于自然科學,研究重點仍在醫(yī)學領域。

        2)由參考文獻的學科分布來看,新冠論文的知識來源非常廣泛,其中,醫(yī)學內科是最主要的知識來源學科,其次是公共、環(huán)境與職業(yè)衛(wèi)生和多學科科學。綜合類和多學科科學類期刊是新冠研究的主要知識交流載體,知識的輸出和輸入都非?;钴S,既承載著大量的研究成果,也是重要的知識來源學科。此外,免疫學、傳染病學、生化與分子生物學等也是新冠研究的主要知識來源學科。除了醫(yī)學類專業(yè)以外,新冠肺炎研究所需的知識還來自于環(huán)境科學、精神病學、心理學等一些相近和相關學科。此外,還有大量其他的知識來源學科在圖中未能顯示,如古生物學、邏輯學、地質學等,盡管來自這些學科的參考文獻比例很小,但同樣構成了新冠研究的知識基礎。

        3)從目標文獻學科與參考文獻學科的知識流向來看,每一個目標文獻學科都對應著多個參考文獻來源學科,平均值為153個,說明知識來源的廣泛性。從各學科的知識來源學科的組成結構來看,一般而言來自本學科的參考文獻比例最大,但該比例仍在20%以下,多達80%以上的參考文獻來自其他學科。如:免疫學論文的參考文獻共覆蓋219個學科,本學科的參考文獻占15.51%,剩余84.49%來自醫(yī)學內科、多學科科學、傳染病學等218個學科。可見各個學科所發(fā)表的新冠論文,盡管研究視角不同,但都建立在多學科交叉與知識融合的基礎之上。不只綜合類和多學科科學類如此,各學科所開展的新冠研究普遍存在著廣泛的多學科交叉與知識融合。

        3.2 知識來源學科的關聯(lián)規(guī)則挖掘

        每篇目標文獻的參考文獻對應的所有學科類別構成一條事務,一條事務中重復出現(xiàn)的學科類別只記錄1次,表示該篇目標文獻的知識來源學科的集合。113 779篇目標文獻對應113 779條事務,將其導入R語言,采用Apriori算法進行關聯(lián)規(guī)則挖掘,相關參數(shù)設置為support=0.2,confidence=0.8,即輸出支持度大于0.2、置信度大于0.8的強關聯(lián)規(guī)則。首先得到53個符合條件的頻繁項集,含14個頻繁一項集、27個頻繁二項集、11個頻繁三項集和1個頻繁四項集。文中不再全部展示,僅以其中的1個頻繁四項集作為示例予以介紹,如表1所示,count表示該學科組合在多少個事務中共同出現(xiàn),support表示支持度。

        表1 頻繁四項集示例

        由表1中頻繁四項集{免疫學,傳染病學,醫(yī)學內科,微生物學}的count值和support值可知,這4個學科同時出現(xiàn)在28 403篇目標文獻的參考文獻列表中,占目標文獻總量的24.96%。說明這4個學科之間存在較強的知識關聯(lián),結成了新冠領域較為穩(wěn)定的知識來源學科組合,相應的,這4個學科之間更易于發(fā)生跨學科的知識融合。傳統(tǒng)的共被引分析方法多用來揭示兩個學科之間的關聯(lián),而關聯(lián)規(guī)則挖掘則可以同時反映單個學科或者多個學科之間的關聯(lián)及其強度,尤其兩個以上學科的關聯(lián)規(guī)則挖掘,更適合于揭示知識來源的學科組合情況。如表1所示的頻繁四項集,同時揭示出免疫學、傳染病學、醫(yī)學內科和微生物學4個學科之間頻繁的知識融合與深厚的知識關聯(lián)。

        針對上述53個頻繁項集進行關聯(lián)規(guī)則挖掘,共生成37條關聯(lián)規(guī)則,涉及11個學科,全部關聯(lián)規(guī)則的Lift(提升度)值都大于1,說明這些關聯(lián)規(guī)則中的前件與后件之間存在正相關性,Lift值越高表明其正相關度越高,即當前件存在時,后件出現(xiàn)的概率更大。將全部關聯(lián)規(guī)則及其相關數(shù)據(jù)用R語言畫圖進行可視化展示,如圖2所示,每根自下至上帶箭頭的折線代表著一條關聯(lián)規(guī)則,折線將作為前件的學科(組合)串聯(lián)起來,最終指向作為后件(rhs)的學科。連線的粗細代表該項關聯(lián)規(guī)則的置信度(confidence),連線越粗表示置信度越高;連線的顏色深淺代表支持度(support),顏色越深表示支持度越高。

        圖2 關聯(lián)規(guī)則的平行坐標圖

        本文挖掘出的37條關聯(lián)規(guī)則的詳細信息在圖2予以集中展示,縱坐標軸上的數(shù)字代表每項關聯(lián)規(guī)則中包含的前件學科的數(shù)量,從“3”引發(fā)的折線表示該關聯(lián)規(guī)則共有3個前項,從“2”引發(fā)的折線則表示共有兩個前項,從“1”引發(fā)的折線表示僅有1個前項。如微生物學、傳染病學和免疫學3個學科所結成的學科組合作為前件,可以推導出醫(yī)學內科為后件學科,即{微生物學、傳染病學、免疫學}=>{醫(yī)學內科},該關聯(lián)規(guī)則的置信度較大,表示前后件學科間關聯(lián)性較強。本身微生物學、傳染病學和免疫學能夠結成前件學科組合,就說明這3個學科之間存在著深厚的知識關聯(lián),它們組合在一起作為前件與后件(醫(yī)學內科)之間存在較強的相關性?;谠擁楆P聯(lián)規(guī)則可以判定,如果一篇新冠論文同時引用了微生物學、傳染病學和免疫學3個學科的參考文獻,則該論文很大概率也會引用醫(yī)學內科的參考文獻。強關聯(lián)規(guī)則所包含的多個學科之間更易于發(fā)生跨學科知識融合,由前件學科(組合)能推導出后件學科(組合),這就為科學家在新冠研究中選擇知識來源和合作伙伴指明了學科方向。

        再如,圖2中所顯示的兩項關聯(lián)規(guī)則,{細胞生物學}=>{生化與分子生物學}和{生化與分子生物學}=>{細胞生物學},細胞生物學和生化與分子生物學互為前后件出現(xiàn)在兩項關聯(lián)規(guī)則中。引用生化與分子生物學文獻的論文大概率會引用細胞生物學的文獻,而引用細胞生物學文獻的論文大概率也會引用生化與分子生物學的文獻。作為生物學的兩個分支學科,細胞生物學和生化與分子生物學之間存在著穩(wěn)固的知識關聯(lián),彼此交叉融合的概率很高。但兩項規(guī)則的置信度并不相同,說明學科之間的相關性并非一定是對稱的。

        本文挖掘出的37條關聯(lián)規(guī)則,有些前件學科和后件學科非常接近,但也有一些,如:{公共、環(huán)境與職業(yè)衛(wèi)生}=>{醫(yī)學:內科},從表面上看,前件和后件學科的關聯(lián)性似乎并不是很強。所以,關聯(lián)規(guī)則挖掘方法能夠突破對于學科關系的慣性認知局限,不僅能夠挖掘出相近學科之間的知識關聯(lián),也能挖掘出那些學緣關系較遠、看似關聯(lián)性不大的學科之間的相關性,這對于潛在學科組合及其知識融合的發(fā)掘和預測來說很有價值。

        3.3 關聯(lián)規(guī)則下的知識融合主題識別

        通過關聯(lián)規(guī)則挖掘出了強知識關聯(lián)的學科組合,但這樣的分析仍然停留在較為宏觀的學科層面,只能回答“哪些學科易于發(fā)生知識融合”,而無法回答“多學科知識融合后形成的研究主題是什么”。結合關鍵詞聚類方法,從微觀層面識別多學科知識融合的主題,從而能夠更深入具體地揭示知識融合規(guī)律。本文共挖掘出37條關聯(lián)規(guī)則,選擇其中置信度最高的關聯(lián)規(guī)則{免疫學,醫(yī)學內科,微生物學}=>{傳染病學}為例,考察多學科知識融合所形成的熱門研究主題。

        先從該項關聯(lián)規(guī)則的目標文獻集合(參考文獻列表中同時出現(xiàn)這4個學科的28 403篇論文)中提取關鍵詞,然后對關鍵詞進行人工規(guī)范化處理,包括去除無效詞、同義詞合并、單復數(shù)合并等,隨后選取頻次大于30的高頻關鍵詞構建共詞網(wǎng)絡導入VOSviewer進行聚類和可視化展示。如圖3所示,節(jié)點代表關鍵詞,節(jié)點大小表征詞頻,連線代表共詞關系。

        圖3包含了6個聚類,分別用6種不同的顏色予以區(qū)分,說明該項關聯(lián)規(guī)則所涉及的免疫學、醫(yī)學內科、微生物學與傳染病學進行多學科知識融合以后形成了6個熱點主題。#1聚類(紅色標識)圍繞核心關鍵詞“pandemic”,探討與新冠有關的公共衛(wèi)生與心理問題,研究范圍較為廣泛,涉及病毒空氣傳播、氣溶膠、心理健康、抑郁癥、艾滋病、遠程醫(yī)療等多個主題;#2聚類(黃色標識)圍繞核心關鍵詞“mortality”,關注老年人和基礎病患者等易感人群的感染、癥狀、抗體、免疫、死亡等問題,還涉及人工智能、深度學習等新技術在新冠疫情中的應用;#3聚類(藍色標識)圍繞核心關鍵詞“vaccine”,研究新冠病毒的機理、毒株、變異、蛋白及RT-PCR檢測等,重點在于新冠病毒檢測和疫苗研發(fā);#4聚類(綠色標識)圍繞核心關鍵詞“ACE2”,關注新冠臨床藥物研制,主要從分子、微生物、生物信息等角度展開;#5聚類(淺藍色標識)是母嬰主題,規(guī)模相對較小,聚焦新冠疫情下孕產婦和新生兒等特殊人群;#6聚類(紫色標識)規(guī)模最小,且與其他5個聚類之間的知識關聯(lián)很弱,作為一個相對獨立的小型主題,主要研究味覺問題,即新冠感染者因器官受損而導致味覺喪失或減退。

        圖3 強關聯(lián)學科組合的關鍵詞聚類圖

        綜上,通過關聯(lián)規(guī)則挖掘,發(fā)現(xiàn)了免疫學、醫(yī)學內科、微生物學與傳染病學作為一個強關聯(lián)學科組合,跨學科的知識融合非常活躍。結合關鍵詞聚類方法進一步發(fā)現(xiàn),這4個學科同時向新冠領域輸出知識,經融合以后形成了公共衛(wèi)生與心理健康、易感人群、疫苗研發(fā)、臨床藥物研制、母嬰患者、味覺退化等幾個熱點主題。同理,新冠領域的學者們在圍繞這些主題開展研究時也需要同時從上述4個學科獲取知識,每一個主題都依賴于多個知識來源學科所提供的知識基礎。例如,新冠疫苗原本屬于免疫學的研究問題,但疫苗設計步驟包括了靶抗原的合理選擇、免疫增強佐劑的設計、體液免疫及細胞免疫類型調控,以及免疫流程的臨床學優(yōu)化等一系列復雜問題[16]。所以新冠疫苗研發(fā)所依賴的研究基礎突破了免疫學的學科邊界,需廣泛借鑒醫(yī)學內科、微生物學、傳染病學等多個學科的知識。綜上,科學研究的過程并非知識的簡單拼湊和組合,而是在知識融合中創(chuàng)造新知識。多學科知識融合提供了科學研究所需的寬廣的知識基礎,新知識不斷涌現(xiàn),也孕育出了一系列新的學科生長點。

        4 結論與討論

        1)新冠肺炎研究依賴于多學科知識融合

        新冠病毒及其變異毒株的致病性和傳染性極強,其感染人群之多、影響范圍之廣、傳播速度之快、病理之復雜多變,成為史無前例的全球性大流行病,帶給全球科學家前所未有的挑戰(zhàn)。為了應對這一挑戰(zhàn),科學研究的過程中需要更為廣泛而深入的多學科知識融合。本文經過計量分析發(fā)現(xiàn),新冠研究領域的知識輸入和知識輸出所覆蓋的學科范圍都十分寬廣。一方面,目標文獻的學科分布非常廣泛,自然科學、工程學、人文、社會科學等的科學家都在積極抗“疫”,從不同維度探討如何應對新冠疫情,發(fā)表的新冠論文覆蓋了全部252個學科。從發(fā)文量來看,研究重心仍在醫(yī)學學科,但是研究視角具有明顯的多元性特征;另一方面,參考文獻的學科分布也非常廣泛,對于大多數(shù)學科而言,來自本學科的參考文獻尚不足20%,大部分的參考文獻來源于其他學科,每個學科的研究工作都依賴于多學科交叉融合所提供的寬廣的知識基礎。綜合目標文獻和參考文獻的學科分布可以證實,新冠研究具有鮮明的多學科交叉屬性,在多學科知識融合的基礎上進行新知識的創(chuàng)造,是科學家應對新冠挑戰(zhàn)的必然選擇。

        2)新冠疫情使得知識融合的趨勢進一步增強

        圍繞新冠主題各個學科之間的邊界變得非常模糊,每個學科的研究工作都建立在多學科交叉基礎之上,單純借助本學科的知識并不足以支撐起新冠肺炎這樣重大復雜問題的研究,而必須從多個學科汲取必要的思想、理論、理念、方法、技術、工具等,在多元化的知識場域內開展知識創(chuàng)新,進而產生新成果。這些成果又會作為知識素材被很多學科吸收和采納,從而構成其他學科開展相關研究的知識基礎。大科學時代,學科交叉與知識融合變得非常普遍,科學研究的過程也是知識融合的過程,尤其對于新冠肺炎這樣的事關全人類安全與命運的重大突發(fā)問題,更加依賴于多學科交叉融合所提供的寬廣的知識基礎。在新冠肺炎研究領域,廣泛的知識融合使得各個學科之間的邊界進一步模糊,學科之間的依存度更高,不只相近學科之間,那些原本學緣關系較遠的學科之間,也因新冠疫情而建立起知識關聯(lián)。新冠疫情背景下所開展的科學研究,不僅充分彰顯了大科學時代多學科交叉融合的特色,也進一步增強了多學科知識融合的趨勢。展現(xiàn)出來的新冠研究正如同一個生態(tài)系統(tǒng),鮮花、灌木、喬木和諧共生,不同的學科相互依存、彼此支撐,構成完整的有機生命體,該領域也因廣泛而深入的學科交叉和知識融合而展現(xiàn)出勃勃生機。

        3)關聯(lián)規(guī)則挖掘提供了考察學科交叉和知識融合的新方案

        學科交叉是跨越學科邊界的知識相互作用[17],通過學科交叉和知識融合而創(chuàng)造新知識并用于解決復雜的科學和社會問題,代表著科學發(fā)展的新趨向,也成為科學研究的新范式。知識融合是其本質內容,學科交叉是其表現(xiàn)形式,知識創(chuàng)造則是最終目的。文獻計量學常以引文為線索來考察學科之間的交叉融合現(xiàn)象,施引文獻和被引文獻分別被視為知識的輸入和輸出,傳統(tǒng)的分析手段主要包括:以引用與被引用關系追蹤學科之間的知識流動,以引文耦合衡量學科之間的研究相似度,以共被引表征多學科知識的交叉融合。本文提出的研究方案實際上是采用關聯(lián)規(guī)則挖掘這種經典的機器學習算法對共被引分析方法進行升級改造,旨在通過大數(shù)據(jù)方法為傳統(tǒng)的引文分析賦能。

        傳統(tǒng)的共被引分析僅以共被引頻次來度量學科兩兩之間的關聯(lián)強度,再輔之以聚類分析等方法展現(xiàn)學科知識結構。本文采用的關聯(lián)規(guī)則挖掘與其存在相似之處,本質上都是借助文獻之間的共被引關系來考察學科之間的知識關聯(lián),且關聯(lián)規(guī)則挖掘的第一步也需要計算不同學科的共被引頻次。盡管如此,基于關聯(lián)規(guī)則挖掘的研究方案在一些方面明顯不同于傳統(tǒng)的共被引分析:一是計算方法不同,關聯(lián)規(guī)則挖掘并不止步于計算共被引頻次,而是藉由置信度、支持度和提升度等指標,由前件學科(組合)推導出后件學科(組合)參與知識融合的概率。二是功能目標不同,本方案的主要目的在于挖掘出強關聯(lián)規(guī)則學科組合,而非揭示學科知識結構。關聯(lián)規(guī)則算法計算出某個學科(組合)存在時另一個學科(組合)出現(xiàn)的概率,借助概率值可以預測知識融合的趨勢,識別出適宜融合的潛在學科(組合)。三是分析原理不同,關聯(lián)規(guī)則中包含的學科數(shù)量不等,能夠同時揭示多學科(兩個以上學科)的知識關聯(lián),而以往的引文分析通常只計算學科兩兩之間的共被引關系及強度,相比較而言,關聯(lián)規(guī)則挖掘方法適宜進行多學科組合的知識關聯(lián)分析。

        此外,本方案較之傳統(tǒng)的共被引分析還做出了一定的改進。共被引分析和關聯(lián)規(guī)則挖掘都只是從知識輸入的角度揭示學科關聯(lián)。本研究在提取出強關聯(lián)學科組合的基礎上,又從知識輸出角度入手,從目標文獻中提取出關鍵詞,通過共詞分析揭示出強關聯(lián)學科組合在知識融合后能夠形成的研究主題。因此,本方案建立起從知識輸入到知識輸出的關聯(lián)用于考察多學科知識融合現(xiàn)象,雖不能解密從多學科知識融合到新知識產生的完整過程,至少回答了“哪些學科易于發(fā)生知識融合以及融合以后會形成哪些研究主題”的問題,這為進一步認識和把握知識融合的機理提供了一定的參考借鑒,也在一定程度上深化和拓展了傳統(tǒng)的引文分析的內容與功能。

        5 結束語

        本文以新冠肺炎研究領域為例,基于關聯(lián)規(guī)則挖掘探討了多學科知識融合問題,在傳統(tǒng)的共被引分析以外,提供了一種考察多學科知識關聯(lián)性的新方案,挖掘出了具有強關聯(lián)性的學科組合,識別了多學科組合所形成的熱點主題,獲得的結論和發(fā)現(xiàn)有助于進一步認識和把握多學科知識融合的規(guī)律與趨勢。對于廣大的科研工作者來說,能夠為他們尋找合適的知識來源和潛在的合作伙伴指明方向,為他們攻克科研難點提供新的思路與靈感;對于管理者和決策者來說,便于他們更有針對性采取措施推動多學科之間的交叉融合,為科技創(chuàng)新源源不斷地注入能量。本文在研究過程中仍存在一些不足:一是未能深入剖析多學科知識融合的機理;二是研究結論和發(fā)現(xiàn)僅限于新冠領域,能否推廣至其他領域還需進一步驗證;三是關聯(lián)規(guī)則挖掘與傳統(tǒng)共被引分析方法的分析結果是否存在明顯差異,尚未通過實證分析進行直接比較。后續(xù)研究將針對上述不足進行不斷完善。

        猜你喜歡
        學科知識參考文獻關聯(lián)
        高校圖書館學科化知識服務模式研究
        參花(上)(2023年2期)2023-03-06 03:54:09
        品讀
        The Muted Lover and the Singing Poet:Ekphrasis and Gender in the Canzoniere*
        “一帶一路”遞進,關聯(lián)民生更緊
        當代陜西(2019年15期)2019-09-02 01:52:00
        奇趣搭配
        學校德育要植根于學科知識的意蘊之中
        中國德育(2017年17期)2017-09-15 22:00:23
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        Study on the physiological function and application of γ—aminobutyric acid and its receptors
        東方教育(2016年4期)2016-12-14 13:52:48
        基于本體的學科知識門戶語義服務機制研究
        The Review of the Studies of Trilingual Education in inghai
        亚洲免费不卡av网站| www插插插无码视频网站| 精品国产18久久久久久| 69天堂国产在线精品观看| 日本高清成人一区二区三区| 在线观看一级黄片天堂| 亚洲午夜无码av毛片久久| 国产精品主播视频| 小草手机视频在线观看| 不卡一区二区黄色av| 亚洲免费网站观看视频| 正在播放东北夫妻内射| 亚洲人成人网毛片在线播放| 日韩精品成人一区二区在线观看| 午夜一区二区视频在线观看| 色综合色狠狠天天综合色| 国产亚洲欧美日韩综合一区在线观看 | 色综合久久久久久久久久| 欧美色欧美亚洲另类二区不卡| 男女干逼视频免费网站| 日本人妻伦理在线播放 | 亚洲av无码一区二区三区网站| 亚洲无线码1区| 国产精品成人av大片| 内射爽无广熟女亚洲| 日韩在线第二页| 狠狠久久av一区二区三区| 人妻少妇-嫩草影院| 爱情岛论坛亚洲品质自拍hd| 无码人妻精品中文字幕免费| 性生大片免费观看性少妇| 成人国产精品一区二区视频 | 国内少妇人妻丰满av| 日本久久一区二区三区高清| 久久精品国产成人午夜福利| 中国老妇女毛茸茸bbwbabes| 91精品国产91久久综合桃花| 羞羞色院99精品全部免| 果冻传媒2021精品一区| 亚洲精品亚洲人成在线下载| 国产精品女同一区二区免|