亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基礎研究領域知識圖譜研究前沿的可視化分析

        2021-10-15 09:28:48陳雅丹杜元朱爽趙欣然孫娜李心怡胡燁胤李新龍
        海南醫(yī)學 2021年19期
        關鍵詞:主題詞圖譜資助

        陳雅丹,杜元,朱爽,趙欣然,孫娜,李心怡,胡燁胤,李新龍

        1.北京中醫(yī)藥大學,北京 100029;

        2.北京中醫(yī)藥大學東方醫(yī)院,北京 100078;

        3.北京中醫(yī)藥大學東直門醫(yī)院,北京 100700

        知識圖譜(Knowledge Graph)一詞在1972 年即已經被提出[1],隨著2012年谷歌知識圖譜的發(fā)布,特定領域的知識圖譜構建成為研究熱點問題,并逐漸滲透到金融、工業(yè)和醫(yī)學領域[2]。知識圖譜的本質是連接實體間關系的圖,即揭示實體之間關系的語義網絡[3],在實現(xiàn)知識可視化的同時,也可以挖掘知識單元或知識群之間隱含的復雜關系[4]。知識圖譜技術作為新一代人工智能的關鍵通用技術[5],在推動人工智能從感知智能向認知智能的跨越中扮演著重要角色。國家自然科學基金(national natural science foundation of China,NSFC)作為我國資助基礎研究的主體之一,其所資助的項目在一定程度上代表了國內基礎研究領域的熱點和方向。本文通過對NSFC在知識圖譜研究資助項目的分布情況、研究熱點及前沿的計量分析,系統(tǒng)梳理了基礎研究領域知識圖譜技術的研究進展。

        1 資料與方法

        1.1 數(shù)據(jù)來源在NSFC 官網[6]立項項目中,以“知識圖譜”、“知識地圖”為關鍵詞檢索相關研究,檢索時間1997至2019年。

        1.2 數(shù)據(jù)預處理(1)數(shù)據(jù)庫建立:將檢索結果分批導入到Excel 軟件,提取立項項目標題、所屬學部、項目類型、項目編號、項目金額、負責人、單位、批準年份等信息。(2)項目初篩及預處理:首先根據(jù)項目標題剔除與知識圖譜無關的項目。對項目單位信息進行預處理,將同一大學或科研院所附屬研究所統(tǒng)一合并為該大學或科研院所,如“中國科學院北京基因組研究所、中國科學院沈陽自動化研究所、中國科學院大連化學物理研究所”統(tǒng)一為“中國科學院”。(3)主題詞提取及預處理:對納入項目的標題進行分詞處理,在分詞處理時遵循以下原則:①拆分,最小完整意義拆分,保留具有實際意義的最小完整詞匯,如“異質信息網絡的多粒度表示與知識獲取方法研究”拆分為“異質信息網絡、多粒度、知識表示、知識獲取”;②剔除,剔除標題中部分通用表述或無特定含義的詞匯,如知識圖譜、機制、研究、關系、作用;③統(tǒng)一,對同一含義的主題詞統(tǒng)一為多數(shù)研究采用的表述,英文縮略詞統(tǒng)一為相應的中文表述,如“DEA”統(tǒng)一為“數(shù)據(jù)包絡分析”;④合并,將同一研究領域內的具體分子物質、通用技術等合并為其上級概念,如“知識抽取”、“知識發(fā)現(xiàn)”等相同概念統(tǒng)一為“知識獲取”。

        1.3 主題詞共現(xiàn)分析及可視化(1)數(shù)據(jù)格式轉換:將完成預處理的項目信息表(.xlsx) 整理為“CNKI-EndNote 格式”,另存為“制表符分隔的文本(.txt)”文件后將制表符替換為空格,將每條題錄最后增加兩空行,將項目信息表轉換成可視化軟件VOSViewer (Version 1.6.15)[7]可讀取的文章題錄信息形式:%0 Journal Article;%A 辜麗川;%+安徽農業(yè)大學;%T 基于知識圖譜的農業(yè)大數(shù)據(jù)碎片化知識發(fā)現(xiàn)方法研究;%D 2017;%K 農業(yè);大數(shù)據(jù);碎片化知識;知識發(fā)現(xiàn);%W CNKI。(2)主題可視化網絡構建及聚類:將“.txt”題錄文件導入VOSViewer 軟件,構建主題詞可視化網絡,采用軟件網絡聚類算法進行聚類分析。VOSViewer網絡聚類算法類似于Modularity方法(公式1),能夠實現(xiàn)聚類內部各元素間較高的相似性,不同簇間存在較高的相異性。

        公式中,Wij=2m/cicj,ci為元素i 所屬的聚類,δ (ci,cj)表示的方程值為1 (若ci=cj)或0;γ為聚類的分辨率,γ越大則得到的聚類越多,分類就越細。(3)主題詞時間疊加網絡:在上述主題詞網絡的基礎上,以主題詞出現(xiàn)的平均年度為依據(jù),構建主題詞時間疊加網絡。將主題詞可視化網絡及時間疊加網絡導出為“.png”格式。

        2 結果

        2.1 一般情況描述自1997—2019 年,共檢索到立項項目2 069項,剔除無關項目后共納入141個項目,總資助金額8 916.5 萬元,共涉及9 種項目類型(表1),其中面上項目、聯(lián)合基金項目、青年科學基金項目是主要立項類型,共計123項(88%),資助總額6 860萬元(76.93%),見圖1和圖2。

        圖1 各年度項目立項項目數(shù)分布

        圖2 各年度項目立項總金額分布

        表1 立項項目類型及金額分布

        納入項目主要分布在7 個學部,立項項目數(shù)目及資助金額前3 位的學部為信息科學部、地球科學部和管理科學部(表2),其中信息科學部立項項目94 項(66.67%),資助金額6 698萬元(75.12%)。17個知識圖譜研究涉及生命醫(yī)學內容,在學科領域分布上,中醫(yī)學領域7 項,藏醫(yī)學1 項,現(xiàn)代醫(yī)學6 個,生命科學3項;分布在醫(yī)學科學部8 項、生命科學部4 項、信息科學部4項,管理科學部1項。

        表2 各學部立項項目及金額分布

        納入項目分布在81家單位,資助金額前3位的單位為中國科學院,浙江大學和中國人民大學(表3),三家單位共立項項目16 項(11.40%),資助金額2 065 萬元(23.16%)。

        表3 各單位立項項目及金額分布(前10位)

        2.2 主題詞分析納入項目共包含274 個主題詞,共出現(xiàn)頻次486 次,出現(xiàn)頻次前10 位的主題詞包括:圖譜構建(36,7.4%)、大規(guī)模(12,2.5%)、模型(11,2.3%)、大數(shù)據(jù)(11,2.3%)、關系推理(10,2.1%)、圖譜查詢(8,1.6%)、文本(8,1.6%)、中醫(yī)學(7,1.4%)、語義網絡(7,1.4%)、個性化(7,1.4%)。構建主題詞的可視化網絡(圖3),對其進行聚類分析并構建時間疊加網絡(圖4)。主題詞可視化網絡(圖3)中,節(jié)點代表主題詞,主題詞頻次越高,節(jié)點直徑越大;節(jié)點間的連線表示兩主題詞在同一項目標題中出現(xiàn),共同出現(xiàn)頻次越高,連線越粗(下同)。節(jié)點的顏色用于表示不同聚類,顏色相同的節(jié)點屬于同一聚類,納入主題詞共分為5個亞類,聚類一(紅色)圍繞知識圖譜技術模型,主要涉及“模型、大規(guī)模、關系推理、圖譜查詢、圖譜分析、圖譜補全、分布式”等主題詞;聚類二(綠色)以圍繞醫(yī)學領域知識圖譜應用,主要涉及“中醫(yī)學、醫(yī)學、可視化、深度學習、知識發(fā)現(xiàn)”等主題詞;聚類三(藍色)圍繞圖譜構建,主要涉及“文本、語義網絡、動態(tài)、時空”等主題詞;聚類四(黃色)圍繞人工智能,主要涉及“個性化、推薦、自動化、智能化、機器人、在線”等主題詞;聚類五(紫色)圍繞數(shù)據(jù)應用,主要涉及“大數(shù)據(jù)、社交媒體、社交優(yōu)化”等主題詞。主題詞時間疊加網絡(圖4)中,節(jié)點顏色表示該主題詞出現(xiàn)的時間,每個主題詞的出現(xiàn)時間為其所在項目立項年度的平均值(下同),從圖中可以看出,“模型、主題模型、知識發(fā)現(xiàn)、圖譜分析、時空、人工知識”等主題詞為早期研究熱點,“云制造、深度學習、強化學習、神經網絡、體制、嵌入式、多源數(shù)據(jù)、多目標協(xié)同”等主題詞為目前研究前沿熱點。對納入研究的17 個生命醫(yī)學相關項目主題詞進行亞組分析,構建主題詞可視化網絡(圖5),共計62 個主題詞,出現(xiàn)87 次,其中“中醫(yī)學(7,8%)、醫(yī)學(6,6.9%)、圖譜構建(4,4.6%)、古籍(3,3.4%)、知識發(fā)現(xiàn)(3,3.4%)”為出現(xiàn)頻次前5 位的主題詞。上述主題詞可分為5個亞類,其中聚類一(紅色)圍繞現(xiàn)代醫(yī)學,主要涉及“生物、知識庫”等主題詞;聚類二(綠色)圍繞中醫(yī)學,主要涉及“古籍、知識發(fā)現(xiàn)、可視化、本體”等主題詞;聚類三(藍色)圍繞圖譜技術,主要涉及“圖譜構建、非完整數(shù)據(jù)、個性化”等主題詞;聚類四(黃色)圍繞體質研究,涉及“體質、動態(tài)”等主題詞;聚類五(紫色)圍繞針灸研究,涉及“針灸知識、古代、框架”等主題詞。

        圖3 納入項目主題詞可視化網絡

        圖4 納入項目主題詞時間疊加網絡

        圖5 生命醫(yī)學領域項目主題詞可視化網絡

        主題詞時間疊加網絡(圖6)提示“醫(yī)學、決策模型、群智能、關系推理、圖神經網絡、知識補全、健康社區(qū)、體質、動態(tài)”等主題詞為目前研究前沿熱點。

        圖6 生命醫(yī)學領域項目主題詞時間疊加網絡

        3 討論

        從NSFC 在知識圖譜研究資助課資助力度來看,自2003 年起不同類型項目的立項數(shù)量及總資助金額呈現(xiàn)波動中增長的趨勢,其中青年科學基金項目在立項數(shù)量方面總體增長態(tài)勢較為明顯,但資助金額整體水平并不高,平均資助金額有限;面上項目在項目數(shù)量及資助總額呈現(xiàn)穩(wěn)步增長趨勢,是NSFC 在知識圖譜資助的主要類型。根據(jù)NSFC“十三五”發(fā)展規(guī)劃[8],將科學基金資助格局調整為探索、人才、工具、融合四大系列,在知識圖譜領域立項項目主要分布在探索系列和人才系列,近幾年主要資助融合系列及探索系列項目,工具系列的研究一直偏少。從立項項目學部分布情況來看,信息科學部為知識圖譜的熱點學部,相交于其他學部NSFC 立項項目和金額數(shù)占據(jù)絕對優(yōu)勢。在生命科學和醫(yī)學科學部,也可看到知識圖譜相關研究立項,但目前資助力度還處于較低水平,個別生命醫(yī)學領域知識圖譜研究立項在其他學部。從立項項目單位分布情況來看,知識圖譜領域NSFC 的26.95%支持在前10位的單位,其中中國科學院的立項項目數(shù)目及基金總量均位于首位,其次為浙江大學與中國人民大學,一定程度上反映出NSFC 項目對研究基礎的要求相對較高。

        在研究關鍵詞分析方面,限于項目公示信息的限制,本研究根據(jù)立項項目標題進行了主題詞的拆分和預處理,雖然一定程度上引入了新的偏倚風險,但考慮研究標題對一個NSFC 項目的重要性,以其作為研究主題分析數(shù)據(jù)源,還是能夠最大程度上保留研究的原意。從研究主題詞分布來看,“知識獲取、創(chuàng)新、企業(yè)”等主題詞頻率遠遠高于其他主題詞,這也反映出NSFC資助基礎研究的戰(zhàn)略定位。對知識圖譜領域高頻主題詞的聚類分析提示,目前NSFC 在知識圖譜領域資助的項目主要圍繞圖譜技術模型、醫(yī)學應用、圖譜構建、人工智能、數(shù)據(jù)應用等形成了五大熱點研究領域,根據(jù)主題詞的時間疊加網絡圖(圖4),可以清晰的看出,主題詞平均出現(xiàn)時間主要集中在2014—2019年,這與本時段NSFC 立項項目數(shù)量整體較高有關,“云制造、深度學習、強化學習、神經網絡、體制、嵌入式、多源數(shù)據(jù)、多目標協(xié)同”等成為我國基礎研究領域知識圖譜研究前沿。在生命醫(yī)學領域內,圍繞現(xiàn)代醫(yī)學、中醫(yī)學、針灸、體質、圖譜技術形成五個研究熱點領域,其中“醫(yī)學、決策模型、群智能、關系推理、圖神經網絡、知識補全、健康社區(qū)、體質、動態(tài)”為當前研究前沿。

        從目前NSFC在知識圖譜研究資助項目分布情況來看,資助項目數(shù)量波動式上升,資助金額總量變化較大,研究主題豐富度逐漸增加,主要分布在探索系列和人才系列研究,融合系列有明顯提升,工具系列研究依舊薄弱,學科交叉型及成果轉化型研究有待進一步提高。知識圖譜研究已經滲透到金融、工業(yè)和醫(yī)學領域,對知識圖譜的定量和定性特征的科學理解已經成為大數(shù)據(jù)、智能化時代科學研究中一個基礎性研究方向。在醫(yī)學特別是中醫(yī)學領域有著廣闊的應用前景,目前已在中醫(yī)百科系統(tǒng)、中醫(yī)智能問答、臨床輔助決策、數(shù)據(jù)挖掘分析領域進行了很多有益的嘗試[2],但目前我國基礎研究領域知識圖譜研究仍偏于技術應用層面,知識圖譜關鍵基礎技術研究有待進一步加強深化。

        猜你喜歡
        主題詞圖譜資助
        高校資助育人成效的提升路徑分析
        大學(2021年2期)2021-06-11 01:13:28
        繪一張成長圖譜
        “隱形資助”低調又暖心
        補腎強身片UPLC指紋圖譜
        中成藥(2017年3期)2017-05-17 06:09:01
        主動對接你思維的知識圖譜
        美國防部資助研發(fā)能垂直起降的無人機
        2600多名貧困學生得到資助
        中國火炬(2015年2期)2015-07-25 10:45:24
        我校學報第32卷第5期(2014年10月)平均每篇有3.04個21世紀的Ei主題詞
        我校學報第32卷第6期(2014年12月)平均每篇有3.00個21世紀的Ei主題詞
        2014年第16卷第1~4期主題詞索引
        亚洲AV无码精品一区二区三区l| 午夜爽爽爽男女污污污网站| 免费无码一区二区三区蜜桃大| av中文字幕综合在线| 视频一区二区三区中文字幕狠狠| 国产黑丝美女办公室激情啪啪| 牛牛在线视频| 国产亚洲婷婷香蕉久久精品| 国产精品制服一区二区| 日韩女同在线免费观看| 妺妺窝人体色www聚色窝仙踪| 亚洲成在人线av| 超高清丝袜美腿视频在线| 午夜福利视频一区二区二区| 国产成人精品午夜二三区波多野| 日韩精品大片在线观看| 亚洲毛片av一区二区三区| 国产剧情一区二区三区在线 | 日本一区二区免费高清| 人妻少妇精品视频三区二区一区| 亚洲中久无码永久在线观看软件| 国产美女三级视频网站| 97超碰精品成人国产| 国产精品欧美一区二区三区不卡| 国产免费av片在线观看麻豆| 国产成人久久精品二区三区| 免费看美女被靠到爽的视频| 亚洲 自拍 另类 欧美 综合 | 无遮挡粉嫩小泬| 亚洲精品久久区二区三区蜜桃臀| 国产亚洲欧美精品久久久| 人伦片无码中文字幕| 综合久久一区二区三区| 一本久久综合亚洲鲁鲁五月天| 国产成人精品一区二区视频| 一级无码啪啪| 美女很黄很色国产av| 精品免费看国产一区二区| 岛国精品一区二区三区| 亚洲av高清不卡免费在线| 99爱在线精品免费观看|