亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        兩類知識圖譜差異辨析及其在科技出版中的應(yīng)用

        2019-03-25 08:03:24唐亮羅軒王穎
        出版參考 2019年1期
        關(guān)鍵詞:科學知識圖譜可視化

        唐亮 羅軒 王穎

        摘 要:隨著數(shù)字時代和互聯(lián)網(wǎng)技術(shù)的發(fā)展,知識圖譜逐漸在科學研究和若干行業(yè)中得到應(yīng)用。本文從概念、發(fā)展脈絡(luò)、數(shù)據(jù)類型、構(gòu)建方法及應(yīng)用領(lǐng)域等方面對科學知識圖譜和語義知識圖譜進行比較分析,重點辨析兩者的差異性。此外,本文列舉兩類知識圖譜在科技出版領(lǐng)域的應(yīng)用案例,分析知識圖譜在未來的應(yīng)用方向和前景。

        近年來,“知識圖譜”一詞頻繁出現(xiàn)在各種通用和專業(yè)知識場景中,其他類似的名稱有“科學圖譜”“科學知識圖譜”等。盡管研究者眾,只要深究知識圖譜本質(zhì)含義、發(fā)展脈絡(luò)、構(gòu)建方法和應(yīng)用場景,就會發(fā)現(xiàn)其實知識圖譜并不是指向同一個事物,而是分為發(fā)源于科學計量學、可視化的一類和發(fā)源于語義網(wǎng)的另一類。此前也有文章將后者稱為“Google知識圖譜”并從知識管理角度將其與“科學知識圖譜”進行比較。本文深入分析兩類知識圖譜完全不同的發(fā)展脈絡(luò)及在此基礎(chǔ)上的差異,并就其在科技出版領(lǐng)域的應(yīng)用做一論述。

        一、兩類知識圖譜的差異

        在搜集各類文獻、媒體文章基礎(chǔ)上,筆者對其中所指的知識圖譜進行概念溯源,分析其數(shù)據(jù)特征和構(gòu)建方法,并對其應(yīng)用場景進行比較和歸類,發(fā)現(xiàn)總體上知識圖譜分為兩種類型,并從以下幾方面分析兩種類型之間的差異。

        1.概念和發(fā)展脈絡(luò)上的差異

        知識圖譜最早的名稱是科學知識圖譜,其英文名稱Mapping Knowledge Domains是在2003年召開的科學傳播領(lǐng)域著名的亞瑟·M.塞克勒研討會(Arthur M. Sackler Colloquia)上,由科學計量學奠基人之一Eugene Garfield提出的,2005年由國內(nèi)學者陳悅和劉則淵于翻譯為“科學知識圖譜繪制”,科學知識圖譜由此得名。在科學計量學的范疇中,知識圖譜的定義是以科學文獻知識為對象,以科學研究范式為基礎(chǔ),以引文分析方法和信息可視化技術(shù)為手段,顯示學科的發(fā)展進程與結(jié)構(gòu)關(guān)系的一種圖形,主要是對文獻和文獻內(nèi)容的知識單元進行可視化。

        知識圖譜的另一個概念脈絡(luò)則來自完全不同的領(lǐng)域。經(jīng)歷了20世紀70~80年代的專家系統(tǒng)、90年代的語義網(wǎng)、本世紀初的關(guān)聯(lián)數(shù)據(jù)和基于百科的大規(guī)模開放知識庫等發(fā)展階段,谷歌公司于2012年提出“知識圖譜(Knowledge Graph)”的概念,旨在描述真實世界中存在的各種實體或概念及其關(guān)系,以構(gòu)建巨大的語義網(wǎng)絡(luò)圖,其中節(jié)點表示實體或概念,邊則由屬性或關(guān)系構(gòu)成,因此知識圖譜提供了從關(guān)系的角度去發(fā)現(xiàn)知識、分析問題的能力,逐漸發(fā)展成為以語義網(wǎng)為基礎(chǔ)的新型海量知識管理和服務(wù)模式。

        因此,從概念來源和發(fā)展脈絡(luò)上,兩者完全不同。本文中為進行區(qū)分,將前者稱為“科學知識圖譜”,將后者稱為“語義知識圖譜”。

        2.數(shù)據(jù)類型上的差異

        目前大多數(shù)應(yīng)用場景中,科學知識圖譜主要建立在對科學文獻和科研相關(guān)數(shù)據(jù)進行分析的基礎(chǔ)之上。科學文獻之間存在的引用關(guān)系反映了科學知識之間的遞進過程和內(nèi)在關(guān)聯(lián)性,因此對文獻的挖掘和分析可以揭示一個主題、領(lǐng)域或?qū)W科的發(fā)展的情況,以圖形化手段呈現(xiàn)研究結(jié)構(gòu)、重點以及發(fā)展趨勢。科學知識圖譜重要的研究數(shù)據(jù)類型包括引文數(shù)據(jù)(如科學引文索引,SCI)、科研論文、合作關(guān)系、項目資助、關(guān)鍵詞、數(shù)據(jù)庫(如PubMed)等。因此,科學知識圖譜數(shù)據(jù)來源于并應(yīng)用于科學研究領(lǐng)域。

        相比于科學知識圖譜,語義知識圖譜所利用的數(shù)據(jù)類型則廣泛得多,而且尤其適用于解決關(guān)系復雜、類型繁多、結(jié)構(gòu)多變的數(shù)據(jù)。根據(jù)不同領(lǐng)域和應(yīng)用目標,語義知識圖譜所需數(shù)據(jù)也有所不同。比如在金融領(lǐng)域,既有來自互聯(lián)網(wǎng)輿情、監(jiān)管機構(gòu)的合規(guī)要求、內(nèi)部報告等非結(jié)構(gòu)化文本數(shù)據(jù),也有財務(wù)、報告等半結(jié)構(gòu)化數(shù)據(jù),以及上百個業(yè)務(wù)系統(tǒng)產(chǎn)生的海量結(jié)構(gòu)化數(shù)據(jù);醫(yī)學領(lǐng)域數(shù)據(jù)有電子病歷、臨床醫(yī)學知識庫、醫(yī)學主題詞表(如MESH)、國際疾病分類(如ICD-10)等。

        3.構(gòu)建方法上的差異

        根據(jù)應(yīng)用目的的不同,科學知識圖譜有不同的類型及相應(yīng)的繪制方法,總體上大致分為以下幾個步驟。①選擇數(shù)據(jù)源,獲取所需信息。比較常見的數(shù)據(jù)源是各類科學文獻,如期刊論文、專利、項目等數(shù)據(jù)庫。進一步抽取其中對于特定科學知識圖譜有用的信息,比如作者、機構(gòu)、引用與被引、主題詞、關(guān)鍵詞等。②數(shù)據(jù)處理和分析:處理過程包括數(shù)據(jù)清洗、關(guān)系矩陣構(gòu)建、數(shù)據(jù)標準化等,在此基礎(chǔ)上進行因子分析、多維尺度分析、聚類分析、共詞/共引分析、潛在語義分析等。③結(jié)果可視化:利用算法、軟件、工具等把經(jīng)過采集、處理和分析的數(shù)據(jù)和轉(zhuǎn)化為可視化圖形,以快速、直觀和形象地揭示特定領(lǐng)域的發(fā)展現(xiàn)狀、規(guī)律、進程及其結(jié)構(gòu)關(guān)系。

        語義知識圖譜的構(gòu)建過程則完全不同。①知識抽取,即從非結(jié)化數(shù)據(jù)中人工或自動地提取實體、關(guān)系和屬性。具體方法有基于規(guī)則、基于數(shù)據(jù)模型、基于神經(jīng)網(wǎng)絡(luò)模型等。②知識表示。通常以基于本體的結(jié)構(gòu)化知識描述框架RDF三元組進行直觀的表示,如“實體-關(guān)系-實體”或“實體-屬性-屬性值”。近年來以深度學習Deep Learning為代表的表示學習技術(shù)可以將實體的語義信息表示為稠密低維實值向量,進而在低維空間中高效計算實體、關(guān)系及其之間的復雜語義關(guān)聯(lián)。③知識融合。這一過程使不同來源和形態(tài)的知識在同一框架下進行整合、加工、消歧、驗證、更新等,為知識庫內(nèi)部的邏輯性和規(guī)范表達奠定基礎(chǔ)。④知識計算和推理?;谌诤虾蟮闹R信息,通過本體和規(guī)則推理技術(shù)推理得到更多隱含的知識,豐富和擴展知識庫。

        4.應(yīng)用領(lǐng)域上的差異

        科學知識圖譜大多通過對科學文獻、數(shù)據(jù)資料的采集和分析,實現(xiàn)科學知識、研究信息和發(fā)展趨勢的可視化展示。具體應(yīng)用可歸納為以下三方面:①研究內(nèi)容智能檢索和分析。通過共詞分析、主題共現(xiàn)和論文被引聚類等方法發(fā)現(xiàn)研究領(lǐng)域的分類規(guī)律和現(xiàn)狀特征。②發(fā)現(xiàn)學科發(fā)展脈絡(luò)和趨勢??陀^、大規(guī)模、自動化地展示學科及其結(jié)構(gòu)及其發(fā)展脈絡(luò),展現(xiàn)局部和全局圖譜,實現(xiàn)各學科間的關(guān)系和學科前沿的可視化展示,發(fā)現(xiàn)新興學科。③輔助科研評價與決策。利用共現(xiàn)網(wǎng)絡(luò)可視化展示、二維圖和三維圖形成評價輔助工具。④支持科研合作和管理。分析和識別科研合作、交流情況和研究相似度,發(fā)現(xiàn)研究影響力,為調(diào)整相關(guān)科研政策提供依據(jù)。

        語義知識圖譜主要建立在領(lǐng)域本體規(guī)范的基礎(chǔ)上,其強大的語義處理和互聯(lián)組織能力,為智能化信息應(yīng)用乃至人工智能提供了基礎(chǔ),因此在自然語言處理、語義標注、智能搜索、知識問答、關(guān)聯(lián)分析、決策支持、知識推理等方面有了廣泛的應(yīng)用。尤其在商業(yè)智能、互聯(lián)網(wǎng)金融等在市場活躍的領(lǐng)域,由于受到資本和知本的雙重驅(qū)動,發(fā)展十分迅速。比如用語義知識圖譜構(gòu)建復雜的關(guān)系網(wǎng)絡(luò),可用來有效地揭示、識別出金融欺詐和避免金融風險。此外,語義知識圖譜在醫(yī)療、教育、交通等重要領(lǐng)域也有應(yīng)用研究。例如醫(yī)學知識圖譜被應(yīng)用于醫(yī)療信息搜索引擎、醫(yī)療問答系統(tǒng)、醫(yī)療決策支持系統(tǒng)等方面。

        二、兩類知識圖譜在科技出版領(lǐng)域的應(yīng)用現(xiàn)狀

        科技出版是支撐科學技術(shù)交流和發(fā)展的重要一環(huán),在經(jīng)歷了本世紀以來的數(shù)字化、網(wǎng)絡(luò)化的傳播形態(tài)變革后,集成了期刊、圖書等資源的文獻數(shù)據(jù)庫成為科技出版最主流的科技出版產(chǎn)品形態(tài)。近年來,上述兩類知識圖譜在科技出版領(lǐng)域均有不同程度的應(yīng)用。

        1.科學知識圖譜:基于科學計量學的廣泛應(yīng)用

        在面向?qū)I(yè)知識服務(wù)的應(yīng)用上,科學知識圖譜主要還是從科學計量的角度出發(fā),為專業(yè)科研工作者提供揭示學科發(fā)展歷史、研究熱點和前沿趨勢、學科間關(guān)系、不同層面的合作關(guān)系的可視化工具,為研究選題和評價等決策性活動提供數(shù)據(jù)分析上的支持。不少圖書情報機構(gòu)長期進行科學知識圖譜的理論研究和工具開發(fā),也不斷有面向情報分析應(yīng)用的產(chǎn)品投入市場。因為科學計量學須建立在全面的文獻數(shù)據(jù)之上,因此只有擁有這些數(shù)據(jù)的機構(gòu)才有條件發(fā)展科學知識圖譜服務(wù)。

        國際方面,一些實力雄厚的信息服務(wù)商和出版商均推出了類似于科學知識圖譜的情報分析型產(chǎn)品,如科睿唯安公司(Clarivate Analytics)的深層次科研分析工具——ESI數(shù)據(jù)庫,基于其Web of Science覆蓋全球12000多種期刊的數(shù)據(jù)信息,可用于分析機構(gòu)、國家和期刊的論文產(chǎn)出和影響力,發(fā)現(xiàn)各學科領(lǐng)域的發(fā)展趨勢,評估科研表現(xiàn)和發(fā)展?jié)摿Φ?。Elsevier推出的科研情報分析平臺SciVal以全球最大的文獻摘要與引文數(shù)據(jù)庫Scopus為基礎(chǔ),通過全面利用各種工具和數(shù)據(jù)源,提供符合要求的定制化的分析報告,幫助用戶進行科研數(shù)量與質(zhì)量分析、科研合作分析、人才流動分析、科研成果利用分析等。與Springer Nature同屬Holtzbrinck集團旗下的Digital Science公司與100多家研究組織和資助機構(gòu)合作,整合旗下多家子公司的產(chǎn)品和服務(wù),于2018年1月推出研究分析平臺Dimensions,不僅囊括了8900萬多篇期刊文章,還包括近360余萬個資助項目、38萬份臨床試驗資料、3400余萬項專利以及存在于這些記錄之間的40多億對關(guān)系。Dimensions不僅提供針對單篇研究文章的文獻計量學和替代計量學指標,還豐富了其他相關(guān)信息如資助項目,從多個維度反映研究成果價值和效率。利用科學知識圖譜技術(shù),Dimensions不僅為科研用戶判斷科研發(fā)展態(tài)勢提供數(shù)據(jù)分析參考,也為科研經(jīng)費提供者提供決策依據(jù)。

        國內(nèi)方面,幾個主要的文獻情報機構(gòu)和數(shù)據(jù)商集成了海量文獻數(shù)據(jù),成為這些機構(gòu)發(fā)展科學知識圖譜的基石。中國科學院文獻情報中心建立了中國科學引文數(shù)據(jù)庫(Chinese Science Citation Database, CSCD),收錄我國各個學科領(lǐng)域出版的中英文科技期刊論文記錄500余萬條、引文記錄6600余萬條,不僅提供引文與文獻間的雙向關(guān)聯(lián)檢索服務(wù),還能對檢索結(jié)果中的學科類別、來源出版物、作者、機構(gòu)等要素進行分析,已經(jīng)應(yīng)用在一些學科的發(fā)展態(tài)勢分析中。中國科學技術(shù)信息研究所建立了基于期刊引用的檢索評價工具——中國科學引文索引(China Science Citation Index, CSCI),囊括了2000年來我國出版的科技類和部分社科類學術(shù)期刊約9000余種、論文4500多萬篇、引文記錄2億多條,能對國內(nèi)學術(shù)機構(gòu)、學者的科研論文產(chǎn)出、引用情況進行年度、主題等多維度查詢。中國知網(wǎng)(CNKI)、萬方知識服務(wù)平臺和超星發(fā)現(xiàn)平臺等學術(shù)文獻數(shù)據(jù)庫均利用科學計量學方法提供知識點共現(xiàn)、關(guān)注度變化等學術(shù)趨勢分析功能,用戶在利用數(shù)據(jù)庫獲取文獻的同時也可利用這些功能把握搜索主題的研究生命周期和方向。盡管上述平臺中只有超星發(fā)現(xiàn)平臺以知識圖譜來作為其情報分析模塊的名稱,其實所有這些功能均是基于科學知識圖譜而建立的。

        2.語義知識圖譜:應(yīng)用剛剛起步

        相比于科學知識圖譜在專業(yè)科研領(lǐng)域的持續(xù)發(fā)展和創(chuàng)新,語義知識圖譜無論在技術(shù)還是應(yīng)用方面都較少與專業(yè)知識服務(wù)產(chǎn)生聯(lián)系。雖然一些圖情機構(gòu)、出版機構(gòu)和信息技術(shù)公司也曾構(gòu)建過以敘詞表或本體為代表的知識組織體系,但真正用語義知識圖譜的原理和方法做知識服務(wù)的卻很少。比較符合語義知識圖譜在專業(yè)知識服務(wù)中應(yīng)用的案例是Springer Nature于2017年3月推出SciGraph關(guān)聯(lián)開放數(shù)據(jù)平臺,其本質(zhì)是集成了機構(gòu)、研究者、出版物、引用、項目、會議、專利等多種信息的關(guān)聯(lián)數(shù)據(jù)集,以開放的形式滿足科研情報分析的需求。SciGraph將上述信息建立為關(guān)聯(lián)開放數(shù)據(jù)中的實體類型,并建立實體類型之間的關(guān)系模型,同時采用多個三元組的N-Triples形式來表示RDF數(shù)據(jù)集,實現(xiàn)了數(shù)據(jù)關(guān)聯(lián)、互操作、數(shù)據(jù)挖掘等功能。但相較于其他行業(yè)領(lǐng)域的應(yīng)用,SciGraph還只是從概念角度實現(xiàn)了對出版物信息的描述,未深入到知識本身的表示、融合和推理層面。近年來部分國內(nèi)專業(yè)出版社開始嘗試構(gòu)建知識圖譜,大部分處于實體和關(guān)系庫建設(shè)的階段,對于發(fā)展基于知識圖譜的應(yīng)用尚處于探索階段。盡管步伐不像互聯(lián)網(wǎng)公司那樣迅速,但專業(yè)出版社往往選擇更為穩(wěn)扎穩(wěn)打的方式,重視質(zhì)量和專業(yè)性,為下一步專業(yè)領(lǐng)域的應(yīng)用打下良好的基礎(chǔ)。

        三、結(jié)論與展望

        近十幾年來,科學知識圖譜在科研領(lǐng)域得到了廣泛和多維的應(yīng)用,從科學計量學的角度推動了科研的發(fā)展。而真正能夠深入知識本體層面的語義知識圖譜大多是由大型互聯(lián)網(wǎng)公司如谷歌、百度和人工智能創(chuàng)業(yè)公司開發(fā)。隨著自然語言處理、機器學習、大數(shù)據(jù)等技術(shù)的不斷深化,語義知識圖譜必將在科研知識服務(wù)領(lǐng)域大放異彩。從可利用的資源條件上看,國內(nèi)科技出版機構(gòu)發(fā)展基于文獻計量學的科學知識圖譜有很大的難度。但語義知識圖譜不受上述條件的限制,只需要將知識抽取、表示、融合和計算的模型建好,利用人工智能技術(shù)訓練計算機“理解”各類資源中的信息和知識,在此基礎(chǔ)上實現(xiàn)語義搜索、智能關(guān)聯(lián)推薦、隱性知識發(fā)現(xiàn)、邏輯推理等多種形式的應(yīng)用,真正地在知識層面滿足甚至引領(lǐng)用戶的需求。

        參考文獻:

        1.胡澤文,孫建軍,武夷山.國內(nèi)知識圖譜應(yīng)用研究綜述[J]. 圖書情報工作,2013(3):131-137.

        2.馮新翎,何勝,熊太純,等.“科學知識圖譜”與“Google知識圖譜”比較分析——基于知識管理理論視角[J].情報雜志, 2017,36(1):149-153.

        3.陳志云,商月,錢冬明.基于知識圖譜的智能答疑系統(tǒng)研究[J]. 計算機應(yīng)用與軟件,2018, 35(2):178-182.

        4.陳悅,劉則淵.悄然興起的科學知識圖譜[J].科學學研究, 2005,23(2):149-154.

        5.劉則淵,王賢文,陳超美.科學知識圖譜方法及其在科技情報中的應(yīng)用[J].數(shù)字圖書館論壇,2009(10):14-34

        6. 楊思洛,等.中外圖書情報學科知識圖譜比較研究[M].北京:科學出版社,2015.

        7.陳超美.科學前沿圖譜——知識可視化的探索[M].陳悅,等,譯.北京:科學出版社, 2014.

        8.魏瑞斌.國內(nèi)知識圖譜研究的可視化分析[J].圖書情報工作,2011(8).

        9.袁凱琦,鄧揚,陳道源,等.醫(yī)學知識圖譜構(gòu)建技術(shù)與研究進展[J].計算機應(yīng)用研究,2018(7):1929-1936.

        10.王小梅,鄧啟平,李國鵬,等.ESI研究前沿的科學圖譜及在納米領(lǐng)域的應(yīng)用[J].圖書情報工作,2017, 61(12):106-112.

        11.劉嶠,李楊,段宏,等.知識圖譜構(gòu)建技術(shù)綜述[J].計算機研究與發(fā)展,2016,53(3):582-600.

        12.宋宇,真溱,湯珊紅.科學圖譜簡介:過去、現(xiàn)在和未來[J].情報理論與實踐,2015,38(07):145.

        13.孫曉寧,閆勵,張強.科學知識圖譜在學科可視化研究中的應(yīng)用[J].圖書館,2014(5):87-91.

        [作者單位系中國科技出版?zhèn)髅焦煞萦邢薰?。本文?018 年文化產(chǎn)業(yè)發(fā)展專項資金重大項目(XW20180097)階段性成果]

        猜你喜歡
        科學知識圖譜可視化
        基于CiteSpace的足三里穴研究可視化分析
        基于Power BI的油田注水運行動態(tài)分析與可視化展示
        云南化工(2021年8期)2021-12-21 06:37:54
        蝸??囱泪t(yī)
        繪一張成長圖譜
        基于CGAL和OpenGL的海底地形三維可視化
        基于科學知識圖譜的滑雪運動研究可視化分析
        冰雪運動(2019年2期)2019-09-02 01:41:24
        “融評”:黨媒評論的可視化創(chuàng)新
        傳媒評論(2019年4期)2019-07-13 05:49:14
        2000-2017國外關(guān)系從句研究動態(tài)的科學知識圖譜分析
        補腎強身片UPLC指紋圖譜
        中成藥(2017年3期)2017-05-17 06:09:01
        社會化知識及其客觀性探析——兼議朗基諾的科學知識觀
        哲學評論(2017年2期)2017-04-18 01:15:17
        国产自精品在线| 婷婷色婷婷开心五月四房播播| 午夜无码片在线观看影视| 免费网站国产| 久草精品手机视频在线观看| 亚洲国产综合精品中久| 国产av一区网址大全| 亚洲免费女女在线视频网站| 久久婷婷五月综合97色一本一本| 精品人人妻人人澡人人爽牛牛| 99久久精品国产自在首页| 久久国产精品免费一区二区三区| 久久精品丝袜高跟鞋| 老熟妇乱子伦av| 亚洲精品成AV无在线观看| 亚洲综合有码中文字幕| 丰满少妇高潮惨叫久久久| 无码人妻丰满熟妇片毛片| 亚洲一区二区三区久久蜜桃| 亚洲av网一区二区三区成人| 亚洲日韩精品无码av海量| 高中生粉嫩无套第一次| 国产成人一区二区三区高清| 男女视频网站在线观看| av永久天堂一区二区三区| 久久久窝窝午夜精品| 欧美日韩一区二区三区色综合| 国产成人美涵人妖视频在线观看 | 午夜视频在线观看日本| 伊人久久大香线蕉av色婷婷色| 夫妇交换刺激做爰视频| 亚洲人成网站18男男| 天堂蜜桃视频在线观看| 亚洲国产精品久久人人爱| 国产又黄又爽视频| 久久国产精品懂色av| 国精产品一区一区二区三区mba| 国产乱人伦av在线a| 亚洲av中文aⅴ无码av不卡| 中文字幕国产亚洲一区| 欧美性巨大╳╳╳╳╳高跟鞋|