安 源,翟夏普,龍藝璇
(1.中國(guó)鐵道科學(xué)研究院集團(tuán)有限公司 科學(xué)技術(shù)信息研究所,北京 100081;2.中國(guó)國(guó)家鐵路集團(tuán)有限公司 科技成果知識(shí)產(chǎn)權(quán)管理辦公室,北京 100081)
鐵路行業(yè)快速發(fā)展過程中,鐵路科技創(chuàng)新發(fā)揮了關(guān)鍵作用[1],而高效、安全、智能的科研管理信息系統(tǒng)一直是我國(guó)鐵路行業(yè)科技創(chuàng)新發(fā)展的堅(jiān)實(shí)保障。2006年,原鐵道部編制并下發(fā)《鐵路科技管理信息化專項(xiàng)規(guī)劃》(科技運(yùn)〔2006〕71號(hào)),在此指導(dǎo)下首次開展初代鐵路科研管理信息系統(tǒng)開發(fā)工作。2008年,該系統(tǒng)完成技術(shù)驗(yàn)收(科技綜〔2009〕75號(hào)),并在鐵路推廣試用[2]。如今,在大數(shù)據(jù)智能浪潮的強(qiáng)力沖擊之下,跨學(xué)科合作密集、學(xué)科交叉明顯、科研數(shù)據(jù)量與日俱增,數(shù)據(jù)關(guān)聯(lián)關(guān)系日漸復(fù)雜[3-4]。此外,伴隨著科研環(huán)境的變化,用戶需求開始向個(gè)性化、定制化、精準(zhǔn)化、扁平化、快速響應(yīng)化邁進(jìn)[5]。
現(xiàn)階段已有不少學(xué)者針對(duì)大數(shù)據(jù)環(huán)境下的科研管理服務(wù)進(jìn)行了研究。楊曉剛等人[6]從社會(huì)媒體環(huán)境出發(fā),針對(duì)科研人員知識(shí)共享開展了相關(guān)平臺(tái)研究;韓麗華等人[7]分析了大數(shù)據(jù)環(huán)境下信息資源管理模式的轉(zhuǎn)變;解海燕[8]針對(duì)大數(shù)據(jù)背景下科研環(huán)境的變化,提出了精準(zhǔn)科研信息服務(wù)體系。但現(xiàn)有研究多以理論研究為主,從宏觀角度為科研管理服務(wù)發(fā)展指明方向,鮮有從平臺(tái)構(gòu)建或系統(tǒng)設(shè)計(jì)角度出發(fā),探索如何落地科研管理智能服務(wù)模式。
本文在初代鐵路科研管理信息系統(tǒng)的基礎(chǔ)上,經(jīng)由中國(guó)國(guó)家鐵路集團(tuán)有限公司(簡(jiǎn)稱:國(guó)鐵集團(tuán))統(tǒng)一部署,結(jié)合當(dāng)前鐵路行業(yè)科研管理服務(wù)面臨的挑戰(zhàn),開發(fā)了以科研項(xiàng)目管理為基礎(chǔ),集立項(xiàng)管理、合同管理、執(zhí)行管理、變更管理、結(jié)題管理于一體,并具備科技專家管理、知識(shí)產(chǎn)權(quán)管理、科技資源數(shù)字化加工、科技成果共享及科技門戶等功能的科研管理智能服務(wù)平臺(tái),2021年通過技術(shù)評(píng)審(信技網(wǎng)技函〔2021〕29號(hào)),并在鐵路推廣使用。實(shí)踐證明,該平臺(tái)為鐵路科技創(chuàng)新提供了更廣闊的空間。
科研管理智能服務(wù)平臺(tái)集云平臺(tái)、數(shù)據(jù)匯集層、信息關(guān)聯(lián)層、信息分析層、知識(shí)組織層以及創(chuàng)新服務(wù)層為一體,總體架構(gòu)如圖1所示。
圖1 科研管理智能服務(wù)平臺(tái)總體架構(gòu)
為實(shí)現(xiàn)海量科研信息資源的高效處理與分析,以開源架構(gòu)為基礎(chǔ),以云平臺(tái)作為支撐,優(yōu)先國(guó)產(chǎn)化替代,采用國(guó)產(chǎn)化組件,利用Nginx、Tomcat等中間件,設(shè)計(jì)前后端分離架構(gòu)和內(nèi)外穿網(wǎng)部署,通過場(chǎng)景化、差異化流程模版配置,提供科研管理云服務(wù)。其中,后端數(shù)據(jù)庫(kù)部署在中國(guó)鐵路主數(shù)據(jù)中心內(nèi)部服務(wù)網(wǎng);前端資源在鐵路內(nèi)部服務(wù)網(wǎng)和外部服務(wù)網(wǎng)各部署一套。在充分保障安全的同時(shí),解決內(nèi)外網(wǎng)使用割裂的問題,提高數(shù)據(jù)資源計(jì)算效率,保障鐵路行業(yè)科研管理智能服務(wù)平臺(tái)的數(shù)據(jù)安全和運(yùn)行流暢。
數(shù)據(jù)匯集層包含科研全創(chuàng)新要素信息和鐵路領(lǐng)域語料庫(kù)2部分。
1.2.1 科研全創(chuàng)新要素信息
科研全創(chuàng)新要素信息主要分為以下3類。
(1)科研項(xiàng)目和成果數(shù)據(jù):根據(jù)國(guó)鐵集團(tuán)科研管理相關(guān)辦法,依托科研管理信息系統(tǒng),高效匯集鐵路內(nèi)部數(shù)據(jù),包括國(guó)鐵集團(tuán)、中國(guó)鐵道科學(xué)研究院集團(tuán)有限公司、18 個(gè)鐵路局集團(tuán)公司的立項(xiàng)、合同、結(jié)題、評(píng)審、獎(jiǎng)勵(lì)、科研成果等涉及科研管理全流程的數(shù)據(jù),保障數(shù)據(jù)的權(quán)威性,同時(shí)引進(jìn)專利、標(biāo)準(zhǔn)、期刊、會(huì)議等外部數(shù)據(jù),保障數(shù)據(jù)全面性。
(2)創(chuàng)新人才和機(jī)構(gòu)數(shù)據(jù):包括科研人員、企業(yè)人員、領(lǐng)域?qū)<业热藛T類型及研究機(jī)構(gòu)、企業(yè)公司、第三方等機(jī)構(gòu)類型數(shù)據(jù)。
(3)產(chǎn)業(yè)市場(chǎng)數(shù)據(jù):包括鐵路產(chǎn)業(yè)鏈上各企業(yè)的產(chǎn)品數(shù)據(jù)。
通過“科研信息+創(chuàng)新主體+行業(yè)市場(chǎng)”的數(shù)據(jù)關(guān)聯(lián),打通科研項(xiàng)目到行業(yè)市場(chǎng)的通道,從源頭提高科技資源利用效率,解決科技成果轉(zhuǎn)化問題。
1.2.2 鐵路領(lǐng)域語料庫(kù)
鐵路領(lǐng)域語料庫(kù)涉及鐵路行業(yè)的理論基礎(chǔ)、科學(xué)研究方法、相關(guān)政策、新聞動(dòng)態(tài)等多維度完備的領(lǐng)域信息,是機(jī)器理解領(lǐng)域知識(shí)的基礎(chǔ),可為科研信息分析提供先驗(yàn)知識(shí),有利于提高信息分析的智能性和準(zhǔn)確性。
信息關(guān)聯(lián)層以科研項(xiàng)目為核心,對(duì)鐵路科研全創(chuàng)新要素?cái)?shù)據(jù)進(jìn)行系統(tǒng)表達(dá)和建模,其架構(gòu)如圖2所示。
圖2 信息關(guān)聯(lián)層架構(gòu)
該層負(fù)責(zé)描述科研項(xiàng)目全生命周期中存在的實(shí)體及實(shí)體間的關(guān)系。其中,科研項(xiàng)目中的實(shí)體包括課題基本信息、參與人員、參與機(jī)構(gòu)、資助機(jī)構(gòu)及研究成果;實(shí)體之間的關(guān)系包括人員與項(xiàng)目之間的負(fù)責(zé)/參研關(guān)系、機(jī)構(gòu)與項(xiàng)目之間的主持/參與關(guān)系、資助機(jī)構(gòu)與項(xiàng)目之間的資助關(guān)系、項(xiàng)目與成果之間的產(chǎn)出關(guān)系等。
平臺(tái)通過信息關(guān)聯(lián)層理清數(shù)據(jù)之間的邏輯關(guān)系,關(guān)聯(lián)科技大數(shù)據(jù)的知識(shí)、技術(shù)、人才、資本全創(chuàng)新要素,打通國(guó)鐵集團(tuán)及其所屬單位各類科研數(shù)據(jù)之間的壁壘,從而實(shí)現(xiàn)鐵路行業(yè)科研數(shù)據(jù)一張網(wǎng)的目標(biāo)。
信息分析層是整個(gè)平臺(tái)的核心技術(shù)支撐。在數(shù)據(jù)匯集層及信息關(guān)聯(lián)層的基礎(chǔ)上,通過數(shù)據(jù)融合、關(guān)聯(lián)分析、機(jī)器學(xué)習(xí)、自然語言處理等信息技術(shù),開展科研實(shí)體識(shí)別、關(guān)系抽取與知識(shí)表示學(xué)習(xí),為知識(shí)組織層模型庫(kù)、本體庫(kù)與規(guī)則庫(kù)奠定基礎(chǔ),完成領(lǐng)域知識(shí)圖譜的繪制,并基于知識(shí)圖譜與知識(shí)推理技術(shù),實(shí)現(xiàn)科研信息的智能服務(wù)。
傳統(tǒng)的科研信息組織只包含“用代屬分參”關(guān)系,難以揭示科研信息中復(fù)雜的語義信息。因此,本文使用算法模型及知識(shí)圖譜的方法組織信息。
(1)模型庫(kù)中的算法模型主要采用數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等方式自動(dòng)生成,存儲(chǔ)成計(jì)算機(jī)可理解的、以數(shù)字符號(hào)形式呈現(xiàn)的知識(shí),用于計(jì)算機(jī)對(duì)未知信息的預(yù)測(cè)分析。
(2)采用自然語言處理技術(shù)、知識(shí)表示學(xué)習(xí)等結(jié)合人工配合的方式生成的知識(shí)圖譜,以本體庫(kù)與規(guī)則庫(kù)為基礎(chǔ),包含了科研信息語義分析、科研知識(shí)可視化以及科研知識(shí)推理等功能,用于存儲(chǔ)人類可理解的、以文字、圖形或符號(hào)形式呈現(xiàn)的知識(shí)。
創(chuàng)新服務(wù)層指依據(jù)實(shí)際科研需求,智能感知用戶偏好,敏捷應(yīng)對(duì)外部需求變化,為用戶提供個(gè)性化、定制化、專業(yè)化的科技情報(bào)服務(wù)。
(1)個(gè)性化科研知識(shí)推送:主動(dòng)抓取用戶需求,為科研人員推送課題內(nèi)容相關(guān)的最新科研成果。
(2)智能檢索式構(gòu)建:通過語義計(jì)算提供滿足科研用戶全方位科研需求的檢索結(jié)果。
(3)顛覆性技術(shù)分析:提供科學(xué)研究主題的關(guān)鍵技術(shù)知識(shí)圖譜,揭示關(guān)鍵技術(shù)突破可能帶來的顛覆性技術(shù)創(chuàng)新機(jī)會(huì)。
(4)全要素知識(shí)圖譜:提供人才—科學(xué)—技術(shù)—成果四維一體的全創(chuàng)新要素關(guān)聯(lián)知識(shí)圖譜,滿足成果轉(zhuǎn)移轉(zhuǎn)化過程中產(chǎn)學(xué)研創(chuàng)新主體及風(fēng)險(xiǎn)投資機(jī)構(gòu)個(gè)性化的技術(shù)、人才和機(jī)構(gòu)的信息需求。
(5)潛在合作推薦:提供研發(fā)合作網(wǎng)絡(luò)知識(shí)圖譜,揭示研發(fā)合作網(wǎng)絡(luò)的機(jī)構(gòu)、熱點(diǎn)領(lǐng)域和核心團(tuán)隊(duì)分布。
(6)產(chǎn)業(yè)發(fā)展態(tài)勢(shì)追蹤:提供面向重大產(chǎn)品全創(chuàng)新鏈的“科學(xué)—技術(shù)—產(chǎn)業(yè)”成長(zhǎng)知識(shí)圖譜,協(xié)助科研用戶及時(shí)了解產(chǎn)業(yè)發(fā)展態(tài)勢(shì)和學(xué)術(shù)研究發(fā)展動(dòng)態(tài),為鐵路行業(yè)重大新產(chǎn)品研發(fā)、科技成果技術(shù)成熟度評(píng)價(jià)、科技成果信息的知識(shí)管理與運(yùn)用提供決策支持。
平臺(tái)通過創(chuàng)新服務(wù),初步實(shí)現(xiàn)了智能化科研、網(wǎng)絡(luò)化協(xié)同、場(chǎng)景化配置、服務(wù)化延伸及數(shù)字化管理,促進(jìn)了鐵路行業(yè)科研管理向更加柔性化轉(zhuǎn)變。
科研管理智能服務(wù)平臺(tái)為所有用戶提供統(tǒng)一的登陸門戶與身份認(rèn)證平臺(tái),其功能如下。
在科研管理活動(dòng)中,科研管理智能服務(wù)平臺(tái)可提供從科研項(xiàng)目立項(xiàng)、執(zhí)行、結(jié)題到成果產(chǎn)業(yè)化全流程中每一環(huán)節(jié)的定制化、配置化專屬流程服務(wù)。
科研管理智能服務(wù)平臺(tái)提供豐富的面向課題研究的服務(wù)。
(1)課題立項(xiàng)階段:為科研人員提供國(guó)家重大專項(xiàng)、重大計(jì)劃、科學(xué)技術(shù)部項(xiàng)目等基金項(xiàng)目信息,并基于科研人員的研究方向制定個(gè)性化的基金項(xiàng)目推送。
(2)課題執(zhí)行階段:為科研人員提供課題研究?jī)?nèi)容相關(guān)的信息推送,及時(shí)跟進(jìn)研究最新動(dòng)態(tài),推進(jìn)科研項(xiàng)目研究進(jìn)展。
(3)課題結(jié)題階段:依據(jù)合同要求評(píng)價(jià)課題完成情況,使用語義查重系統(tǒng)鑒定課題成果的原創(chuàng)性。
(4)課題成果產(chǎn)業(yè)化階段:利用平臺(tái)為企業(yè)需求與科研成果對(duì)接提供機(jī)會(huì),加速科研成果的轉(zhuǎn)移轉(zhuǎn)化,推動(dòng)鐵路行業(yè)高質(zhì)量發(fā)展。
科研管理智能服務(wù)平臺(tái)可根據(jù)科研用戶實(shí)際需求,提供智能檢索、研究趨勢(shì)預(yù)測(cè)及知識(shí)圖譜展示等功能。
(1)在智能檢索模塊,基于知識(shí)圖譜對(duì)用戶檢索式進(jìn)行語義擴(kuò)展,提高檢索查全率。
(2)在研究趨勢(shì)預(yù)測(cè)模塊,基于權(quán)威專家判斷結(jié)論、文獻(xiàn)和專利計(jì)量的統(tǒng)計(jì)與聚類分析結(jié)果、權(quán)威機(jī)構(gòu)發(fā)布的研究報(bào)告、科學(xué)技術(shù)獎(jiǎng)勵(lì)等統(tǒng)計(jì)數(shù)據(jù)及多維度分析指標(biāo),分析研究前沿與研究熱點(diǎn),發(fā)現(xiàn)潛在的突破性或顛覆性技術(shù)。
(3)在知識(shí)圖譜可視化模塊,基于國(guó)家重大科技專項(xiàng)和重點(diǎn)研發(fā)計(jì)劃項(xiàng)目成果信息及相關(guān)產(chǎn)業(yè)創(chuàng)新發(fā)展信息,實(shí)現(xiàn)關(guān)鍵技術(shù)突破、研發(fā)合作網(wǎng)絡(luò)、全創(chuàng)新要素關(guān)聯(lián)及面向重大產(chǎn)品全創(chuàng)新鏈等多種類型的知識(shí)圖譜展示。
科研管理智能服務(wù)平臺(tái)已在國(guó)鐵集團(tuán)、中國(guó)鐵道科學(xué)研究院集團(tuán)有限公司、蘭州局集團(tuán)公司、太原局集團(tuán)公司、廣州局集團(tuán)公司等單位成功應(yīng)用,社會(huì)效益顯著。
該平臺(tái)匯集了國(guó)鐵集團(tuán)及各所屬單位的科研項(xiàng)目立項(xiàng)、合同、結(jié)題、技術(shù)評(píng)審、獎(jiǎng)勵(lì)等科研全過程數(shù)據(jù),鐵路企業(yè)主要產(chǎn)品等產(chǎn)業(yè)鏈數(shù)據(jù),鐵路行業(yè)全領(lǐng)域的論文、專利等公開數(shù)據(jù),數(shù)據(jù)條數(shù)達(dá)千萬級(jí)別,最早可追溯至1957年。通過開發(fā)自動(dòng)化數(shù)據(jù)加工平臺(tái),基于鐵路技術(shù)詞表和產(chǎn)業(yè)詞表對(duì)科研數(shù)據(jù)進(jìn)行標(biāo)引,構(gòu)建機(jī)車車輛、牽引供電、通信信號(hào)等行業(yè)細(xì)粒度專題庫(kù)。利用數(shù)據(jù)挖掘、自然語言處理等信息技術(shù),對(duì)各類資源進(jìn)行關(guān)聯(lián)分析,嘗試實(shí)現(xiàn)創(chuàng)新鏈、技術(shù)鏈、知識(shí)鏈、產(chǎn)業(yè)鏈之間的互聯(lián)互通,改善了鐵路各單位系統(tǒng)分散、技術(shù)標(biāo)準(zhǔn)不統(tǒng)一的現(xiàn)狀,形成了鐵路行業(yè)科研資源知識(shí)服務(wù)生態(tài)體系,如圖3所示。該平臺(tái)的應(yīng)用為鐵路行業(yè)工作人員提供了智能、精準(zhǔn)、及時(shí)的個(gè)性化定制科研信息服務(wù),為實(shí)現(xiàn)科研決策提供支撐。
圖3 鐵路行業(yè)科研資源知識(shí)服務(wù)生態(tài)體系
本文結(jié)合鐵路行業(yè)科研管理現(xiàn)狀,構(gòu)建了集云平臺(tái)、數(shù)據(jù)匯集層、信息關(guān)聯(lián)層、信息分析層、知識(shí)組織層及創(chuàng)新服務(wù)層于一體的鐵路行業(yè)科研管理智能服務(wù)平臺(tái),并面向鐵路行業(yè)開展了應(yīng)用實(shí)踐。該平臺(tái)將面向科研成果的被動(dòng)知識(shí)服務(wù)升級(jí)為面向科研用戶需求的主動(dòng)知識(shí)服務(wù),以科研為主線,貫穿科研項(xiàng)目管理、科技成果管理、科研項(xiàng)目后評(píng)估等活動(dòng),為不同等級(jí)、不同角色的科研管理人員設(shè)定不同權(quán)限,實(shí)現(xiàn)科研全流程數(shù)字化管理,極大地提高了科研管理工作效率。
未來,將繼續(xù)圍繞鐵路科技創(chuàng)新生態(tài)體系,進(jìn)一步從科研管理信息服務(wù)的精準(zhǔn)度、及時(shí)度、專業(yè)度、智能化及個(gè)性化等角度升級(jí)完善平臺(tái)的數(shù)據(jù)與服務(wù);進(jìn)一步集成科技專家、知識(shí)產(chǎn)權(quán)、科技評(píng)價(jià)、科技獎(jiǎng)勵(lì)、技術(shù)標(biāo)準(zhǔn)、質(zhì)量抽查、產(chǎn)品認(rèn)證等業(yè)務(wù)子系統(tǒng),對(duì)其整合并實(shí)行分級(jí)分類授權(quán),以提高科技資源使用率,為鐵路科研成果的高效管理與科技成果的轉(zhuǎn)移轉(zhuǎn)化提供有力支持。