張 穎,溫 靜
(山西省信息產(chǎn)業(yè)技術(shù)研究院有限公司,山西 太原 030012)
科技計劃(專項、基金等)是政府在科技創(chuàng)新領(lǐng)域發(fā)揮引領(lǐng)和指導(dǎo)作用的重要載體,同時體現(xiàn)國家在自主創(chuàng)新道路上的政策取向、戰(zhàn)略布局、發(fā)展重點以及科技創(chuàng)新規(guī)律特點。隨著科技計劃的推進,我國已取得了一大批具有知識產(chǎn)權(quán)的科技成果,培養(yǎng)了一大批具有先進水平的創(chuàng)新團隊和科研人才,解決了一系列制約經(jīng)濟、社會和科學(xué)技術(shù)發(fā)展的“卡脖子”問題,充分調(diào)動了科技工作者的學(xué)術(shù)與創(chuàng)新的積極性,全面提升了科技自主創(chuàng)新能力與科研實力,為我國改革與發(fā)展的進程持續(xù)地提供了強有力的支撐。
隨著國家科技基礎(chǔ)條件平臺建設(shè)綱要和實施意見精神的發(fā)布,為了遵循“整合、共享、創(chuàng)新、發(fā)展”的建設(shè)方針,積極貫徹我國科技計劃管理改革要求,面向經(jīng)濟社會創(chuàng)新發(fā)展需求,要求有效地整合和優(yōu)化配置科技資源,改變以往各產(chǎn)業(yè)處室工作小循環(huán),實現(xiàn)總體業(yè)務(wù)協(xié)同推進大循環(huán),以各計劃項目全面運行的形式進行科學(xué)計劃研究活動的全過程管理。
一般來說,科技計劃項目的管理過程與內(nèi)容主要包括:科技項目的申報管理、立項管理、過程管理和結(jié)項管理,以及每個項目所涉及的申報工作單位、申報組織單位、申報人員、申報資金、審批資金、申報文檔材料、科技成果及各產(chǎn)業(yè)處室等內(nèi)容的管理。
用智能科技帶動科技計劃管理水平的高低,提升社會經(jīng)濟發(fā)展,是當(dāng)前實施科技計劃管理的主要目標(biāo)。但隨著時間的推移和科技的進步,在科技計劃管理的推進過程中漸漸凸顯出一些問題,如:頂層設(shè)計不科學(xué)、項目管理過程條塊分割、科技資源統(tǒng)籌不當(dāng)、各處室部門分工不精細(xì)、科技知識關(guān)聯(lián)度差、資源利用度不高等。
解決這些問題將會更加符合科技創(chuàng)新規(guī)律、更加高效配置科技資源、更加強化科技與經(jīng)濟緊密結(jié)合、最大限度激發(fā)科研人員創(chuàng)新熱情;充分發(fā)揮科技管理在提高社會生產(chǎn)力中的作用等方面提供信息化支撐。
科技計劃項目管理的建設(shè),可以對各申報主體的項目執(zhí)行、經(jīng)費開支、創(chuàng)新能力、成果轉(zhuǎn)化、產(chǎn)權(quán)保護等各項內(nèi)容進行融合,既能從一點看整體,又能從整體看落地。促進信息公開,提高科技計劃管理服務(wù)水平,有效的支撐企事業(yè)單位、科研院所、高等院校的科研創(chuàng)新,輔助產(chǎn)業(yè)處室、管理層用戶的審核及決策。圍繞影響科技主體的各項關(guān)鍵要素,實現(xiàn)科技部門的數(shù)據(jù)分析、輔助決策、信息共享和業(yè)務(wù)協(xié)同,有效提高各項科技工作開展的效率和應(yīng)對能力,提升宏觀政策指南決策能力。
1)面向科技計劃管理的知識圖譜研究,可以從需求凝練—科研立項—評價監(jiān)督等完整閉環(huán)的運行機制上全面支撐科技計劃推進過程中的各個環(huán)節(jié),為科技工作者、單位管理者、產(chǎn)業(yè)處室管理者、政府決策部門等不同類型用戶提供具有針對性的科技項目管理、科技知識服務(wù),如:科技領(lǐng)域知識問答、科技項目申報服務(wù)、科技項目審核推薦等。
2)面向科技計劃管理的智能檢索研究,利用已構(gòu)建的知識圖譜模型,可以方便不同類別用戶在科技計劃項目實施與管理的整個過程中,快速準(zhǔn)確地查找出對應(yīng)的項目信息,提高用戶管理工作效率。
面向科技計劃管理的知識圖譜構(gòu)建與智能檢索研究為科技工作者、政府決策部門等不同類型用戶提供具有針對性的科技項目管理、科技知識和科技智庫服務(wù),實現(xiàn)智能化查詢、管理、問答等功能,充分調(diào)動科技工作者的學(xué)術(shù)與創(chuàng)新的積極性,全面提升科技自主創(chuàng)新能力與科研實力,為我國改革與發(fā)展的進程持續(xù)地提供強有力的支撐,加快轉(zhuǎn)型跨越發(fā)展中的重要作用。因此,本研究對提高科技計劃管理水平有著重大意義。
知識圖譜(Knowledge Graph,KG)概念由Google公司提出,在自然語言處理(Natural Language Processing,NLP)的視角下,知識圖譜就是從文本中抽取語義和結(jié)構(gòu)化的數(shù)據(jù)。知識圖譜的組成三要素包括:實體(Entity)、關(guān)系(Relation)和屬性(Attribute)。實體是知識圖譜中最基本的元素,可以是具體的人、事、物,也可以是抽象的概念或聯(lián)系。關(guān)系用來表示不同實體間的某種聯(lián)系。同時,實體和關(guān)系還都可以有各自的屬性。從圖的方式看,知識圖譜中的結(jié)點代表實體,邊代表實體間的語義關(guān)系,基本組成單位是“實體-關(guān)系-實體”的三元組形式。如今的社會已經(jīng)從信息時代進入到知識時代。在信息過載的大背景之下,搜索引擎的使命已然從連接信息轉(zhuǎn)變?yōu)檫B接人與服務(wù),檢索系統(tǒng)需要以用戶為中心準(zhǔn)確地回答問題。知識圖譜成為新一代智能檢索系統(tǒng)的基石。利用知識圖譜技術(shù),可以快速幫助用戶建立對搜索對象的概念信息,同時發(fā)現(xiàn)相關(guān)聯(lián)的其他實體的知識,進一步建立知識網(wǎng)絡(luò),變被動檢索為主動向用戶提供知識,提升用戶友好程度。
檢索的目的是在信息量龐大的時代中,用戶可以便捷、準(zhǔn)確地找到自己需要的某一事物。目前,傳統(tǒng)的檢索習(xí)慣和搜索行為仍然是以關(guān)鍵詞字符串的形式進行查找的,該方式通常難以被計算機理解,所以在搜索結(jié)果準(zhǔn)確度方面存在一定的缺陷,而在檢索系統(tǒng)中引入知識圖譜技術(shù),可以徹底改變現(xiàn)有的信息檢索模式,形成以用戶為核心的智能化信息檢索技術(shù)。
通過形式化的查詢語言,在存儲好的知識圖譜三元組關(guān)系數(shù)據(jù)庫中為用戶提供查詢數(shù)據(jù)的接口,其結(jié)構(gòu)化語義內(nèi)容可以使任何一個檢索請求都能得到一個網(wǎng)狀知識結(jié)點,而不再只是線性的網(wǎng)址列表。
基于知識圖譜的檢索系統(tǒng)能夠精準(zhǔn)地將答案抓取給用戶,而不是像普通檢索系統(tǒng)一樣返回一堆只是相似的結(jié)果供用戶篩選。除此之外,該智能檢索模式還可根據(jù)實體之間的關(guān)系進行一定的語義推理,預(yù)測用戶下一步可能需要查找的內(nèi)容,降低用戶輸入和選擇的成本,提高用戶使用時的便捷程度,提升檢索結(jié)果的精確度。
面向科技計劃管理的知識圖譜構(gòu)建與智能檢索研究的邏輯結(jié)構(gòu)和技術(shù)架構(gòu)如圖1所示,主要研究內(nèi)容包括知識圖譜表示和生成、Query分析和語義表示、語義匹配。
圖1 邏輯架構(gòu)圖
針對目前科技計劃管理過程中存在的科技計劃數(shù)據(jù)關(guān)聯(lián)度較差、資源利用程度較低等問題,構(gòu)建面向科技計劃管理的知識圖譜關(guān)系數(shù)據(jù)庫,開展語義關(guān)聯(lián)的科技計劃管理研究。
科技計劃管理方面的知識圖譜研究還相對處于起步階段,本文基于實體抽取、關(guān)系抽取等技術(shù)構(gòu)建知識圖譜三元組,主要將科技計劃使用用戶分為申報用戶、工作單位用戶、組織單位用戶和產(chǎn)業(yè)處室用戶。圍繞四種用戶的需求,抽取四種實體(用戶)及其要素的對應(yīng)關(guān)系,并在此基礎(chǔ)上形成相應(yīng)的知識圖譜,為科技計劃管理智能檢索服務(wù)提供語義框架支持。
主要實體如表1至表4。
表1 申報用戶實體屬性表
表2 工作單位實體屬性表
表3 組織單位實體屬性表
表4 產(chǎn)業(yè)處室實體屬性表
知識圖譜技術(shù)可以應(yīng)用到很多領(lǐng)域中,如知識管理、知識發(fā)現(xiàn)、知識推理、智能檢索、智能問答和具體的垂直行業(yè)應(yīng)用等。面向科技計劃管理的智能檢索系統(tǒng)可以實現(xiàn)特定數(shù)據(jù)的檢索功能,方便科技工作人員隨時查詢科技數(shù)據(jù)。基于知識圖譜的智能檢索平臺為各類用戶、各產(chǎn)業(yè)處室提供綜合性的查詢服務(wù),解決用戶對信息的需求,加強產(chǎn)業(yè)處室間以及對企業(yè)、個人等外部信息交互,解決信息孤島問題,做到“隨用隨查、隨查隨用”。
通過數(shù)據(jù)解析層、智能識別層、語義關(guān)聯(lián)層以及智能管理層的支撐,用戶可以在平臺上根據(jù)關(guān)鍵字從關(guān)系數(shù)據(jù)庫中搜索出對應(yīng)的實體或關(guān)系,并且他們的下一級三元組也能被一起搜檢出來。
基于知識圖譜的智能檢索推動科技計劃管理的科技知識問答、科技智庫搜索、科技項目管理以及智能審核與個性化推送,解決目前科技計劃管理中存在的科技知識關(guān)聯(lián)度差、資源利用度不高等問題,為科技計劃智能管理提供新的思路。
科技計劃管理數(shù)據(jù)作為國家科技進步的重要基礎(chǔ)性資源,其管理模式影響著我國科技進步與創(chuàng)新發(fā)展。本研究面向科技計劃管理領(lǐng)域,通過對知識圖譜的構(gòu)建來完成智能化信息檢索,為各類用戶、各產(chǎn)業(yè)處室提供具有針對性的科技項目查詢、科技知識問答和科技智庫服務(wù),提高科技計劃管理水平,是科技計劃智慧化管理的有益嘗試。
在未來的工作中,本研究將繼續(xù)擴充領(lǐng)域性知識圖譜,并采用人工智能技術(shù)進一步完善系統(tǒng)檢索能力,為科技計劃的智能管理技術(shù)提供更好的底層支撐。