中國(guó)共產(chǎn)黨思想理論資源數(shù)據(jù)庫
——人民金典語義查詢系統(tǒng)(人民出版社)
中國(guó)共產(chǎn)黨思想理論資源數(shù)據(jù)庫,是按照黨中央、胡錦濤總書記關(guān)于在網(wǎng)上建設(shè)具有廣泛影響力的思想文化傳播平臺(tái)的重要指示精神,在新聞出版總署的高度重視和有力推動(dòng)下,于2008年由國(guó)家財(cái)政立項(xiàng)啟動(dòng)建設(shè)的。
“人民金典”語義查詢系統(tǒng)就是為了方便廣大用戶查詢和使用這個(gè)數(shù)據(jù)庫中的內(nèi)容,提供強(qiáng)大的信息檢索功能。
本項(xiàng)目屬于語義檢索技術(shù)領(lǐng)域,主要做法是依托中國(guó)共產(chǎn)黨思想理論專業(yè)領(lǐng)域的專家知識(shí)和經(jīng)驗(yàn),把傳統(tǒng)文獻(xiàn)編目的方法引入計(jì)算機(jī)檢索,模擬人腦的思維模式,構(gòu)建基于語義分析的模型,形成了該領(lǐng)域的知識(shí)庫。目前該知識(shí)庫的主要內(nèi)容資源是馬列著作、領(lǐng)袖著作、中央文件文獻(xiàn)及相關(guān)中國(guó)共產(chǎn)黨思想理論的重要資源。
該系統(tǒng)包括若干檢索子系統(tǒng),目前有:
“人民金典語義查詢”系統(tǒng):能夠按語義對(duì)著作文獻(xiàn)資源,實(shí)現(xiàn)從篇目章節(jié)、段落層次到語句等知識(shí)點(diǎn)的查詢。
“人民金典概念關(guān)聯(lián)”系統(tǒng):可供用戶在研究問題、構(gòu)思文章時(shí),找到一個(gè)概念與其它概念之間的語義關(guān)聯(lián),獲取所需要的語段。
“人民金典自動(dòng)比對(duì)”系統(tǒng):用戶能在網(wǎng)上把所要引用的經(jīng)典論述與電子書進(jìn)行自動(dòng)對(duì)照,迅速發(fā)現(xiàn)引用對(duì)錯(cuò)。
本項(xiàng)目的主要特點(diǎn)有,將傳統(tǒng)文獻(xiàn)編目方法引入計(jì)算機(jī)知識(shí)點(diǎn)編目,提出了一種面向政治理論文獻(xiàn)的知識(shí)點(diǎn)標(biāo)引模型。該模型成功創(chuàng)建了由上位詞與下位詞共同展現(xiàn)知識(shí)點(diǎn)的主題詞目錄、由檢索詞與相關(guān)詞共同展現(xiàn)知識(shí)點(diǎn)的連帶詞目錄,可大幅度提高了語義自動(dòng)識(shí)別準(zhǔn)確率。
該模型的推出和在政治理論文獻(xiàn)中的成功應(yīng)用,可延伸到其他領(lǐng)域文獻(xiàn)的語義建模。
在知識(shí)點(diǎn)標(biāo)引模型的基礎(chǔ)上,創(chuàng)建和實(shí)現(xiàn)了多個(gè)獨(dú)具特色的模擬人腦思維過程的語義檢索模型,有效地解決了關(guān)鍵詞檢索技術(shù)存在的多種不足,可以向用戶提供高質(zhì)量的信息檢索服務(wù)。
“人民金典”語義查詢系統(tǒng)適合應(yīng)用于經(jīng)典文獻(xiàn)的檢索。采用該系統(tǒng)中的“人民金典語義查詢”子系統(tǒng),已實(shí)現(xiàn)了對(duì)中國(guó)特色社會(huì)主義理論體系重要著作(鄧小平、江澤民、胡錦濤同志的著作文章約200萬字)的知識(shí)點(diǎn)編目及精確語義檢索,可檢索知識(shí)點(diǎn)達(dá)到7萬個(gè)。
采用該系統(tǒng)中的“人民金典概念關(guān)聯(lián)”子系統(tǒng),實(shí)現(xiàn)了對(duì)中國(guó)共產(chǎn)黨思想理論主要理論文獻(xiàn)全部在用版本的知識(shí)點(diǎn)編目及語義檢索,可檢索知識(shí)點(diǎn)達(dá)到約200萬個(gè),可檢索文獻(xiàn)數(shù)量達(dá)到70多種、約500多本,約 13萬千字。
未來幾年,計(jì)劃將該系列工具進(jìn)一步拓展到學(xué)術(shù)類、文化類經(jīng)典文獻(xiàn)的知識(shí)點(diǎn)編目及檢索。目前,正在以此為重要技術(shù)基礎(chǔ),籌劃建設(shè)“中華經(jīng)典文獻(xiàn)數(shù)字化開發(fā)傳播工程”。
“人民金典”語義查詢系統(tǒng)首先在“中國(guó)共產(chǎn)黨思想理論資源數(shù)據(jù)庫與傳播工程” 中得到成功應(yīng)用,于2009年5月上線試運(yùn)行,2010年6月正式上線運(yùn)行。其中的“人民金典語義查詢”系統(tǒng)于2009年出版發(fā)行光盤發(fā)行3000張。該系列工具,成為整個(gè)理論數(shù)據(jù)庫工程的鮮明亮點(diǎn)和特色。李長(zhǎng)春、劉云山同志的視察觀看網(wǎng)站演示并作重要指示,新聞出版總署柳斌杰署長(zhǎng)親自為理論數(shù)據(jù)庫主持舉辦上線儀式并作了重要講話,全國(guó)新聞媒體60多次對(duì)理論數(shù)據(jù)庫作了報(bào)道,在上述領(lǐng)導(dǎo)講話和媒體報(bào)道中,大多數(shù)突出贊揚(yáng)和肯定了該系列工具的知識(shí)點(diǎn)查詢作用。
一些單位原來摘編一份學(xué)習(xí)資料需要個(gè)把月,現(xiàn)在從人民出版社網(wǎng)站上一搜,稍加整理,用半天時(shí)間就解決。許多學(xué)者寫文章查資料、搞校對(duì),找到我們網(wǎng)站之后,不再跑資料室、圖書館。如,北京軍區(qū)空軍去年下半年在按中央部署組織進(jìn)行關(guān)于政治體制改革的學(xué)習(xí)教育時(shí),利用“人民金典語義查詢”系統(tǒng)搜索編印了一份《鄧小平、江澤民、胡錦濤關(guān)于政治體制改革的論述摘編》下發(fā)領(lǐng)導(dǎo)干部使用。