亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        知識(shí)圖譜技術(shù)在網(wǎng)絡(luò)資源保存項(xiàng)目中的應(yīng)用

        2024-06-03 00:00:00張學(xué)青
        圖書館學(xué)刊 2024年2期

        [摘 要]介紹知識(shí)圖譜建設(shè)流程、目前網(wǎng)絡(luò)資源保存項(xiàng)目現(xiàn)狀及在資源建設(shè)方面存在的問(wèn)題。提出基于網(wǎng)絡(luò)保存項(xiàng)目所采集的網(wǎng)絡(luò)資源建設(shè)知識(shí)圖譜的構(gòu)想,理清以結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)為切入點(diǎn)分步建設(shè)知識(shí)圖譜的思路,并對(duì)建設(shè)中存在的難點(diǎn)及后續(xù)應(yīng)用方向進(jìn)行闡述。

        [關(guān)鍵詞]網(wǎng)絡(luò)資源保存 知識(shí)圖譜 知識(shí)可視化 智慧服務(wù)

        [分類號(hào)]G250.73

        1 引言

        為了提高谷歌搜索引擎的搜索能力,幫助用戶得到更精確的搜索結(jié)果,谷歌公司于2012年提出了知識(shí)圖譜的概念[1]。經(jīng)過(guò)十多年的發(fā)展,知識(shí)圖譜已經(jīng)在智能搜索、問(wèn)答系統(tǒng)、個(gè)性推薦等多個(gè)方向得到了廣泛的應(yīng)用,在智能搜索領(lǐng)域的應(yīng)用效果最為顯著,極大地提升了搜索引擎“理解”用戶意圖的能力。知識(shí)圖譜本質(zhì)上是語(yǔ)義網(wǎng)絡(luò),表示現(xiàn)實(shí)世界中存在的實(shí)體、概念及其相互關(guān)系,是一種基于圖的數(shù)據(jù)結(jié)構(gòu)。知識(shí)圖譜的出現(xiàn)改變了傳統(tǒng)的知識(shí)獲取模式,將知識(shí)工程“自上而下”的方式轉(zhuǎn)變?yōu)橥诰驍?shù)據(jù)、抽取知識(shí)的“自下而上”方式[2]。知識(shí)圖譜用機(jī)器更容易理解的方式表示數(shù)據(jù),其主要由節(jié)點(diǎn)和邊組成,節(jié)點(diǎn)代表實(shí)體和屬性,邊代表實(shí)體之間的關(guān)系。知識(shí)圖譜通過(guò)這種互相聯(lián)結(jié)的方式,把網(wǎng)絡(luò)上的數(shù)據(jù)轉(zhuǎn)變成計(jì)算機(jī)易于理解分析的知識(shí),最終形成基于語(yǔ)義的知識(shí)庫(kù)。

        知識(shí)圖譜的構(gòu)建一般來(lái)說(shuō)要經(jīng)過(guò)知識(shí)抽取、知識(shí)融合、知識(shí)加工3個(gè)階段,整個(gè)流程需要多種技術(shù)的支持。首先,從原始的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中抽取實(shí)體、屬性、關(guān)系等可用知識(shí)單元;其次,對(duì)抽取到的知識(shí)單元進(jìn)行實(shí)體對(duì)齊與消歧,完成知識(shí)融合;最后,在前兩步的基礎(chǔ)上展開(kāi)知識(shí)加工,對(duì)基本的事實(shí)進(jìn)行處理,形成結(jié)構(gòu)化的知識(shí)體系和高質(zhì)量的知識(shí)集合,實(shí)現(xiàn)對(duì)知識(shí)的統(tǒng)一管理。

        根據(jù)覆蓋范圍,知識(shí)圖譜可以分為開(kāi)放通用知識(shí)圖譜和垂直行業(yè)知識(shí)圖譜兩種[3]。前者注重廣度,強(qiáng)調(diào)融合更多的實(shí)體,相較后者而言準(zhǔn)確度不夠高,并且受概念范圍的影響,很難借助本體庫(kù)對(duì)公理、規(guī)則以及約束條件的支持能力規(guī)范其實(shí)體、屬性、實(shí)體之間的關(guān)系,主要應(yīng)用于智能搜索等領(lǐng)域。而垂直行業(yè)知識(shí)圖譜要依靠特定行業(yè)的數(shù)據(jù)來(lái)構(gòu)建,具有特定的行業(yè)意義。

        2 知識(shí)圖譜研究與應(yīng)用案例

        知識(shí)圖譜最先是由搜索引擎行業(yè)提出的,也最先在智能搜索領(lǐng)域迅速發(fā)展,近幾年國(guó)內(nèi)外很多搜索引擎相關(guān)的科技企業(yè)都推出了知識(shí)圖譜相關(guān)產(chǎn)品與服務(wù),在提升搜索引擎搜索能力的同時(shí)也促進(jìn)了知識(shí)圖譜及相關(guān)技術(shù)的發(fā)展。國(guó)外的谷歌Knowledge Vault、FreeBase和微軟的Bing Satori等較為出名,國(guó)內(nèi)比較知名的有搜狗知識(shí)圖譜知立方和百度知識(shí)圖譜等。以百度為例,其打造了目前為止業(yè)界規(guī)模最大的多源異構(gòu)中文知識(shí)圖譜,覆蓋超過(guò)50億實(shí)體和5500億事實(shí),同時(shí),建成了醫(yī)療、法律、金融和能源等多個(gè)行業(yè)知識(shí)圖譜[4]。百度知識(shí)圖譜廣泛應(yīng)用于搜索、推薦等領(lǐng)域的產(chǎn)品,大幅提升了產(chǎn)品的智能化水平。與傳統(tǒng)的信息檢索不同,知識(shí)圖譜可以幫助搜索引擎理解用戶搜索的語(yǔ)義,并給出相應(yīng)的答案。比如,用戶輸入“姚明的身高”,搜索引擎會(huì)根據(jù)知識(shí)圖譜的內(nèi)容,直接給出“226cm”這個(gè)答案,而不是簡(jiǎn)單列出包含“姚明的身高”這個(gè)關(guān)鍵詞的網(wǎng)頁(yè)。甚至“國(guó)慶還有多少天”“李白關(guān)于送別的詩(shī)”這類開(kāi)放性的問(wèn)題,也可以通過(guò)預(yù)先建立的知識(shí)圖譜獲得準(zhǔn)確詳盡的解答。在智能推薦方面,當(dāng)用戶搜索某個(gè)人時(shí),系統(tǒng)會(huì)自動(dòng)根據(jù)人物關(guān)系給出推薦人物(如圖1所示)。

        知識(shí)圖譜在搜索引擎領(lǐng)域的成功應(yīng)用使其迅速獲得了其他行業(yè)的關(guān)注與研究,圖書館界也對(duì)此表現(xiàn)出了濃厚的興趣。趙夕姝[5]從圖書館館藏?cái)?shù)字資源知識(shí)圖譜的構(gòu)成及應(yīng)用兩個(gè)方面詳細(xì)研究設(shè)計(jì)了基于知識(shí)圖譜的圖書館館藏?cái)?shù)字資源管理與檢索系統(tǒng),將知識(shí)圖譜引入其中,建立了不同類型、結(jié)構(gòu)數(shù)字資源之間的關(guān)聯(lián)關(guān)系,理順了數(shù)字資源間的邏輯層次,在方便圖書館館藏?cái)?shù)字資源存儲(chǔ)的同時(shí),提升了圖書館館藏?cái)?shù)字資源系統(tǒng)檢索能力。胡汗林、鄧三鴻[6]對(duì)青銅器概念與術(shù)語(yǔ)進(jìn)行分析,構(gòu)建青銅器知識(shí)圖譜并探討相關(guān)應(yīng)用,實(shí)現(xiàn)對(duì)青銅器知識(shí)的關(guān)聯(lián)與挖掘,從而促進(jìn)知識(shí)共享與發(fā)現(xiàn),力爭(zhēng)解決文物資源信息分散、數(shù)據(jù)質(zhì)量不佳、數(shù)據(jù)關(guān)聯(lián)性不強(qiáng)等問(wèn)題,為青銅器數(shù)字館藏建設(shè)提供了新思路。范昊等[7]結(jié)合標(biāo)準(zhǔn)文獻(xiàn)內(nèi)容結(jié)構(gòu)特征和情報(bào)需求,歸納多維知識(shí)發(fā)現(xiàn)框架,提出基于知識(shí)圖譜的標(biāo)準(zhǔn)文獻(xiàn)多維知識(shí)發(fā)現(xiàn)流程,構(gòu)建標(biāo)準(zhǔn)文獻(xiàn)知識(shí)圖譜,進(jìn)行知識(shí)發(fā)現(xiàn)實(shí)例論證,為標(biāo)準(zhǔn)文獻(xiàn)資源語(yǔ)義深度關(guān)聯(lián)及知識(shí)發(fā)現(xiàn)提供支撐,開(kāi)辟標(biāo)準(zhǔn)文獻(xiàn)開(kāi)發(fā)利用新方向。針對(duì)知識(shí)圖譜的應(yīng)用,圖書館界已經(jīng)有了不少宏觀上的研究,也有根據(jù)實(shí)際工作將其在某類數(shù)字資源方面應(yīng)用的嘗試,但成規(guī)模、夠系統(tǒng)、可應(yīng)用的研究較少。

        3 網(wǎng)絡(luò)資源保存項(xiàng)目發(fā)展現(xiàn)狀

        進(jìn)入網(wǎng)絡(luò)時(shí)代后,人們逐漸認(rèn)識(shí)到網(wǎng)絡(luò)信息中蘊(yùn)含的巨大價(jià)值。早在20世紀(jì)末,英美等發(fā)達(dá)國(guó)家就著手開(kāi)展了一批網(wǎng)絡(luò)信息保存的相關(guān)項(xiàng)目。從2003年起,國(guó)家圖書館也啟動(dòng)了自己的網(wǎng)絡(luò)信息資源保存項(xiàng)目,進(jìn)行網(wǎng)絡(luò)資源收集保存等工作。在國(guó)家圖書館的引領(lǐng)下,超過(guò)200家地方館也加入這一行列中,開(kāi)展了網(wǎng)絡(luò)資源采集、政府信息整合等項(xiàng)目。經(jīng)過(guò)近二十年的持續(xù)努力,國(guó)家圖書館和各級(jí)地方館共同建立了較為完整的網(wǎng)絡(luò)資源保存體系,到2021年,國(guó)家圖書館主導(dǎo)的網(wǎng)絡(luò)資源保存項(xiàng)目總數(shù)據(jù)量已達(dá)300TB[8],網(wǎng)絡(luò)資源已經(jīng)成為圖書館數(shù)字資源的重要組成部分,且所占比重還在迅速加大。

        隨著這項(xiàng)工作的深入進(jìn)行,國(guó)家圖書館在網(wǎng)絡(luò)資源采集策略、采集方式及保存方案等方面都有長(zhǎng)足的進(jìn)展。比如在采集方式上,國(guó)家圖書館利用虛擬化技術(shù)提升采集效率,建設(shè)云共享式網(wǎng)絡(luò)資源采集和保存平臺(tái)[8],支持國(guó)家圖書館與多個(gè)地方館開(kāi)展共享式、分布式、協(xié)同式合作,解決了地方館在開(kāi)展工作中由于技術(shù)力量不足而遇到的問(wèn)題。針對(duì)近年來(lái)網(wǎng)絡(luò)資源產(chǎn)生的新變化,國(guó)家圖書館持續(xù)進(jìn)行技術(shù)更新,創(chuàng)新優(yōu)化采集與管理的算法與策略,實(shí)現(xiàn)了增量采集、增量回放等功能,并實(shí)現(xiàn)了視頻資源的高效采集與流暢回放,更好地適應(yīng)了互聯(lián)網(wǎng)資源的移動(dòng)化、視頻化趨勢(shì)。

        在采集與保存得到充分發(fā)展的同時(shí),資源的利用效率并沒(méi)有得到同步提升。網(wǎng)絡(luò)資源保存項(xiàng)目大多采用的還是關(guān)鍵詞檢索和數(shù)據(jù)直接展示的傳統(tǒng)對(duì)外展現(xiàn)方式,對(duì)數(shù)據(jù)的利用還停留在較低的水平。如圖2中國(guó)政府公開(kāi)信息整合服務(wù)平臺(tái)所示[9],平臺(tái)缺乏主動(dòng)、智能化、個(gè)性化的對(duì)外揭示手段,其他參與項(xiàng)目的地方館也基本采用了同樣的展示方式。這樣很多數(shù)據(jù)只能停留在存儲(chǔ)的狀態(tài),難以做到從數(shù)據(jù)到信息,再到知識(shí),最終到智慧化服務(wù)的轉(zhuǎn)變。

        提升服務(wù)能力是網(wǎng)絡(luò)資源保存所面臨的巨大挑戰(zhàn),解決這一問(wèn)題的關(guān)鍵在于資源建設(shè)的智慧化,知識(shí)化是智慧化的基礎(chǔ)[10],智慧化的資源是智慧化服務(wù)的前提。知識(shí)圖譜是在搜索引擎行業(yè)發(fā)展起來(lái)的,最早處理的就是各種網(wǎng)絡(luò)資源,這與圖書館網(wǎng)絡(luò)資源保存相契合,其發(fā)展過(guò)程中的很多經(jīng)驗(yàn)和方法值得借鑒。

        4 知識(shí)圖譜在網(wǎng)絡(luò)資源保存項(xiàng)目中的應(yīng)用思路

        4.1 引入知識(shí)圖譜的意義

        知識(shí)圖譜有助于建立網(wǎng)絡(luò)資源之間的聯(lián)系及網(wǎng)絡(luò)資源與外部其他資源之間的聯(lián)系?;诰W(wǎng)絡(luò)資源建立的知識(shí)圖譜可以把靜態(tài)的信息轉(zhuǎn)變成動(dòng)態(tài)信息,把本來(lái)僅處于存儲(chǔ)狀態(tài)的信息置于和外界的有機(jī)聯(lián)系中,為以后的深度開(kāi)發(fā)利用打下基礎(chǔ)。知識(shí)圖譜可以降低用戶使用數(shù)據(jù)的門檻,以前需要由專業(yè)的檢索人員運(yùn)用復(fù)雜的檢索技術(shù)才能得出的檢索結(jié)果,在知識(shí)圖譜幫助下,普通人直接用類似自然語(yǔ)言交流的方式就可以輕松獲得。知識(shí)圖譜的建立相當(dāng)于生成了許多可直接利用的知識(shí),完成資源從信息到知識(shí)的轉(zhuǎn)變,將提高資源利用的水平,為智慧化服務(wù)奠定基礎(chǔ),有助于網(wǎng)絡(luò)資源保存整個(gè)項(xiàng)目融入智慧圖書館建設(shè)的大浪潮中。

        4.2 知識(shí)圖譜構(gòu)建整體思路

        在知識(shí)圖譜的構(gòu)建流程中,非結(jié)構(gòu)化數(shù)據(jù)的知識(shí)抽取較為復(fù)雜,包括數(shù)據(jù)清洗后的實(shí)體、屬性、關(guān)系的抽取等,如果從零開(kāi)始,每一項(xiàng)都將面臨不小的挑戰(zhàn)。知識(shí)圖譜的建設(shè)需要以海量的與行業(yè)無(wú)關(guān)的資源為基礎(chǔ)來(lái)抽取相關(guān)知識(shí),海量異構(gòu)數(shù)據(jù)的融合也需要極為專業(yè)的技術(shù)與人員作為保障,難度較大,并非網(wǎng)絡(luò)資源保存項(xiàng)目目前可以完成的。從網(wǎng)絡(luò)資源保存項(xiàng)目的實(shí)際出發(fā),在相關(guān)項(xiàng)目中引入知識(shí)圖譜技術(shù),可采用分批、分步處理的方式。

        一方面是從項(xiàng)目中保存的結(jié)構(gòu)化數(shù)據(jù)入手,嘗試知識(shí)圖譜的起步建設(shè)工作。在網(wǎng)絡(luò)資源保存相關(guān)工作中建立了大量的元數(shù)據(jù),有些是人工標(biāo)注的,有些是機(jī)器自動(dòng)生成并加以一定人工干預(yù)的。比如,網(wǎng)絡(luò)政府信息就依據(jù)標(biāo)準(zhǔn)建立了相對(duì)完善豐富的元數(shù)據(jù),數(shù)據(jù)量已經(jīng)超過(guò)了兩千萬(wàn)條。這些結(jié)構(gòu)化數(shù)據(jù)相對(duì)精細(xì)、準(zhǔn)確地記錄了很多網(wǎng)絡(luò)資源的相關(guān)信息。元數(shù)據(jù)大多直接保存在關(guān)系型數(shù)據(jù)庫(kù)中,結(jié)構(gòu)清晰,表述準(zhǔn)確,且易于機(jī)器自動(dòng)處理,可以較為容易地轉(zhuǎn)化為RDF(資源描述框架)或其他形式的知識(shí)庫(kù)內(nèi)容?;谶@些元數(shù)據(jù)建立知識(shí)圖譜,可保障其可靠性,極大降低知識(shí)抽取階段實(shí)體抽取、屬性抽取等步驟的難度,并使后續(xù)的知識(shí)融合、知識(shí)加工更為高效,容易比較快速地看到建設(shè)成果。比如,政府信息融合中保存有“來(lái)源網(wǎng)站”“發(fā)布機(jī)構(gòu)”等政府信息的元數(shù)據(jù)項(xiàng),形成了機(jī)構(gòu)之間轉(zhuǎn)發(fā)信息的關(guān)系,可以根據(jù)此種關(guān)系建立相關(guān)機(jī)構(gòu)之間關(guān)于信息轉(zhuǎn)發(fā)的圖譜,此種圖譜可顯示信息從發(fā)布到被多個(gè)機(jī)構(gòu)轉(zhuǎn)發(fā)的過(guò)程、信息的轉(zhuǎn)發(fā)量、機(jī)構(gòu)的轉(zhuǎn)發(fā)量等,這些數(shù)據(jù)對(duì)每條政府信息的重要性、機(jī)構(gòu)的權(quán)威性等都有所揭示。除此之外,政府信息的關(guān)鍵詞、體裁分類等都可以作為建立圖譜的切入點(diǎn)?;诮Y(jié)構(gòu)化數(shù)據(jù)建設(shè)的知識(shí)圖譜不僅有助于提高結(jié)構(gòu)化數(shù)據(jù)的利用效率,還可以為基于半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)建設(shè)知識(shí)圖譜奠定基礎(chǔ)。

        另一方面是處理其中的半結(jié)構(gòu)化數(shù)據(jù),比如表格、格式相對(duì)有規(guī)律的網(wǎng)絡(luò)百科、新聞報(bào)道、政府公報(bào)等。與結(jié)構(gòu)化數(shù)據(jù)不同,半結(jié)構(gòu)化數(shù)據(jù)有一定的格式,每部分都有相對(duì)固定的語(yǔ)義信息[11],只是其中的結(jié)構(gòu)需要進(jìn)一步整理,這給機(jī)器自動(dòng)處理帶來(lái)了一定的障礙。但相較于非結(jié)構(gòu)化數(shù)據(jù),這種相對(duì)的規(guī)律性,又使得每類半結(jié)構(gòu)化數(shù)據(jù)在該類內(nèi)部有可能采用統(tǒng)一的自動(dòng)處理方式。通常使用包裝器的方式從半結(jié)構(gòu)化數(shù)據(jù)中抽取相關(guān)信息,對(duì)于不同類的半結(jié)構(gòu)化數(shù)據(jù)可能要定義不同的包裝器來(lái)抽取相關(guān)信息,其難點(diǎn)在于包裝器的定義、自動(dòng)生成及更新維護(hù)等。網(wǎng)絡(luò)資源保存中重大事件等專題資源可以采用這種方式建立知識(shí)圖譜,記錄某些事件發(fā)生的時(shí)間、地點(diǎn)、參與者、影響等信息或者周期性發(fā)生的事件在不同時(shí)間段的不同表現(xiàn)等。

        從國(guó)內(nèi)網(wǎng)絡(luò)資源保存的現(xiàn)狀來(lái)看,項(xiàng)目的參與者大多是全國(guó)各地的圖書館,軟硬件水平參差不齊,普遍缺乏高精技術(shù)力量;但在資源采集之初對(duì)目標(biāo)進(jìn)行了較多人工選擇,制定了一系列的建設(shè)標(biāo)準(zhǔn)。網(wǎng)絡(luò)資源保存偏重于重要性較高的網(wǎng)站、權(quán)威性較高的政府信息及影響較大的事件專題等類別。從項(xiàng)目參與者的實(shí)際情況和已獲取資源的覆蓋范圍來(lái)看,暫不適合建立通用的知識(shí)圖譜,應(yīng)該把重點(diǎn)放在對(duì)結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)的處理上,在處理好這兩部分?jǐn)?shù)據(jù)的基礎(chǔ)上,可以針對(duì)非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行實(shí)體抽取、屬性抽取、事件抽取等,并以此為基礎(chǔ)建立更為細(xì)粒度的垂直行業(yè)知識(shí)圖譜。

        以采集到的網(wǎng)絡(luò)資源為基礎(chǔ),優(yōu)先建立結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)相應(yīng)的知識(shí)圖譜,完成數(shù)據(jù)知識(shí)化,依托知識(shí)化資源開(kāi)展各類智慧化服務(wù),提高網(wǎng)絡(luò)資源深度利用水平與效率,這就是知識(shí)圖譜在網(wǎng)絡(luò)資源保存中應(yīng)用的基本框架,如圖3所示。目前,智慧圖書館的建設(shè)正處于實(shí)踐階段,2021年國(guó)家圖書館提出建設(shè)全國(guó)智慧圖書館體系,推動(dòng)圖書館由數(shù)字化向智慧化發(fā)展,網(wǎng)絡(luò)資源保存相關(guān)工作應(yīng)該利用好這一形勢(shì)與政策上的優(yōu)勢(shì)促進(jìn)自身的智慧化轉(zhuǎn)型,并及時(shí)向參與其中的各個(gè)地方館推廣經(jīng)驗(yàn)與成果,推動(dòng)網(wǎng)絡(luò)資源保存在全國(guó)的發(fā)展。

        4.3 構(gòu)建知識(shí)圖譜的難點(diǎn)

        基于結(jié)構(gòu)化數(shù)據(jù)建立知識(shí)圖譜的知識(shí)抽取步驟相對(duì)容易,也便于機(jī)器自動(dòng)批量處理,其難點(diǎn)主要在于不同來(lái)源知識(shí)的融合?;诎虢Y(jié)構(gòu)化數(shù)據(jù)建立知識(shí)圖譜相較于結(jié)構(gòu)化數(shù)據(jù)多配置一個(gè)包裝器,不同類型的資源以及同一類型資源內(nèi)部結(jié)構(gòu)變化都較大,形式多種多樣,并沒(méi)有統(tǒng)一的處理方法。因此,針對(duì)不同格式的內(nèi)容要配置不同的包裝器以完成數(shù)據(jù)的解析。為了保證效率與準(zhǔn)確度,通常采用機(jī)器學(xué)習(xí)與人機(jī)結(jié)合的方法來(lái)配置包裝器。而對(duì)于完全非結(jié)構(gòu)化的網(wǎng)絡(luò)資源,知識(shí)抽取、知識(shí)融合、知識(shí)計(jì)算與應(yīng)用這些流程都涉及很多專業(yè)技術(shù),其中關(guān)系抽取、事件抽取、圖計(jì)算等,至今仍然是各自領(lǐng)域的難點(diǎn),這些問(wèn)題的高效解決需要人工智能、自然語(yǔ)言處理、大數(shù)據(jù)等行業(yè)的深度配合?;趯?shí)際考慮,在網(wǎng)絡(luò)資源保存項(xiàng)目中主要基于結(jié)構(gòu)化和半結(jié)構(gòu)化資源來(lái)建立相應(yīng)的知識(shí)圖譜是當(dāng)前階段比較務(wù)實(shí)的選擇。當(dāng)然,項(xiàng)目參與人員也應(yīng)保持前瞻性眼光,緊跟技術(shù)潮流,持續(xù)學(xué)習(xí)了解前沿技術(shù),努力提高項(xiàng)目建設(shè)的智慧化水平。

        4.4 應(yīng)用方向

        4.4.1 助力高級(jí)檢索知識(shí)問(wèn)答

        知識(shí)圖譜的應(yīng)用初衷就是解決傳統(tǒng)搜索的準(zhǔn)確性問(wèn)題,引入知識(shí)圖譜后用戶搜索從面向關(guān)鍵詞變?yōu)橛筛鞣N“知識(shí)”組成的語(yǔ)義網(wǎng)絡(luò),知識(shí)圖譜可以對(duì)用戶輸入內(nèi)容進(jìn)行“理解”,識(shí)別其中的實(shí)體、概念屬性等元素,不僅能反饋直接的知識(shí),還能反饋與之相關(guān)的實(shí)體、關(guān)系等豐富的結(jié)果。知識(shí)問(wèn)答更是用互動(dòng)的方式拉近了普通用戶與知識(shí)的距離,降低了知識(shí)獲取的門檻,讓用戶直接以人與人之間日常交流的方式就可以高效找到自己感興趣的信息,而不用關(guān)心其背后復(fù)雜的實(shí)現(xiàn)技術(shù)。

        4.4.2 知識(shí)可視化展示

        利用知識(shí)圖譜能以直觀、動(dòng)態(tài)的方式展示知識(shí)網(wǎng)絡(luò);或根據(jù)用戶喜好的社會(huì)熱點(diǎn)、時(shí)間節(jié)點(diǎn)等因素動(dòng)態(tài)調(diào)整展示的內(nèi)容與方式,主動(dòng)推出相關(guān)知識(shí);又或讓用戶在知識(shí)構(gòu)成的網(wǎng)絡(luò)地圖中巡航,來(lái)發(fā)現(xiàn)自己感興趣的部分。這可以改善目前網(wǎng)絡(luò)資源保存項(xiàng)目?jī)?nèi)容展示單調(diào)被動(dòng)的現(xiàn)狀。

        4.4.3 提供和外界的關(guān)聯(lián),發(fā)現(xiàn)新的知識(shí)

        知識(shí)圖譜本質(zhì)上是基于知識(shí)的語(yǔ)義網(wǎng)絡(luò),網(wǎng)絡(luò)的重要特征就是互相關(guān)聯(lián)。根據(jù)用戶的興趣利用內(nèi)部關(guān)聯(lián)關(guān)系,推薦其他可以借閱的館藏資源,甚至其他知識(shí)圖譜的內(nèi)容,以提高網(wǎng)絡(luò)資源的利用質(zhì)量,使其真正變成館藏的有機(jī)組成部分。知識(shí)圖譜建設(shè)到一定程度,其中包含的實(shí)體、關(guān)系、屬性等數(shù)量會(huì)不斷增加,各項(xiàng)元素之間的關(guān)系也變得更為復(fù)雜,可能會(huì)出現(xiàn)一些人們注意不到的隱藏聯(lián)系,利用圖計(jì)算、規(guī)則推理等方法,可以挖掘出這些隱藏知識(shí),豐富知識(shí)圖譜的構(gòu)成,其難點(diǎn)在于對(duì)建立的知識(shí)圖譜的規(guī)模、性能等要求較高。

        網(wǎng)絡(luò)資源保存項(xiàng)目引入知識(shí)圖譜技術(shù)是一次較新的嘗試,并沒(méi)有一蹴而就的辦法,很多問(wèn)題需要在工作中逐步顯現(xiàn)與解決,這就要求工作人員在建設(shè)中不斷積累經(jīng)驗(yàn),改進(jìn)工作方法,調(diào)整工作思路,在使用中逐步完善知識(shí)圖譜構(gòu)建。

        5 結(jié)語(yǔ)

        筆者根據(jù)網(wǎng)絡(luò)資源采集項(xiàng)目的現(xiàn)狀,分析其在資源利用與服務(wù)等方面存在的問(wèn)題,提出引入知識(shí)圖譜技術(shù)解決相關(guān)問(wèn)題的思路,以期推動(dòng)網(wǎng)絡(luò)資源采集知識(shí)服務(wù)、智慧服務(wù)的發(fā)展。另外,除了知識(shí)圖譜,其他人工智能的相關(guān)技術(shù)都可以運(yùn)用到網(wǎng)絡(luò)資源采集的建設(shè)與服務(wù)中。

        參考文獻(xiàn):

        [1] AMIT S.Introducing the knowledge graph[R].America:Official Blog of Google,2012.

        [2] 田玲,等.知識(shí)圖譜綜述——表示、構(gòu)建、推理與知識(shí)超圖理論[J].計(jì)算機(jī)應(yīng)用,2021(8):2161-2186.

        [3] 楊正洪,郭良越,劉瑋.人工智能與大數(shù)據(jù)技術(shù)導(dǎo)論[M].北京:清華大學(xué)出版社,2019.

        [4] 百度知識(shí)圖譜——匯聚知識(shí),理解世界,賦能產(chǎn)業(yè)[EB/OL].[2023-04-13].https://kg.baidu.com/#/.

        [5] 趙夕姝.基于知識(shí)圖譜的館藏?cái)?shù)字資源管理系統(tǒng)設(shè)計(jì)研究[J].圖書館研究與工作,2022(10):75-78,95.

        [6] 胡汗林,鄧三鴻.知識(shí)圖譜在青銅器數(shù)字館藏建設(shè)中的應(yīng)用[J].數(shù)字圖書館論壇,2023(4):1-8.

        [7] 范昊,等.基于知識(shí)圖譜的標(biāo)準(zhǔn)文獻(xiàn)多維知識(shí)發(fā)現(xiàn)研究[J].情報(bào)理論與實(shí)踐,2023(9):175-184.

        [8] 魏大威,季士妍.國(guó)家圖書館網(wǎng)絡(luò)信息資源采集與保存平臺(tái)關(guān)鍵技術(shù)實(shí)現(xiàn)[J].圖書館,2021(3):45-50.

        [9] 中國(guó)政府公開(kāi)信息整合服務(wù)平臺(tái)[EB/OL].[2023-03-26].http://govinfo.nlc.cn/.

        [10] 初景利,段美珍.智慧圖書館與智慧服務(wù)[J].圖書館建設(shè),2018(4):85-90,95.

        [11] 朱巧明,等.中文信息處理技術(shù)教程[M].北京:清華大學(xué)出版社,2005.

        張學(xué)青 男,1984年生。碩士,館員。研究方向:數(shù)字資源建設(shè)、網(wǎng)絡(luò)資源保存、智慧圖書館建設(shè)。

        (收稿日期:2023-04-21;責(zé)編:劉清揚(yáng)。)

        欧美午夜精品久久久久久浪潮| 亚洲国产中文字幕视频| 医院人妻闷声隔着帘子被中出| 日韩精品无码免费专区网站| 亚洲AV无码一区二区二三区我| 亚洲精品99久91在线| 日本久久久免费观看视频| 特黄做受又粗又长又大又硬| 免费人成年小说在线观看| 久久91精品国产91久| 日韩中文字幕熟女人妻| 成人免费无码大片a毛片抽搐色欲| 中文字幕亚洲情99在线| 色综合色综合久久综合频道| 人妻被公上司喝醉在线中文字幕| 天天躁夜夜躁狠狠是什么心态| 亚洲av永久无码精品国产精品| 亚洲一级电影在线观看| 亚洲不卡高清av在线| 免费成人电影在线观看| 欧美熟妇色ⅹxxx欧美妇| 中文字幕有码一区二区三区| 精品国产日韩亚洲一区在线| 浪货趴办公桌~h揉秘书电影| 亚洲欧洲日产国码高潮αv| 亚欧视频无码在线观看| 护士人妻hd中文字幕| 成年女人免费视频播放体验区| 水蜜桃久久| 亚洲av中文字字幕乱码| 我和隔壁的少妇人妻hd| 精品无码人妻一区二区三区品| 久久精品国产亚洲av大全相关| 日本一区二区三区爱爱视频| 亚洲av网一区二区三区| 午夜亚洲www湿好大| 日韩av在线不卡观看| 国产一区二区三区三区四区精品 | 国产精品www夜色视频| 日韩爱爱网站| 亚洲一区二区三区新视频|