亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于語(yǔ)義網(wǎng)的數(shù)字圖書館信息檢索系統(tǒng)框架模型

2024-06-06 00:00:00楊鴻

科技創(chuàng)新與應(yīng)用 2024年16期

作者簡(jiǎn)介：楊鴻（1987-），女，講師。研究方向?yàn)閳D書館學(xué)-醫(yī)學(xué)文獻(xiàn)檢索與利用。

DOI：10.19981/j.CN23-1581/G3.2024.16.028

摘" 要：面對(duì)互聯(lián)網(wǎng)技術(shù)的成熟化、普及化發(fā)展，數(shù)字圖書館成為了為人們提供信息資源的重要機(jī)構(gòu)。然而面對(duì)數(shù)據(jù)異構(gòu)化、分散化發(fā)展的大環(huán)境，數(shù)字圖書館的傳統(tǒng)信息檢索系統(tǒng)與用戶日益提高的信息檢索需求不再適應(yīng)，難以正確判斷出用戶的檢索意圖，存在檢索效率低、檢測(cè)結(jié)果不夠準(zhǔn)確的問(wèn)題?；诖?，該文結(jié)合語(yǔ)義網(wǎng)技術(shù)，對(duì)數(shù)字圖書館信息檢索系統(tǒng)框架模型進(jìn)行模塊、流程、系統(tǒng)結(jié)構(gòu)設(shè)計(jì)，并在此基礎(chǔ)上給出領(lǐng)域本體集成與構(gòu)建、語(yǔ)義相似度算法優(yōu)化的方法，旨在為數(shù)字圖書館信息檢索系統(tǒng)科學(xué)建設(shè)提供參考，從而最大化展現(xiàn)出數(shù)字圖書館的信息資源利用價(jià)值。

關(guān)鍵詞：語(yǔ)義網(wǎng)；數(shù)字圖書館；信息檢索系統(tǒng)；信息資源利用價(jià)值；系統(tǒng)框架模型

中圖分類號(hào)：G258.2" " " 文獻(xiàn)標(biāo)志碼：A" " " " " 文章編號(hào)：2095-2945（2024）16-0120-04

Abstract： In the face of the mature and popular development of Internet technology， digital library has become an important institution to provide people with information resources. However， in the face of the development environment of data isomerization and decentralization， the traditional information retrieval system of digital library can no longer adapt to the increasing information retrieval needs of users， and it is difficult to correctly judge the retrieval intention of users. there are some problems， such as low retrieval efficiency and inaccurate detection results. Based on this， combined with semantic web technology， this paper designs the module， process and system structure of the framework model of digital library information retrieval system. On this basis， it gives the methods of domain ontology integration and construction and semantic similarity algorithm optimization， in order to provide reference for the scientific construction of digital library information retrieval system， and thus maximize the utilization value of digital library information resources.

Keywords： semantic web; digital library; information retrieval system; utilization value of information resources; system framework model

傳統(tǒng)信息檢索查詢模式智能化不足，信息資源共享未能實(shí)現(xiàn)，無(wú)法準(zhǔn)確、快速檢索出用戶需求的信息資源。而語(yǔ)義網(wǎng)技術(shù)是基于機(jī)器理解人類語(yǔ)言的技術(shù)方法，可在Web基礎(chǔ)上，利用標(biāo)準(zhǔn)化、共同性機(jī)器可理解元數(shù)據(jù)等先進(jìn)技術(shù)，調(diào)整傳統(tǒng)字詞匹配檢索模式，從語(yǔ)義層面理解用戶檢索意圖，以便為用戶提供更為優(yōu)質(zhì)的檢索服務(wù)。因此，有必要探尋基于語(yǔ)義網(wǎng)的數(shù)字圖書館信息檢索系統(tǒng)框架模型設(shè)計(jì)與構(gòu)建方法，并解決集成構(gòu)建領(lǐng)域本體、改進(jìn)語(yǔ)義相似度算法等技術(shù)難題，從而為數(shù)字圖書館信息檢索發(fā)展中語(yǔ)義網(wǎng)技術(shù)的科學(xué)應(yīng)用奠定基礎(chǔ)。

1" 基于語(yǔ)義網(wǎng)的數(shù)字圖書館信息檢索框架模型設(shè)計(jì)

1.1" 系統(tǒng)框架模型設(shè)計(jì)

數(shù)字時(shí)代背景下，打造數(shù)字圖書館，采用智能化、現(xiàn)代化方式為用戶提供信息資源，是圖書館穩(wěn)定持續(xù)發(fā)展的必然出路，在此背景下，語(yǔ)義網(wǎng)技術(shù)應(yīng)運(yùn)而成。此技術(shù)可將信息檢索范圍延展至知識(shí)層面，并能對(duì)語(yǔ)義表達(dá)進(jìn)行規(guī)范，通過(guò)人機(jī)交互為用戶提供知識(shí)共享、思想交流服務(wù)[1]。在語(yǔ)義網(wǎng)技術(shù)支持下，構(gòu)建數(shù)字圖書館的信息檢索框架模型時(shí)，需要以可擴(kuò)展標(biāo)記語(yǔ)言（XML）、資源描述框架（RDF）、本體技術(shù)為基礎(chǔ)，并應(yīng)用到知識(shí)管理等多個(gè)理論，本文設(shè)計(jì)的系統(tǒng)框架模型如圖1所示。

1.2" 功能模塊設(shè)計(jì)

1.2.1" 信息資源整合處理模塊

利用語(yǔ)義網(wǎng)技術(shù)創(chuàng)建信息檢索框架模型時(shí)，首先要合理構(gòu)建本體模型，并運(yùn)用先進(jìn)技術(shù)完成領(lǐng)域本體創(chuàng)建過(guò)程，在此過(guò)程中，需要利用信息資源整合處理模塊處理各類信息資源。應(yīng)引入專家支持，利用專家的知識(shí)經(jīng)驗(yàn)，獲取并理解各個(gè)相關(guān)領(lǐng)域的知識(shí)內(nèi)容，并從中篩選認(rèn)可度較高的詞語(yǔ)，然后對(duì)各個(gè)詞語(yǔ)間的邏輯關(guān)系進(jìn)行分析[2]。此過(guò)程可納入用戶對(duì)領(lǐng)域知識(shí)的認(rèn)知，使用領(lǐng)域本體標(biāo)記文檔，再將其中的特征詞匯提取出來(lái)加以分析，并與概念集形成關(guān)聯(lián)，從而完成語(yǔ)義標(biāo)引過(guò)程。此模塊采用元數(shù)據(jù)整合信息資源，面對(duì)規(guī)?；臄?shù)字資源，元數(shù)據(jù)標(biāo)準(zhǔn)無(wú)法有效統(tǒng)一，網(wǎng)絡(luò)中還存在一些半結(jié)構(gòu)化數(shù)據(jù)，為提高信息提取的準(zhǔn)確性，此模塊還引入了可擴(kuò)展標(biāo)記語(yǔ)言，在排除外界因素干擾的情況下，按照元數(shù)據(jù)處理規(guī)范，針對(duì)性獲取符合用戶需求的元數(shù)據(jù)，而后再將采集的數(shù)據(jù)匯總到一起，并存儲(chǔ)于元數(shù)據(jù)庫(kù)中。信息資源整合處理包含初步整序、粗粒度提取、細(xì)粒度提取、元數(shù)據(jù)獲取、元數(shù)據(jù)存儲(chǔ)5個(gè)步驟（圖2）。由于XML無(wú)法描述語(yǔ)義，需利用RDF定義概念模型，對(duì)資源間的關(guān)系進(jìn)行描述，此技術(shù)采用XML這一語(yǔ)法基礎(chǔ)，利用命名空間思想完成描述過(guò)程，流程更簡(jiǎn)潔，元數(shù)據(jù)處理更為快捷。

圖1" 基于語(yǔ)義網(wǎng)的數(shù)字圖書館信息檢索框架模型

圖2" 數(shù)字化文檔元數(shù)據(jù)提取過(guò)程

1.2.2" 用戶接口及查詢信息處理模塊

在語(yǔ)義網(wǎng)支持下，可創(chuàng)建具有人機(jī)交互功能的用戶接口，語(yǔ)義是用戶對(duì)現(xiàn)實(shí)世界計(jì)算機(jī)表示的解釋，在基于語(yǔ)義網(wǎng)的數(shù)字圖書館信息檢索系統(tǒng)中，用戶可在用戶界面中輸入自己的信息查詢關(guān)鍵詞，推理機(jī)收到查詢信號(hào)后，會(huì)先將用戶輸入的關(guān)鍵詞句轉(zhuǎn)化成為適合的本體查詢?cè)~句，再利用信息資源領(lǐng)域本體，運(yùn)用領(lǐng)域中的知識(shí)、自然語(yǔ)言分析關(guān)鍵詞句，計(jì)算語(yǔ)義相似度并推理語(yǔ)義，然后將語(yǔ)義相似度與用戶所查詢關(guān)鍵詞句的領(lǐng)域本體提取出來(lái)，進(jìn)而分析出用戶的檢索意圖。此步驟完成后，若檢索意圖不明確，查詢請(qǐng)求處理子模塊會(huì)跳轉(zhuǎn)至用戶界面，讓用戶重新輸入關(guān)鍵詞句并向處理子模塊提交查詢?nèi)蝿?wù)；若檢索意圖已明確，則在返回用戶界面后，直接向系統(tǒng)檢索結(jié)構(gòu)提交分析出的檢索請(qǐng)求。分析時(shí)，系統(tǒng)的領(lǐng)域本體會(huì)向推理機(jī)傳送與檢索請(qǐng)求相關(guān)的知識(shí)內(nèi)容，再推理分析檢索請(qǐng)求詞句之間的關(guān)聯(lián)性，然后自動(dòng)查找符合要求的信息。與此同時(shí)，還會(huì)結(jié)合推理情況，創(chuàng)建契合檢索要求的詞群或句群，然后根據(jù)檢索結(jié)果，構(gòu)建一個(gè)邏輯清晰的檢索結(jié)果呈現(xiàn)模式，向客戶可視化展示檢索得到的信息資源。利用此種模式，用戶輸入關(guān)鍵詞句后，便可快速完成信息檢索，可降低檢索誤差、提高檢索效率。

1.2.3" 檢索匹配與輸出模塊

檢索匹配及輸出模塊是以上一環(huán)節(jié)分析得到的與檢索請(qǐng)求相符的詞群或句群為依據(jù)，結(jié)合已構(gòu)建完成的領(lǐng)域本體，從知識(shí)庫(kù)中查詢用戶需要查詢的信息資源。接收到用戶接口及查詢信息處理模塊提交的檢索關(guān)鍵詞句群后，此模塊根據(jù)推理規(guī)則推理分析存儲(chǔ)于知識(shí)庫(kù)，由RDF、RDFS等技術(shù)描述的實(shí)例，準(zhǔn)確輸出結(jié)果集，將搜尋到的與檢索請(qǐng)求相符的信息資源或文獻(xiàn)資料歸類到一起，再經(jīng)過(guò)分析處理之后，與用戶輸入的檢索請(qǐng)求展開一致性、相關(guān)性對(duì)比，以對(duì)比結(jié)果為依據(jù)，判斷檢索結(jié)果與用戶需求是否相符，然后根據(jù)領(lǐng)域本體知識(shí)，利用語(yǔ)義相似度算法，對(duì)二者的相關(guān)度數(shù)值進(jìn)行計(jì)算，并按相關(guān)度程序排列信息次序，然后再按照相似度由高到低的順序，經(jīng)由用戶界面，將查詢到的信息資源結(jié)果反饋給用戶，如此便可完成用戶在整個(gè)數(shù)字圖書館的信息檢索過(guò)程。

1.3" 信息檢索流程設(shè)計(jì)

基于語(yǔ)義網(wǎng)技術(shù)的數(shù)字圖書館傳統(tǒng)信息檢索系統(tǒng)，需要立足語(yǔ)義層次、知識(shí)層次檢索信息資源，因而其檢索流程共劃分為4個(gè)步驟，一是根據(jù)元數(shù)據(jù)采集、處理標(biāo)準(zhǔn)，利用語(yǔ)義網(wǎng)技術(shù)統(tǒng)一數(shù)字圖書館各類信息的格式，并構(gòu)建元數(shù)據(jù)庫(kù)，用于存儲(chǔ)處理后的信息。二是運(yùn)用檢索工具，結(jié)合專家知識(shí)及經(jīng)驗(yàn)，以數(shù)據(jù)庫(kù)中的信息作為數(shù)據(jù)源，構(gòu)建與存儲(chǔ)領(lǐng)域本體。三是以領(lǐng)域本體為基礎(chǔ)，根據(jù)用戶輸入的信息檢索關(guān)鍵詞展開推理分析，經(jīng)過(guò)轉(zhuǎn)換格式后，再計(jì)算語(yǔ)義相似度，然后將符合要求的語(yǔ)義提取出來(lái)。四是根據(jù)提前設(shè)定的檢索表達(dá)方式，抽取領(lǐng)域本體知識(shí)中符合用戶需求的信息資源，然后根據(jù)各個(gè)資源與檢索關(guān)鍵詞間的語(yǔ)義相關(guān)度計(jì)算結(jié)果，排列各個(gè)信息資源的展示順序，按照相似度程度向用戶提供檢索結(jié)果[3]。

1.4" 信息檢索系統(tǒng)的結(jié)構(gòu)

基于語(yǔ)義網(wǎng)的數(shù)字圖書館的信息檢索系統(tǒng)由4部分組成，一是數(shù)據(jù)提供者，主要是指數(shù)據(jù)庫(kù)機(jī)構(gòu)及部門，負(fù)責(zé)設(shè)定數(shù)據(jù)庫(kù)的利用權(quán)限，定義數(shù)據(jù)庫(kù)語(yǔ)義映射，確保用戶能夠訪問(wèn)信息資源，并為數(shù)字圖書館信息資源有效共享提供支持。二是領(lǐng)域?qū)＜遥鋵⑴c程序員一起，利用程序員給出的元數(shù)據(jù)及其他信息，共同創(chuàng)建領(lǐng)域本體并為本體提供數(shù)據(jù)存儲(chǔ)、查詢及瀏覽服務(wù)。三是程序員，其是元數(shù)據(jù)的提供者，以元數(shù)據(jù)作為主要數(shù)據(jù)源，利用領(lǐng)域本體知識(shí)內(nèi)容，設(shè)計(jì)與構(gòu)建數(shù)字圖書館的信息檢索系統(tǒng)，應(yīng)賦予系統(tǒng)語(yǔ)義查詢功能，還要合理設(shè)置系統(tǒng)的服務(wù)檢索功能，除此之外，還要對(duì)不同等級(jí)用戶的訪問(wèn)、查詢等各個(gè)權(quán)限進(jìn)行合理設(shè)定。四是用戶，其會(huì)通過(guò)用戶界面將自己的信息資源查詢請(qǐng)求提交給數(shù)字圖書館的語(yǔ)義查詢及搜索系統(tǒng)，得到系統(tǒng)執(zhí)行檢索任務(wù)反饋后，從用戶界面查看反饋回來(lái)的信息資源。在此結(jié)構(gòu)體系下，可幫助用戶精準(zhǔn)、快速獲取所要查詢的信息資源。

2" 基于語(yǔ)義網(wǎng)的數(shù)字圖書館信息檢索模型構(gòu)建關(guān)鍵環(huán)節(jié)

2.1" 領(lǐng)域本體集成與構(gòu)建

2.1.1" 領(lǐng)域本體集成

領(lǐng)域本體有頂層本體、領(lǐng)域本體、任務(wù)本體、應(yīng)用本體4種類型，而領(lǐng)域本體間具有3種不同的映射關(guān)鍵，一是單本體，二是多本體，三是混合本體。由于互聯(lián)網(wǎng)發(fā)展背景下，數(shù)字圖書館的信息資源會(huì)持續(xù)變化，并具備共享信息資源的需求，因而數(shù)字圖書館存在結(jié)構(gòu)不同的信息，因此基于語(yǔ)義網(wǎng)的數(shù)字圖書館信息檢索模型不可應(yīng)用單本體或多本體，而是應(yīng)選用混合本體，以便提高數(shù)字圖書館信息內(nèi)容的更新效率。集成領(lǐng)域本體時(shí)，除了要借助領(lǐng)域?qū)＜邑S富的知識(shí)、充足的經(jīng)驗(yàn)之外，還需要運(yùn)用語(yǔ)義網(wǎng)技術(shù)，并參照用戶關(guān)于領(lǐng)域知識(shí)的認(rèn)知度、了解情況等內(nèi)容，從而生成認(rèn)可度較高的詞匯，確保用戶檢索請(qǐng)求可以得到準(zhǔn)確、快捷的處理，同時(shí)也有助于提升用戶信息查找時(shí)需求表達(dá)的準(zhǔn)確性，從而提高信息資源檢索查詢效率，實(shí)現(xiàn)信息資源有效共享。

2.1.2" 領(lǐng)域本體構(gòu)建

本文結(jié)合運(yùn)用骨架法、IDEF5法構(gòu)建領(lǐng)域本體，引入螺旋模型思想，采用周期性方式、按螺線進(jìn)行多次迭代，從而創(chuàng)建一個(gè)適應(yīng)需求持續(xù)變化趨勢(shì)的領(lǐng)域本體。第一，要分析需求。面向客戶展開問(wèn)卷調(diào)查，從而確定系統(tǒng)的應(yīng)用目的、應(yīng)用范圍、應(yīng)用對(duì)象。根據(jù)調(diào)查反饋，考慮到目前數(shù)字圖書館掌握的信息類別及知識(shí)總量，合理確定領(lǐng)域本體的體積，選擇最為適合的表述語(yǔ)句，同時(shí)還需要明確創(chuàng)建領(lǐng)域本體的時(shí)間，并給出領(lǐng)域本體的更新間隔，將這些內(nèi)容清晰列在領(lǐng)域本體構(gòu)建計(jì)劃方案之中。第二，分析本體，根據(jù)需求分析及工作計(jì)劃書創(chuàng)建本體，以領(lǐng)域?qū)＜覟楹诵模诔绦騿T、用戶輔助下，運(yùn)用訪談、調(diào)研、網(wǎng)絡(luò)查詢等多種方式獲取領(lǐng)域知識(shí)，并確定領(lǐng)域本體的核心概念及內(nèi)在關(guān)聯(lián)，創(chuàng)建標(biāo)準(zhǔn)化語(yǔ)言，構(gòu)建本體核心概念集[4]。第三，創(chuàng)建本體，根據(jù)本體分析結(jié)果、運(yùn)用編碼工具及相關(guān)標(biāo)準(zhǔn)、采用形式化編碼形式編寫本體，以便簡(jiǎn)化程序、奠定本體共享重用基礎(chǔ)。第四，驗(yàn)證評(píng)價(jià)本體，利用骨架法的本體評(píng)價(jià)標(biāo)準(zhǔn)測(cè)試本體，分析術(shù)語(yǔ)是否存在歧義、術(shù)語(yǔ)邏輯關(guān)系是否一致。第五，本體進(jìn)化，利用迭代技術(shù)持續(xù)優(yōu)化已創(chuàng)建的本體，使之符合實(shí)用需求。

2.2" 語(yǔ)義相似度算法優(yōu)化

2.2.1" 基于語(yǔ)義距離的算法優(yōu)化

根據(jù)語(yǔ)義距離計(jì)算語(yǔ)義相似度，需要考慮到概念繼承性，還將二元關(guān)系鏈的長(zhǎng)度大小納入考量。需要根據(jù)網(wǎng)絡(luò)的各個(gè)有向邊的重要權(quán)值完成語(yǔ)義相似度計(jì)算。計(jì)算公式為

sim（w1，w2）=■，（1）

式中：l代表網(wǎng)絡(luò)結(jié)構(gòu)最大深度，Dis（w1，w2）代表w1與w2 2個(gè)概念節(jié)點(diǎn)間最短路徑的有向邊數(shù)目。但此計(jì)算過(guò)程較為粗糙，僅以節(jié)點(diǎn)間路徑作為依據(jù)，未能考慮到語(yǔ)義距離角度對(duì)計(jì)算結(jié)構(gòu)所產(chǎn)生的影響。而節(jié)點(diǎn)所在層次表示的是語(yǔ)義深度，也是語(yǔ)義相似度的重要影響因素，若按照此算法計(jì)算語(yǔ)義相似度，計(jì)算結(jié)果可能會(huì)與實(shí)際形成偏差。為此，計(jì)算基于語(yǔ)義距離的語(yǔ)義相似度算法時(shí)，應(yīng)將語(yǔ)義深度納入其中，語(yǔ)義深度的計(jì)算公式為

？琢＝1-■，（2）

式中：Dep（w1）、Dep（w2）表示本體網(wǎng)絡(luò)結(jié)構(gòu)中w1與w2節(jié)點(diǎn)的所在層數(shù)。設(shè)網(wǎng)絡(luò)根節(jié)點(diǎn)深度為1時(shí)，每個(gè)層次的節(jié)點(diǎn)深度均為1。

此外，網(wǎng)絡(luò)層次中節(jié)點(diǎn)地位也會(huì)影響計(jì)算結(jié)果，父節(jié)點(diǎn)與子節(jié)點(diǎn)是包含與被包含的關(guān)系，然而子節(jié)點(diǎn)的特征對(duì)于父節(jié)點(diǎn)而言并非完全適用，可能會(huì)出現(xiàn)高層級(jí)節(jié)點(diǎn)及低層級(jí)節(jié)點(diǎn)的相似度比低層級(jí)節(jié)點(diǎn)與高層級(jí)節(jié)點(diǎn)間相似度更低的情況。因此，計(jì)算語(yǔ)義相似度時(shí)，需考慮到網(wǎng)絡(luò)層級(jí)中節(jié)點(diǎn)所處地位，計(jì)算公式為

？茁=■。（3）

綜合考慮這些因素，可以將基于語(yǔ)義距離的語(yǔ)義相似度計(jì)算公式調(diào)整為

sim1（w1，w2）=■。（4）

利用此算法計(jì)算語(yǔ)義相似度，得出結(jié)果更加全面與精準(zhǔn)。

2.2.2" 基于概念特征的算法優(yōu)化

此算法是對(duì)概念的特定屬性值進(jìn)行對(duì)比分析，從而判斷概念間的相似性。相同屬性量越多，得出的相似度結(jié)果越高?；诟拍钐卣鞯恼Z(yǔ)義相似計(jì)算公式為

sim1（w1，w2）=？茲f（w1∩w2）-？琢f（w1-w2）-？茁f（w2-w1），（5）

式中：w1∩w2代表w1與w2的共有屬性集，而w1-w2、w2-w1分別代表w1、w2 2個(gè)概念獨(dú)有的屬性集。然而領(lǐng)域本體中，除了術(shù)語(yǔ)間關(guān)系描述外，還會(huì)定義各個(gè)本體的屬性特征，若本體中不同概念具備相同屬性數(shù)目，則說(shuō)明二者具有較高的相似度[5]。為簡(jiǎn)化算法，應(yīng)僅考慮本體屬性這一影響因素，因此，需要對(duì)基于概念特征的語(yǔ)義相似計(jì)算公式進(jìn)行優(yōu)化。由于領(lǐng)域本體中，不同本體的屬性數(shù)量并不一致，2個(gè)本體相同屬性及不同屬性數(shù)量的差值可能為負(fù)，此時(shí)，需要利用其他參數(shù)進(jìn)行調(diào)節(jié)，但會(huì)導(dǎo)致計(jì)算過(guò)程相對(duì)復(fù)雜，且計(jì)算結(jié)果無(wú)法量化。因而，優(yōu)化算法時(shí)，只考慮2個(gè)本體的共有屬性及概念集的總屬性量，不將二者不同屬性計(jì)入其中，則可將基于概念特征的語(yǔ)義相似度算法優(yōu)化為

sim1（w1，w2）=■，（6）

式中：Attr（w1）與Attr（w2）分別代表概念w1與w2的屬性特征集合，Attr（w1+w2）則代表這2個(gè)概念的共有屬性特征集合，其中f（x）表示x的屬性數(shù)目。利用此算法可減少重復(fù)性計(jì)算，并提升計(jì)算結(jié)果的量化性。

2.2.3" 基于信息量的語(yǔ)義相似度算法優(yōu)化

此算法是通過(guò)不同概念的共有信息量判斷二者相似度，計(jì)算公式為

sim（w1，w2）=■[-log p（w）]，（7）

式中：sim（w1，w2）表示涵蓋w1與w2 2種概念的全部集合。但數(shù)字圖書館涵蓋多種類型、不向來(lái)源的信息資源，具有相對(duì)較大的領(lǐng)域本體構(gòu)建體量，因而需要在信息量語(yǔ)義相似度算法的基礎(chǔ)上，結(jié)合運(yùn)用基于語(yǔ)義距離的算法以及基于概念特征的算法。在這3種算法思想融合的基礎(chǔ)上，從語(yǔ)義距離、概念特征、信息量3個(gè)維度展開語(yǔ)義相似度計(jì)算[6]。因此應(yīng)將基于信息量的語(yǔ)義相似度算法調(diào)整為

simw1，w2=■，

（8）

式中：？茲1、？茲2、？茲3表示不同類型的領(lǐng)域本體在各分析視角中的重要權(quán)值。此算法各部分相似度值域取值范圍均介于0與1之間，且值域范圍也為0到1，此算法可以根據(jù)實(shí)際情況調(diào)節(jié)各類領(lǐng)域本體的重要權(quán)值，在參數(shù)修正的基礎(chǔ)上可適用于多種不同情況。改進(jìn)后的語(yǔ)義相似度算法綜合了3種算法的優(yōu)勢(shì)，可提高語(yǔ)義相似度計(jì)算精準(zhǔn)度，并能得出更加客觀、合理的計(jì)算結(jié)論。

3" 結(jié)束語(yǔ)

互聯(lián)網(wǎng)時(shí)代，數(shù)字圖書館建設(shè)實(shí)現(xiàn)了信息資源共享，為發(fā)揮數(shù)字圖書館的信息資源利用價(jià)值，需要同步更新與優(yōu)化信息檢索系統(tǒng)。出于這一目的，本文運(yùn)用語(yǔ)義網(wǎng)，設(shè)計(jì)契合數(shù)字圖書館用戶需求的信息檢索系統(tǒng)，給出了該系統(tǒng)的框架模型。模型創(chuàng)建時(shí)，采用可擴(kuò)展語(yǔ)言，以資源描述框架為支持，模擬專家的知識(shí)及經(jīng)驗(yàn)，進(jìn)而有效集成領(lǐng)域本體知識(shí)并科學(xué)建設(shè)本體結(jié)構(gòu)。本文所設(shè)計(jì)的信息檢索系統(tǒng)，可在深度解析語(yǔ)義的基礎(chǔ)上實(shí)現(xiàn)信息快速檢索，能夠高效、精準(zhǔn)查詢與利用數(shù)字圖書館的信息資源。

參考文獻(xiàn)：

[1] 佘俊，羅勇，余少鋒，等.基于語(yǔ)義理解和AI的電力設(shè)備信息檢索方法[J].電子設(shè)計(jì)工程，2022，30（22）：89-92，98.

[2] 龍彥.基于語(yǔ)義的公共圖書館信息資源檢索平臺(tái)優(yōu)化研究[D].湘潭：湘潭大學(xué)，2021.

[3] 張婷.旅游領(lǐng)域本體構(gòu)建及語(yǔ)義檢索研究[D].太原：太原理工大學(xué)，2020.

[4] 簡(jiǎn)芳洪.融合主題語(yǔ)義的信息檢索模型研究[D].武漢：華中師范大學(xué)，2020.

[5] 徐凱斌.基于潛在語(yǔ)義分析的多語(yǔ)種信息檢索系統(tǒng)的研究與實(shí)現(xiàn)[D].延吉：延邊大學(xué)，2019.

[6] 王浩林.基于張量分解和語(yǔ)義網(wǎng)的醫(yī)學(xué)信息檢索和推薦系統(tǒng)[D].北京：中國(guó)科學(xué)院大學(xué)（中國(guó)科學(xué)院重慶綠色智能技術(shù)研究院），2018.

科技創(chuàng)新與應(yīng)用2024年16期

科技創(chuàng)新與應(yīng)用的其它文章: 電力行業(yè)預(yù)制式全氟己酮滅火系統(tǒng)現(xiàn)場(chǎng)應(yīng)用研究; 糧食平方倉(cāng)KP1型厚多孔磚砌體施工工藝及控制要點(diǎn); 燃?xì)夤艿离S橋敷設(shè)安全措施總結(jié); 城市高壓交流輸電線路對(duì)電磁環(huán)境的影響研究; 核火箭發(fā)動(dòng)機(jī)技術(shù)特點(diǎn)研究及應(yīng)用前景展望; 單樁豎向靜載試驗(yàn)異常在某工程中的處理及應(yīng)用分析