亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于領(lǐng)域本體的資源反饋檢索模型研究

        2015-01-17 09:32:14林麗姝
        電腦與電信 2015年3期
        關(guān)鍵詞:關(guān)鍵字資源庫(kù)實(shí)例

        林麗姝

        (海南經(jīng)貿(mào)職業(yè)技術(shù)學(xué)院,海南 海口 571127)

        一種基于領(lǐng)域本體的資源反饋檢索模型研究

        林麗姝

        (海南經(jīng)貿(mào)職業(yè)技術(shù)學(xué)院,海南 海口 571127)

        針對(duì)現(xiàn)有資源平臺(tái)無(wú)法互通共享資源,資源庫(kù)檢索系統(tǒng)僅依靠用戶輸入的單詞關(guān)鍵字描述檢索資源而無(wú)法挖掘用戶需求中的語(yǔ)義信息的問(wèn)題,提出了一種基于本體的資源反饋檢索模型。該模型通過(guò)構(gòu)建本體、概念相似度計(jì)算、查詢關(guān)鍵字?jǐn)U展等關(guān)鍵技術(shù),利用了用戶多次反饋中的包含語(yǔ)義知識(shí),滿足了用戶的查詢需求。實(shí)驗(yàn)表明,該模型能夠有效提高檢索的性能。

        領(lǐng)域本體;資源檢索;知識(shí)反饋

        1 引言

        現(xiàn)代信息的發(fā)展引起了資源的爆發(fā),同時(shí)為了更好地使用資源、利用資源,很多機(jī)構(gòu)特別是教育部門都積極地建立起資源檢索平臺(tái),以達(dá)到資源共享的作用。每個(gè)資源檢索平臺(tái)都“各自為政”,資源的重復(fù)不可避免,但又因?yàn)樽陨斫ㄔO(shè)特色所限,無(wú)法囊括所有的特色資源,沒(méi)法給用戶一個(gè)“一站式”搜索的體驗(yàn)。所有用戶有時(shí)為了滿足自己的需求,甚至要登陸多個(gè)信息檢索平臺(tái)多次搜尋,造成了時(shí)間和精力的浪費(fèi)。

        在傳統(tǒng)的資源檢索系統(tǒng)中,只能針對(duì)某個(gè)資源庫(kù)平臺(tái)來(lái)進(jìn)行。而資源存放目錄、學(xué)科分類等分類方式摻雜了太多人為的主觀意念。往往同一個(gè)資源在不同的資源庫(kù)平臺(tái)中的存放規(guī)則不同,資源所屬的分類也會(huì)有差異,這樣就造成用戶也不能通過(guò)相同的搜索規(guī)則來(lái)進(jìn)行查詢同一類的資源。資源庫(kù)平臺(tái)之間的共享共用也幾乎成了一句空話。即使是使用關(guān)鍵字進(jìn)行資源檢索,如果用戶不能準(zhǔn)確地使用關(guān)鍵字來(lái)描述目標(biāo)資源,那么檢索系統(tǒng)更難以理解用戶的意圖,更不能通過(guò)知識(shí)推理來(lái)進(jìn)行關(guān)鍵字的語(yǔ)義匹配,無(wú)法實(shí)現(xiàn)智能化的資源檢索。

        針對(duì)目前高校建立的教學(xué)資源庫(kù)平臺(tái)存在的資源難以共享和檢索效率低下問(wèn)題,提出一種基于本體的資源反饋檢索模型。該檢索模型嘗試基于領(lǐng)域本體來(lái)構(gòu)建,用戶可以通過(guò)該檢索平臺(tái)同時(shí)連接檢索各高校教學(xué)資源平臺(tái)。用戶不需要多次登錄,即可同時(shí)在多個(gè)教學(xué)資源平臺(tái)中找到合適的資源。該模型的特色在于借助概念相似度算法和查詢關(guān)鍵字?jǐn)U展,并將用戶在檢索過(guò)程中的語(yǔ)義反饋反映到檢索模型當(dāng)中,能夠解決目前高校資源平臺(tái)存在的信息鴻溝和信息重用等問(wèn)題,提高檢索效率,使信息資源得到有效的利用和科學(xué)的管理。

        2 資源反饋檢索模型

        在進(jìn)行資源檢索時(shí),用戶不但希望能夠過(guò)濾掉無(wú)用的干擾信息,也希望能夠高效率地得到有價(jià)值的、符合自身要求的資源,以便幫助自己解決問(wèn)題。本體(Ontology)能夠準(zhǔn)確地描述資源的語(yǔ)義含義,使用基于領(lǐng)域的本體模型,可以在語(yǔ)義層次上描述資源,從而能夠?qū)崿F(xiàn)Web語(yǔ)義檢索。

        通過(guò)領(lǐng)域本體的構(gòu)建,利用本體作為一種能夠?qū)崿F(xiàn)語(yǔ)義理解的有效方法的優(yōu)勢(shì),對(duì)用戶的查詢請(qǐng)求進(jìn)行相似度計(jì)算、語(yǔ)義擴(kuò)展,使得用戶每次的反饋得到不斷優(yōu)化,最后檢索到的結(jié)果能夠通過(guò)反映出用戶語(yǔ)義層次上要求的信息。同時(shí),基于本體的構(gòu)建方式,不同資源庫(kù)平臺(tái)的資源的共享工作不再受限于資源存放規(guī)則,只要描述關(guān)鍵字能夠準(zhǔn)確體現(xiàn)出資源的內(nèi)容和特點(diǎn),那就可以達(dá)到在檢索平臺(tái)“一站式”檢索到多個(gè)資源庫(kù)平臺(tái)有價(jià)值資源的效果。

        整個(gè)檢索模型的框架如圖1所示。

        圖1 檢索模型框架

        基于領(lǐng)域本體的資源反饋檢索模型與傳統(tǒng)的檢索模型的區(qū)別和優(yōu)勢(shì)在于語(yǔ)義的運(yùn)用,現(xiàn)在使用一個(gè)例子進(jìn)行說(shuō)明。例如用戶需要搜索關(guān)于會(huì)計(jì)統(tǒng)計(jì)方面的Excel函數(shù)用法資料,但是又不是很清楚到底是哪個(gè)Excel函數(shù),這樣在傳統(tǒng)的教育資源檢索模型中,用戶大多只能通過(guò)以下方式進(jìn)行搜索:

        (1)通過(guò)學(xué)科目錄查找到計(jì)算機(jī)類資源的存放目錄,然后看著一堆的課程資源目錄,猜想資源存放的位置來(lái)挨個(gè)查看。

        (2)使用關(guān)鍵字“會(huì)計(jì)Excel函數(shù)”查詢,不能得到檢索系統(tǒng)任何的提示而進(jìn)一步地明確自己的檢索內(nèi)容。

        而采取基于領(lǐng)域本體的資源反饋檢索模型,則用戶無(wú)需查找資源的目錄分類和學(xué)科歸屬,只需要一步步地根據(jù)提示信息進(jìn)行反饋即可,檢索流程如下:

        (1)用戶輸入關(guān)鍵字“會(huì)計(jì)Excel函數(shù)”,則檢索系統(tǒng)進(jìn)行語(yǔ)義擴(kuò)展,在人機(jī)界面給用戶展示“會(huì)計(jì)”類和“統(tǒng)計(jì)”類中最常用excel函數(shù)如“PV函數(shù)”和“Count If函數(shù)”等關(guān)鍵字,并給出與這些關(guān)鍵字匹配的資源列表。

        (2)用戶根據(jù)資源列表查詢,如果覺(jué)得Count If函數(shù)更加貼切自己的表達(dá)需求,則可以再次輸入關(guān)鍵字為“Count If函數(shù)”和“統(tǒng)計(jì)”,則系統(tǒng)再次進(jìn)行語(yǔ)義檢索,查找統(tǒng)計(jì)類函數(shù)中所有和“Count If”函數(shù)相似度最大的資源,并給用戶列出。

        由此可以看出,基于領(lǐng)域本體的資源反饋檢索模型通過(guò)用戶反饋的方式,能夠利用用戶的語(yǔ)義信息進(jìn)行擴(kuò)展,從而避免了用戶在龐大的資源庫(kù)大海撈針的茫然搜索。

        3 關(guān)鍵技術(shù)

        3.1 語(yǔ)義檢索

        語(yǔ)義檢索模塊是整個(gè)模型的核心,重點(diǎn)在于確定查詢關(guān)鍵字與資源實(shí)例的描述關(guān)鍵字之間的相似度,進(jìn)而確認(rèn)該資源是否符合用戶的需求。語(yǔ)義檢索建立在教育領(lǐng)域本體的基礎(chǔ)上,通過(guò)對(duì)教育領(lǐng)域本體的有效利用,計(jì)算查詢關(guān)鍵字與資源的描述關(guān)鍵字之間的相似度并進(jìn)行對(duì)比,以滿足用戶和智能檢索系統(tǒng)的需求。

        需要注意的是,資源實(shí)例的描述關(guān)鍵字要遵循針對(duì)性和獨(dú)立性兩個(gè)原則,即關(guān)鍵字之間沒(méi)有明顯的包含關(guān)系,并且能夠正確地描述實(shí)例的特點(diǎn)。描述關(guān)鍵字的粒度劃分關(guān)系到用戶對(duì)資源實(shí)例的搜索,因此資源擁有者正確設(shè)置資源實(shí)例的描述關(guān)鍵字尤其重要。

        定義C={G,Q}描述資源庫(kù)中的所有資源實(shí)例,其中:

        描述關(guān)鍵詞列表:G=(g1,g2,…,gi),gi為描述資源實(shí)例C的第i(4≥i≥1)個(gè)關(guān)鍵字。在實(shí)際應(yīng)用中,每個(gè)資源實(shí)例的描述關(guān)鍵字一般為2至4個(gè)就可以很好地描述該資源的特點(diǎn)和內(nèi)容。

        權(quán)值列表:Q=(q1,q2,…,qi),qi表示gi關(guān)鍵字在描述資源實(shí)例C中的相關(guān)度,或是權(quán)值,q1+q2+…+qi=1。

        同理,定義R={T,Y}描述目標(biāo)資源實(shí)例,其中T={t1,t2,……,tk},Y=(y1,y2,…,yk)(4≥k≥1),tk為目標(biāo)資源實(shí)例的第k個(gè)描述關(guān)鍵字,yk為tk的權(quán)值,y1+y2…+yk=1。

        在人機(jī)交互頁(yè)面,用戶可以通過(guò)機(jī)構(gòu)分類、學(xué)科分類等方式進(jìn)行初步的資源檢索,還可以通過(guò)關(guān)鍵字進(jìn)行查詢。使用關(guān)鍵字進(jìn)行語(yǔ)義匹配檢索的流程圖如圖2所示。

        圖2 語(yǔ)義匹配檢索的流程

        以下是語(yǔ)義匹配檢索的步驟:

        Step1用戶在人機(jī)交互頁(yè)面輸入一個(gè)可以描述目標(biāo)資源R的屬性關(guān)鍵字t,即目標(biāo)資源R={T,Y},其中T={t},Y={1}。

        Step2查找系統(tǒng)中所有的教育資源,計(jì)算教育資源與用戶需求的相關(guān)度,定義Sim(tk,gi)為關(guān)鍵字tk和gi的相似度,根據(jù)相似度計(jì)算公式[],則可以得到資源實(shí)例C和目標(biāo)實(shí)例R的相似度

        Step3按照相似度S的大小順序?qū)⒎弦蟮馁Y源實(shí)例返回給用戶。

        Step4檢索結(jié)果符合預(yù)期目標(biāo),則用戶結(jié)束檢索,下載需要的資源;否則用戶在輸入框中重新調(diào)整描述關(guān)鍵字為t1,進(jìn)入用戶反饋關(guān)鍵字?jǐn)U展模塊進(jìn)行處理,檢索平臺(tái)更新目標(biāo)資源實(shí)例R={T',Y'},繼續(xù)Step2。

        本體可以看作是一個(gè)有向圖,概念是圖中的節(jié)點(diǎn),概念間的語(yǔ)義關(guān)系是圖中的有向邊。直覺(jué)上,本體上語(yǔ)義關(guān)系中蘊(yùn)含著一定的語(yǔ)義相關(guān)度,所以本體上語(yǔ)義相關(guān)度的計(jì)算應(yīng)該和有向邊上的語(yǔ)義關(guān)系聯(lián)系起來(lái)[2]。要計(jì)算本體網(wǎng)絡(luò)中概念之間的相似度Sim(tk,gi),應(yīng)該利用它們之間的語(yǔ)義關(guān)系,綜合使用基于結(jié)構(gòu)的概念相似度計(jì)算方法和基于屬性的概念相似度計(jì)算方法[3]。

        對(duì)于以上兩種相似度計(jì)算方法都設(shè)置一個(gè)權(quán)值,最終得到一個(gè)綜合的概念相似度。

        3.2 用戶反饋關(guān)鍵字?jǐn)U展

        用戶再次輸入描述目標(biāo)資源實(shí)例的關(guān)鍵字時(shí),反饋關(guān)鍵字?jǐn)U展模塊的任務(wù)就是進(jìn)行語(yǔ)義關(guān)系計(jì)算,以深層次地挖掘語(yǔ)義內(nèi)涵,更加貼切地表達(dá)用戶的需求,從而產(chǎn)生擴(kuò)展關(guān)鍵字列表和對(duì)應(yīng)的權(quán)值列表來(lái)進(jìn)一步描述目標(biāo)資源實(shí)例。

        語(yǔ)義關(guān)系計(jì)算包含了語(yǔ)義等價(jià)關(guān)系、語(yǔ)義父子關(guān)系和語(yǔ)義關(guān)聯(lián)關(guān)系,對(duì)前后兩次描述目標(biāo)資源實(shí)例的關(guān)鍵字t和t1之間的每一種語(yǔ)義關(guān)系采取不同的擴(kuò)展關(guān)鍵字搜索策略,將指定搜索范圍內(nèi)的關(guān)鍵字納入候選擴(kuò)展關(guān)鍵字集合W,并對(duì)候選擴(kuò)展關(guān)鍵字集合中的關(guān)鍵字進(jìn)行概念相似度計(jì)算。

        提取概念相似度值最大前4個(gè)擴(kuò)展關(guān)鍵字組成最終的擴(kuò)展關(guān)鍵字列表T'={t'1,t'2,……,t'k},權(quán)值列表為Y'={y'1,y'2,…,y'k}(4≥k≥1)。其中,y'k權(quán)值按照t'k/∑t'k進(jìn)行分配,以此來(lái)更新目標(biāo)資源實(shí)例R={T',Y'}。

        4 結(jié)語(yǔ)

        資源庫(kù)的建立是為了能夠達(dá)到資源共享共建共用,提出的基于本體的資源反饋檢索模型采用了領(lǐng)域本體的統(tǒng)一表示方式,多個(gè)資源信息平臺(tái)通過(guò)檢索模型得到了整合,同時(shí)以將用戶反饋的關(guān)鍵字進(jìn)行語(yǔ)義分析后得到概念相似度為依據(jù),進(jìn)行目標(biāo)資源描述關(guān)鍵字?jǐn)U展,從而使得逐步得到檢索結(jié)果更加貼近用戶的需求,實(shí)驗(yàn)證明,檢索模型的查全率和查準(zhǔn)率都有了一定的提高,驗(yàn)證了該檢索模型的可靠性。

        但是,概念相似度計(jì)算是檢索模型的核心,相似度計(jì)算算法仍需不斷地挖掘關(guān)鍵字屬性之間的語(yǔ)義關(guān)系進(jìn)行完善,引入自然計(jì)算到檢索模型中將是下一步的重點(diǎn)工作。

        [1]鄧志鴻,唐世渭,張銘.Ontology研究綜述[J].北京大學(xué)學(xué)報(bào):自然科學(xué)版,2002,38(5):730-738.

        [2]田首,杜小勇,李海華.一種基于語(yǔ)義關(guān)系計(jì)算領(lǐng)域本體中概念間語(yǔ)義相關(guān)度的方法關(guān)[J].計(jì)算機(jī)科學(xué),2007,34(10):172-173.

        [3]李榮,楊冬,劉磊.基于本體的概念相似度計(jì)算方法研究[J].計(jì)算機(jī)研究和發(fā)展,2011,48(增刊):312-317.

        [4]Ehring M,Sure Y.Ontology mapping-an integrated approach// LNCS 3053:Proc of the 1st European Semantic Web Symp.Berlin:Springer 2004:76-91.

        [5]石林,徐飛,徐守坤.基于用戶興趣建模的個(gè)性化推薦[J].計(jì)算機(jī)應(yīng)用與軟件,2013,30(12):211-214.264.

        [6]蘇雪陽(yáng),左萬(wàn)利,王俊華.基于本體與模式的網(wǎng)絡(luò)用戶興趣挖掘[J].電子學(xué)報(bào),2014,42(8):1556-1563.

        [7]Bin Tan,et al.Mining long-lasting exploratory user interests from search history[C].CIKM'12 Proceedings of the19th ACM international conference on Information and knowledge management.New York,USA,2012:1477-1481.

        [8]張滬寅,張銘洋,李鑫.基于領(lǐng)域本體的電子學(xué)習(xí)資源庫(kù)模型[J].計(jì)算機(jī)應(yīng)用,2012,32(1):191-195.

        [9]林麗姝,林珍,劉露思.基于本體與粗糙集的教育資源檢索模型的關(guān)鍵技術(shù)研究[J].實(shí)驗(yàn)技術(shù)與管理,2012,29(10):123-125.

        [10]蔣勇,譚懷亮,李光文.基于量子遺傳算法的XML聚類方法[J].計(jì)算機(jī)應(yīng)用,2011,31(2):446-449.

        Research on Resource Feedback Retrieval Model Based on Ontology

        Lin Lishu
        (Hainan College of Economics and Business,Haikou 571127,Hainan)

        act】Focused on the problems of poor efficiency of the traditional retrieval systems which can not detect semantic information from user's keywords,a resource feedback retrieval model is proposed in this paper.The main idea of the model is to use the technology of ontology construction and semantic annotation and expansion keywords which can use semantic knowledge form user's feedback to meet user's needs.The experimental results show that the retrieval performance can be improved effectively.

        domain ontology;resource retrieval;knowledge feedback

        TP391

        A

        1008-6609(2015)03-0031-03

        林麗姝,女,海南臨高人,碩士,副教授,研究方向:知識(shí)工程、創(chuàng)新設(shè)計(jì)。

        海南省教育科學(xué)規(guī)劃課題,項(xiàng)目編號(hào):NO.QJY125048。

        猜你喜歡
        關(guān)鍵字資源庫(kù)實(shí)例
        履職盡責(zé)求實(shí)效 真抓實(shí)干勇作為——十個(gè)關(guān)鍵字,盤(pán)點(diǎn)江蘇統(tǒng)戰(zhàn)的2021
        健身氣功開(kāi)放課程資源庫(kù)建設(shè)研究
        成功避開(kāi)“關(guān)鍵字”
        貴州●石斛種質(zhì)資源庫(kù)
        高中歷史信息化教育資源庫(kù)應(yīng)用探索
        福建基礎(chǔ)教育教學(xué)資源庫(kù)建設(shè)研究——以福建基礎(chǔ)教育網(wǎng)資源庫(kù)為例
        完形填空Ⅱ
        完形填空Ⅰ
        基于用戶反饋的關(guān)系數(shù)據(jù)庫(kù)關(guān)鍵字查詢系統(tǒng)
        誘導(dǎo)性虛假下載鏈接不完全評(píng)測(cè)
        国产精品农村妇女一区二区三区| 中文字幕亚洲精品在线| 国产免费网站在线观看不卡| 久久成人国产精品一区二区| 精品国产偷窥一区二区| 久久久久国产综合av天堂| 亚洲狠狠婷婷综合久久久久图片| 首页动漫亚洲欧美日韩| 亚洲日产无码中文字幕| 色佬易精品视频免费在线观看| 日韩精品中文字幕第二页| 美女mm131爽爽爽| 少妇寂寞难耐被黑人中出| 国产一区二区波多野结衣| 国产亚洲欧美精品一区| 国产一区二三区中文字幕| 中文字幕一区二区三区四区| 久久精品免费一区二区喷潮| 日韩av无码精品一二三区| 亚洲熟女乱色综合亚洲图片| 97免费人妻在线视频| 亚洲欧洲精品成人久久曰不卡| 青榴社区国产精品| 亚洲黑寡妇黄色一级片| 亚洲成年国产一区二区| 久久综合亚洲色hezyo国产| 国产又爽又黄的激情精品视频| 亚洲区1区3区4区中文字幕码| 凹凸世界视频a一二三| 一区二区三区视频在线观看| 亚洲午夜久久久久久久久电影网| 少妇厨房愉情理伦片免费 | 久久天天躁夜夜躁狠狠躁2022| 中文字幕巨乱亚洲| 精品国产一区二区三区久久狼| 日本人视频国产一区二区三区| 中文乱码字慕人妻熟女人妻| 国产精品高清视亚洲乱码有限公司| 国产三级视频在线观看国产| 国产成人av一区二区三区在线观看| 老少交欧美另类|