亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于本體的興趣模型和語義相似度計算方法的研究

        2018-11-15 01:33:54阮懷偉胡松華陳艷平鄒樂
        電腦知識與技術 2018年20期
        關鍵詞:本體個性化

        阮懷偉 胡松華 陳艷平 鄒樂

        摘要:本文在基于知識本體庫的基礎上,提出了個性化用戶模型的興趣樹構建方法,并在此基礎上提出了基于WordNeT的語義相似度計算方法,為個性化服務提供理論指導,與其他方法相比,本文提出的方法可以為個性化用戶提供更為精準的推送服務。

        關鍵詞:本體;興趣模型;個性化;語義相似度

        中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2018)20-0183-03

        1 領域本體知識庫和語義相關度的理論與方法

        隨著計算機在信息化方面的應用,人們對數(shù)字信息的處理需求越來越高。信息技術開始面臨知識表示、信息組織和軟件復用等各種新的挑戰(zhàn)。特別是互聯(lián)網(wǎng)的迅速發(fā)展,使得組織、管理和維護海量信息,為用戶提供有效的服務成了一個重要而緊迫的研究課題[1-4]。為了適應信息化處理需求,出現(xiàn)了一個新的概念,本體(Ontology)作為一種能夠在知識層面和語義層面描述信息系統(tǒng)的建模工具,引起了國內(nèi)外許多研究者的關注,并被廣泛應用于計算機等知識領域[5-7]。

        動態(tài)數(shù)字語義標引技術主要通過對本體資源的語義標注,充分挖掘用戶感興趣和需要的資源,為用戶推送個性化的學習資源和學習計劃等。主要在于建立資源領域本體,對資源進行語義標注、審核、加工等,利用本體建立實體與知識點的關聯(lián)關系,知識點與資源的關聯(lián)關系,最終為個性化推送服務。

        在領域本體知識庫方面,當前本體建模缺乏邏輯層知識表達的問題,一般方法是通過闡釋符號與符號過程的概念,聯(lián)系符號框架理論,將知識表達和關聯(lián)過程分為3個維度,即語法、語義、語用的應用。另外一個是語義相關度計算,是信息檢索、文檔分類和聚類、推薦系統(tǒng)、機器學習等諸多領域,仍然存在一些關鍵技術亟待解決。

        2 基于本體的個性化用戶模型—“興趣樹”構建方法

        在基于本體領域資源的基礎上,提出了一種基于本體的個性化用戶模型——興趣樹構建的平衡方法。核心內(nèi)容是:基于已經(jīng)構建了信息系統(tǒng)的領域本體,通過領域本體中的概念關系描述用戶模型,并選擇用戶模型中最廣泛的“直接關系”和“對等關系”,從而形成用戶模型,一棵樹狀的“興趣樹”?!芭d趣樹”的具體思想是在構建良好的領域本體的基礎上為用戶提供固定的興趣點,然后分析用戶的URL屬性,并利用屬性中包含的概念構造用戶興趣樹[8-10]。構建的用戶模型以用戶個人信息和用戶興趣樹的形式呈現(xiàn)。用戶模型的具體構建過程如圖1所示。

        3 基于WordNeT的語義相似度計算方法

        語義相似度的計算需要先確定語義信息的含義,并使用各種語義信息,包括距離、信息系數(shù)IC(Information Coefficient)、深度、語義關系和概念特征。距離是最簡單、最直觀的語義信息。在現(xiàn)有的研究中,都設置了所有的混合語義相似度。相似度的計算方法利用距離的語義信息進行計算。本文提出的計算方法也是一種距離相關計算方法。該距離分為江提出的實際物理距離和語義距離[11-12]。本文提出了一種新的語義相似度計算方法:

        [Sim(c1,c2)=e-(α×L(path)+β×L(IC))] (1)

        式中的參數(shù)說明如下,其中[L(IC)]為與信息系數(shù)IC有關的函數(shù),[L(path)]為最短路徑距離相關的函數(shù),和語義距離相關的函數(shù),[α]和[β]為參數(shù),參數(shù)范圍為[α>0],[β>0]。[L(IC)]與Jiang定義的語義距離公式相同,即:

        [L(IC)=IC(c1)+IC(c2)-2×IC(LCS(c1,c2))] (2)

        其中[IC(c1)]和[IC(c2)]為分別表示本體概念[c1],[c2]的IC值,[LCS(c1,c2)]為[c1],[c2]的公共包含,[IC(LCS(c1,c2))]為概念[c1],[c2]的最小公共包含IC值。公式中的所有IC的計算方法均使用新的IC計算方法。

        為了確定最短路徑距離[L(path)]對語義相似度的影響,本文給出如下兩種[L(path)]的計算方法:

        (1)方法1:

        [L(path)=Distance(c1,c2)2×Depthmax] (3)

        (2)方法2:

        [L(path)=log(Distance(c1,c2)+1)log(2×Depthmax+1)] (4)

        其中[Distance(c1,c2)]表示兩個概念結點[c1],[c2]的最短路徑距離,[Depthmax]為WordNet的最大深度。在計算IC的過程中,使用了諸如深度和密度等語義信息,在語義相似度的計算中使用最短路徑距離和深度,因此所提出的方法屬于混合語義相似度計算方法[13]。

        4 個人偏好模型構建和個性化推送服務

        4.1 個人偏好模型構建

        根據(jù)語義本體和相似度計算方法,個人偏好模型知識來源如圖2所示,分為5個步驟:

        1) 首先根據(jù)個人知識空間、個人顯性信息、個人隱性信息構建個人偏好模型;

        2) 基于個人偏好模型,在教材資源、圖書資源、試題資源和視音資源的支持下,進行基于偏好、知識點和主題的資源聚合;

        3) 然后進行基于偏好的、面向不同用戶和不同主題的個性化出版;

        4) 接著偏好統(tǒng)計分析;

        5) 最后優(yōu)化個人偏好信息和偏好模型,從而實現(xiàn)后續(xù)的個性化出版優(yōu)化。

        從圖2可以看出,主要分為5個部分,分別為:個人信息空間,個人知識空間,個人顯性信息,個人隱性信息,個人偏好信息。各部分的具體功能為:

        1) 個人知識空間:個人知識空間記錄學生在當前階段已經(jīng)掌握的知識或者技能。

        2) 個人顯性信息:顯性信息是指用戶注冊系統(tǒng)時所填寫的信息,例如姓名、年級、聯(lián)系方式等。

        3) 個人隱性信息:隱性信息是指用戶在學習過程中對某個知識點學習頻率、學習時間等網(wǎng)絡日志的記錄以及用戶在學習過程中對不同資源類型(如視頻、文檔等)使用度等。

        4) 個人偏好信息:通過對用戶的顯性信息以及隱性信息進行挖掘分析客戶的偏好信息。

        將圖中的個人知識空間、顯性信息、隱性信息構成個人的偏好信息,利用偏好信息構建個人偏好模型。個人偏好模型構建的流程如圖3所示。

        個人偏好模型構建的流程包括:

        1) 用戶需要創(chuàng)建個人賬戶,注冊個人基本信息,并可以隨時修改自己的信息資料,生成個人顯性信息,并初始化成用戶偏好信息;

        2) 然后通過網(wǎng)絡日志記錄用戶的學習行為,從而挖掘出用戶的隱性信息,用戶顯性信息與隱性信息構成偏好信息;

        3) 最后通過用戶顯性信息與隱性信息的不斷變化來更新用戶偏好信息,進而形成用戶的偏好模型。

        4.2 基于個人偏好的資源聚合

        在構建了用戶偏好模型后,就可以對基于偏好的資源進行聚合,其聚合過程如圖4所示。

        基于偏好的資源整合具體流程為:

        1) 用戶登錄后,系統(tǒng)會自動讀取用戶的偏好模型;

        2) 根據(jù)用戶的偏好信息讀取已經(jīng)標注的試題、教材、圖書和視音頻等資源信息;

        3) 若資源符合偏好模型則進行資源聚合,如果不是則繼續(xù)讀取資源;

        4) 當所有的資源都已經(jīng)讀取完畢則結束,此時基于偏好的資源聚合過程完成。

        4.3 基于用戶偏好的個性化資源推送服務

        根據(jù)不同用戶的偏好模型推薦相應的資源,以使得用戶能夠及時有效的獲得自己感興趣的資源。例如用戶A偏好于視頻類資源,用戶B喜歡文檔類的資源,系統(tǒng)就分別推薦相應所偏好的資源,而不是由系統(tǒng)統(tǒng)一的推送同一類資源。

        5 結論

        本文首先介紹了國內(nèi)外領域本體知識庫的相關理論與方法。接著,具體闡述了構建用戶模型和構建領域本體的“興趣樹”構建方法的相關理論。然后基于已有的WordNet語義相似度計算方法,提出了一種基于混合式WordNeT的語義相似度計算方法。最后,本文對所構建的用戶模型和語義相似度計算方法,用于用戶興趣模型的建立和個性化資源聚合服務,并結合具體實例論證所構建的用戶模型和語義計算度的可行性。

        參考文獻:

        [1] 曹恬,周麗,張國煊.一種基于詞共現(xiàn)的文本相似度計算[J].計算機工程與科學,2007(3):52-53.

        [2] 潘謙紅,王炬,史忠植.基于屬性論的文本相似度計算[J].計算機學報,1999(6):651-655.

        [3] 戴弘寧,文貴華,丁月華,等.非結構化數(shù)據(jù)的可視化編輯系統(tǒng)[J].計算機應用研究,2003(6):75-76.

        [4] 尹坤,尹紅風,楊燕,賈真.基于Sim Rank的百度百科詞條語義相似度計算[J].山東大學學報:工學版,2014(3):29-35.

        [5] 于東,荀恩東.基于Word Embedding語義相似度的字母縮略術語消歧[J].中文信息學報,2014(5):51-59.

        [6] 吳奎,周獻中,王建宇,趙佳寶. 基于貝葉斯估計的概念語義相似度算法[J].中文信息學報,2010,02:52-57.

        [7] 蔡圓媛,盧葦.基于低維語義向量模型的語義相似度度量[J].中國科學技術大學學報,2016(9):719-726.

        [8] 魏韡,向陽,陳千.計算術語間語義相似度的混合方法[J].計算機應用,2010(6):1668-1670.

        [9] 曾琦,周剛,蘭 明敬,等.一種多義詞詞向量計算方法[J].小型微型計算機系統(tǒng),2016(7):1417-1421.

        [10] 李青,陳陽,謝浩然,等.一種基于文本相似度矩陣運算的非結構化海量投訴數(shù)據(jù)分類算法[J].計算機工程與科學,2012(1):103-107.

        [11] Mihalcea R,Corley C,Strapparava C.Corpus-based and Knowledge-based Measures of Text Semantic Similarity[C]//National Conference on Artificial Intelligence and the Eighteenth Innovative

        Applications of Artificial Intelligence Conference,July 16-20,2006,Boston, Massachusetts, Usa. DBLP, 2006:775-780.

        [12] Thomas K Landauer,Peter W.Foltz,Darrell Laham.An introduction to latent semantic analysis[J].Discourse Processes,1998,25(2-3):259-284.

        [13] Gabrilovich E,Markovitch S.Wikipedia-based Semantic Interpretation for Natural Language Processing[J].Journal of Artificial Intelligence Research,2014,34(4):443-498.

        猜你喜歡
        本體個性化
        Abstracts and Key Words
        哲學分析(2023年4期)2023-12-21 05:30:27
        對姜夔自度曲音樂本體的現(xiàn)代解讀
        中國音樂學(2020年4期)2020-12-25 02:58:06
        堅持個性化的寫作
        文苑(2020年4期)2020-05-30 12:35:12
        新聞的個性化寫作
        新聞傳播(2018年12期)2018-09-19 06:27:10
        上汽大通:C2B個性化定制未來
        《我應該感到自豪才對》的本體性教學內(nèi)容及啟示
        文學教育(2016年27期)2016-02-28 02:35:15
        滿足群眾的個性化需求
        《寒風吹徹》的個性化解讀
        語文知識(2014年4期)2014-02-28 21:59:48
        專題
        圖書與情報(2013年1期)2013-11-16 22:24:00
        Care about the virtue moral education
        卷宗(2013年6期)2013-10-21 21:07:52
        77777亚洲午夜久久多人| 欲女在线一区二区三区| 挺进邻居丰满少妇的身体| 亚洲欧美日本| 老熟女一区二区免费| 久久精品国产黄片一区| 日韩视频在线观看| 亚洲春色在线视频| 99热在线精品播放| 国内自拍视频在线观看h| 国产天堂av在线一二三四| 丰满少妇a级毛片野外| a在线免费| 国产99久久久国产精品免费| 一区二区三区国产黄色| 国产精品h片在线播放| 最新亚洲精品国偷自产在线| 亚洲无码vr| 亚洲一区二区三区偷拍视频| 国产成人综合亚洲看片| 国产黑丝在线| 久久久亚洲精品蜜臀av| 亚洲精品有码日本久久久| 欧洲美女黑人粗性暴交| 99福利网| 国产三级一区二区三区在线观看| 亚洲国产性夜夜综合另类| 日本三级欧美三级人妇视频黑白配| 久久久久亚洲av无码尤物| 蜜桃视频在线免费观看完整版| 人妻经典中文字幕av| 妺妺窝人体色www看美女| 国产啪精品视频网给免丝袜| 久久青青草视频免费观看| 日韩av一区二区观看| 99精品国产一区二区三区不卡| 久久久久亚洲精品无码网址| 亚洲蜜芽在线精品一区| 亚洲高清一区二区三区在线播放 | 国产AV边打电话边出轨| 91青青草免费在线视频|