亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        關(guān)系概念的Web資源語義標(biāo)識(shí)模型研究*

        2016-08-31 09:06:21程春雷夏家莉江西財(cái)經(jīng)大學(xué)信息管理學(xué)院南昌330032江西中醫(yī)藥大學(xué)計(jì)算機(jī)學(xué)院南昌330004
        計(jì)算機(jī)與生活 2016年8期

        程春雷,夏家莉.江西財(cái)經(jīng)大學(xué) 信息管理學(xué)院,南昌 330032 2.江西中醫(yī)藥大學(xué) 計(jì)算機(jī)學(xué)院,南昌 330004

        關(guān)系概念的Web資源語義標(biāo)識(shí)模型研究*

        程春雷1,2+,夏家莉1
        1.江西財(cái)經(jīng)大學(xué) 信息管理學(xué)院,南昌 330032 2.江西中醫(yī)藥大學(xué) 計(jì)算機(jī)學(xué)院,南昌 330004

        CHENG Chunlei,XIA Jiali.Research on semantic annotation model of Web resources based on relational concept.Journal of Frontiers of Computer Science and Technology,2016,10(8):1092-1103.

        摘要:Web環(huán)境下資源內(nèi)容豐富,形式多樣,描述標(biāo)準(zhǔn)不一,組織結(jié)構(gòu)離散,既有標(biāo)識(shí)方法存在語義單一,缺乏領(lǐng)域知識(shí)背景或人工參與度大等問題,限制了它們在個(gè)性化資源推薦和獲取中的應(yīng)用效果?;陉P(guān)系概念的激活擴(kuò)散以及資源分層語義標(biāo)識(shí)的思想,面向Web資源構(gòu)建了關(guān)系概念語義標(biāo)識(shí)模型(relational concept annotation model,RCAM)。RCAM模擬人類記憶激活擴(kuò)散過程,考慮記憶的加強(qiáng)與遺忘機(jī)制,由此實(shí)現(xiàn)資源更為動(dòng)態(tài)、個(gè)性化的關(guān)聯(lián)組織。RCAM中資源標(biāo)識(shí)以關(guān)系概念作為語義要素,以片段關(guān)系概念集為語義模式,標(biāo)識(shí)粒度靈活,語義邏輯相對完整,為Web資源標(biāo)識(shí)組織提供了新的研究思路。實(shí)驗(yàn)表明,RCAM能提供更多的領(lǐng)域知識(shí)背景,可適應(yīng)不同學(xué)習(xí)情景、學(xué)習(xí)個(gè)性下的資源動(dòng)態(tài)組織,并且針對開放的Web資源,具有更好的通用性、擴(kuò)展性。

        關(guān)鍵詞:網(wǎng)絡(luò)資源標(biāo)識(shí);關(guān)系概念;激活擴(kuò)散;關(guān)系概念標(biāo)識(shí)模型(RCAM)

        1 引言

        隨著用戶主導(dǎo)的Web2.0相關(guān)技術(shù)的發(fā)展以及數(shù)字化教育的持續(xù)推進(jìn),Web上各類資源的存量巨大,內(nèi)容豐富,增長迅速,特別是“互聯(lián)網(wǎng)+”技術(shù)在社會(huì)生活中的廣泛應(yīng)用,各種輔助學(xué)習(xí)方式也在技術(shù)變革中悄然發(fā)展,終端學(xué)習(xí)者對資源的獲取、貢獻(xiàn)與影響會(huì)越來越直接,由此必將進(jìn)一步推動(dòng)和強(qiáng)化資源的建設(shè)與開放。所有這些都對資源的有效獲取提出了更高的要求,但同時(shí),巨量的資源處在開放、動(dòng)態(tài)和多變的Internet環(huán)境下,位置分布,形式多樣,描述標(biāo)準(zhǔn)不一,針對特定學(xué)習(xí)目的,學(xué)習(xí)者往往較難實(shí)現(xiàn)有效的資源檢索與篩選。如何利用信息技術(shù)實(shí)現(xiàn)資源語義層面的自動(dòng)標(biāo)識(shí),關(guān)聯(lián)整合不同組織、不同形式的資源數(shù)據(jù),實(shí)現(xiàn)更為有效的資源組織和共享具有十分重要的理論研究和實(shí)用價(jià)值。

        近年來隨著生物科學(xué)在細(xì)胞微觀領(lǐng)域的研究進(jìn)展,認(rèn)知心理學(xué)家提出了人類記憶基于激活擴(kuò)散、抑制遺忘的認(rèn)知過程的假設(shè)[1]。該假設(shè)較好地解釋了人類眾多的認(rèn)知現(xiàn)象[1],該認(rèn)知過程應(yīng)用于計(jì)算機(jī)領(lǐng)域的資源標(biāo)識(shí),與其他計(jì)算機(jī)領(lǐng)域成熟的標(biāo)識(shí)、組織模型相比,其最大優(yōu)勢表現(xiàn)為模型的自組織性、模糊動(dòng)態(tài)性等特點(diǎn),與人類認(rèn)知方式更為接近,方便用戶認(rèn)知理解,針對開放的Web資源標(biāo)識(shí),具有更好的擴(kuò)展性?;谝陨咸攸c(diǎn),本文借助前期Web協(xié)作知識(shí)庫的關(guān)系概念研究[2],得到資源文本片段的主題集合。每個(gè)資源片段主題包括資源連通關(guān)系概念和外延關(guān)鍵詞,語義標(biāo)識(shí)既考慮關(guān)系概念外延詞條的精確語義,也考慮語義相對完整、復(fù)合的片段級語義,采用這些既存的領(lǐng)域關(guān)系概念背景對資源片段進(jìn)行基礎(chǔ)性模式標(biāo)注,從而就資源片段文本的主題模式進(jìn)行形式化構(gòu)建與擴(kuò)展。通過構(gòu)建可擴(kuò)散激活、遺忘衰減的資源語義標(biāo)識(shí)模型,可為學(xué)習(xí)者更好獲得資源以及資源轉(zhuǎn)向提供動(dòng)態(tài)模型能力支持。

        2 相關(guān)工作

        資源的標(biāo)識(shí)也稱為資源的元數(shù)據(jù),元數(shù)據(jù)作為一種有效的信息資源組織和管理工具,它不僅為信息對象提供描述信息,還具有定位、檢索、關(guān)聯(lián)和選擇等功能。國內(nèi)外已經(jīng)具有相對完備的元數(shù)據(jù)標(biāo)識(shí)規(guī)范,如Dublin Core元數(shù)據(jù)規(guī)范[3]、《教育資源建設(shè)技術(shù)規(guī)范》(CELTS-41)等。但由于Web資源開放性的特點(diǎn),采用手工或半手工元數(shù)據(jù)標(biāo)識(shí)工作量是難以想象的,由此限制了元數(shù)據(jù)規(guī)范在既有開放資源標(biāo)識(shí)中的使用效果。

        向量空間模型(vector space model,VSM)于20世紀(jì)70年代由Salton等人提出[4],成功地應(yīng)用于著名的SMART文本檢索系統(tǒng)。該模型將一文本使用離散的詞條向量來表達(dá),詞條在模型中假定為相互獨(dú)立。經(jīng)典的VSM為其他相關(guān)模型提供了思想基礎(chǔ),但針對資源的語義標(biāo)識(shí),單純的VSM模型還具有很大的局限性。資源描述框架模型(resource description framework,RDF)[5]對資源進(jìn)行統(tǒng)一的描述,其以類似“主—謂—客”的三元組結(jié)構(gòu)描述資源。但詞匯的含義、詞匯之間的關(guān)系,RDF模型并沒有刻畫。為此其擴(kuò)展模型RDFS(RDF schema)定義了一組標(biāo)準(zhǔn)類及屬性的層次關(guān)系詞匯,但RDFS不能描述詞與詞間的關(guān)系,難以適應(yīng)資源個(gè)性化推薦中深層次的語義標(biāo)識(shí)與組織的要求。主題圖標(biāo)識(shí)可追溯到20世紀(jì)90年代初[6],初衷是希望建立一個(gè)具有智能性的索引來幫助用戶組織和獲取電子文檔資源。一個(gè)主題圖包含主題(topic)、資源出處(occurrences)以及關(guān)聯(lián)(association)等特征。其很好地描述了知識(shí)之間的關(guān)系與資源的位置,但需要領(lǐng)域?qū)<业纳疃葏⑴c,存在主題及其關(guān)系自動(dòng)獲取困難等問題。本體思想也能較好地刻畫資源的語義主題[7-8],但采用本體標(biāo)識(shí)組織資源,需要預(yù)先構(gòu)建此目標(biāo)下的領(lǐng)域本體,本體推理過程基于一階邏輯推理框架,推理規(guī)則的構(gòu)建較為繁雜和嚴(yán)格,另外如何對本體質(zhì)量進(jìn)行有效評價(jià)也是一個(gè)難題。統(tǒng)計(jì)主題模型的基本思想是把文檔表示成多個(gè)隱含主題的概率分布,主題本身看成詞項(xiàng)集的概率分布,如LSI(latent semantic indexing)、pLSI (probabilistic LSI)、LDA(latent Dirichlet allocation)等模型[9-10],這些方法取得了較好的使用效果。但在開放環(huán)境下主題數(shù)量確定困難,計(jì)算量較大,在很多情況下,部分主題表達(dá)與人的理解會(huì)產(chǎn)生較大的偏差,難于滿足面向用戶的領(lǐng)域主題特征的描述、主題跳轉(zhuǎn)等需要。

        3 資源語義模型的建立

        經(jīng)典的形式背景為三元組K=(G,M,I)[11],其中G表示對象詞條,M表示值標(biāo)注詞條,I取值為0或1,表示G是否具有M屬性。為了增強(qiáng)在開放域概念與關(guān)系的綜合表達(dá)能力,對傳統(tǒng)形式背景進(jìn)行擴(kuò)展,提出了關(guān)系形式背景K=(G,M,RI)[2,12],其中G為詞條對象的集合,M為標(biāo)注關(guān)系取值的詞條集合,RI表示標(biāo)注關(guān)系。例如三元組(蝸鳶,脊索動(dòng)物門,門)∈K,蝸鳶∈G,脊索動(dòng)物門∈M,門∈RI,表示“蝸鳶”與“脊索動(dòng)物門”具有“門”的關(guān)系。并在此基礎(chǔ)上提出了關(guān)系概念模型(定義與運(yùn)算)[2,12],關(guān)系概念包括主體概念與客體概念,如類似上例可構(gòu)建主體概念<{門},{蝸鳶,棕噪鹛,…}>,該二元組分量分別表示主體概刺胞動(dòng)物門,念的內(nèi)涵與外延對象,<{門},{脊索動(dòng)物門,…}>,為客體概念的內(nèi)涵與外延對象。二元關(guān)系概念看成主體概念和客體概念一樣的特殊關(guān)系概念,如<{鳥類},{蝸鳶,禿鷲,…}>。關(guān)系概念的內(nèi)涵均為標(biāo)識(shí)關(guān)系RI,外延為關(guān)系中出現(xiàn)的所有被標(biāo)識(shí)主體詞條G或客體詞條M。

        在前期研究[2,12]中,基于百度百科豐富的形式背景(主要來自詞條條目與標(biāo)注數(shù)據(jù))與關(guān)系概念模型的緊密結(jié)合,對文本中的關(guān)鍵詞所屬關(guān)系概念進(jìn)行識(shí)別,并采用圖論中連通的思想,獲取文本的關(guān)系概念的連通主題,即文本主題采用一個(gè)關(guān)系概念向量表達(dá),向量元素按概念相關(guān)度降序排列,并保留主題關(guān)系概念對應(yīng)的主要原始詞條。例如某文本的關(guān)系概念向量Example1:(<社會(huì),1.000 000>,<法律, 0.522 495>,<國家,0.230 513>,<法律術(shù)語,0.127 628>,<動(dòng)漫形象,0.078 680>),及其對應(yīng)的原始文本詞條:(法律地位,外務(wù)部,會(huì)談,原則,居住權(quán),外國人,制度),上文關(guān)系概念相關(guān)度由原始文本詞條與對應(yīng)關(guān)系概念連通計(jì)算所得[2]。本文以上述關(guān)系概念與主題向量為標(biāo)識(shí)基礎(chǔ),構(gòu)建模擬人類記憶的資源標(biāo)識(shí)模型。由于模型標(biāo)識(shí)最終目的是為學(xué)習(xí)者服務(wù),該模型模擬激活增強(qiáng)、抑制衰減兩個(gè)對立統(tǒng)一的認(rèn)知過程,不僅要實(shí)現(xiàn)資源的語義層次的標(biāo)識(shí)組織,也要為后續(xù)學(xué)習(xí)者的資源演化與資源轉(zhuǎn)向提供動(dòng)態(tài)能力支持,具體如下文所述。

        3.1資源標(biāo)識(shí)模型構(gòu)建

        定義1(資源主題模式)資源片段的主題模式定義為四元組SM=(CT,SIMI,WS,DS),其中CT代表關(guān)系概念集[12],SIMI為與CT一一對應(yīng)的歸一化的關(guān)系概念相關(guān)度[12],WS為資源片段中CT對應(yīng)的主要關(guān)鍵詞集,DS代表具有該主題模式的文檔id集。其中資源片段可以是文本章節(jié)段落,CT、SIMI、WS示例見上文Example1。

        資源片段在邏輯或語義上相對完整獨(dú)立,其對應(yīng)的主題模式SM,是多個(gè)關(guān)系概念CT聯(lián)合表達(dá)的語義單元,同時(shí)SM也保留了關(guān)系概念對應(yīng)的重要外延詞條信息。以多個(gè)關(guān)系概念作為片段的語義標(biāo)識(shí),使學(xué)習(xí)者通過CT可以了解片段的語義概念信息,也可獲知WS中核心詞條對應(yīng)的精確語義。SM模型的主題特征組織構(gòu)成,與人類基于局部詞條特征和上下文概念語境[13]的并行閱讀方式接近,結(jié)合人的短時(shí)注意力特點(diǎn),CT、WS一般保留7±2個(gè)元素特征。

        不同資源片段主題間存在語義上的關(guān)聯(lián),體現(xiàn)為主題模式內(nèi)的關(guān)系概念之間存在更細(xì)粒度的概念聯(lián)系,這種聯(lián)系是片段主題的關(guān)聯(lián)基礎(chǔ)。為此首先定義了知識(shí)激活擴(kuò)散連接模型KALN,用以描述領(lǐng)域知識(shí)概念之間的關(guān)系。

        定義2(知識(shí)關(guān)聯(lián)連接模型KALN)KALN定義為四元組KALN=(CT,KL,KD,KW),其中CT為領(lǐng)域關(guān)系概念,關(guān)聯(lián)集KL?CT×CT,KD(kl)表示關(guān)聯(lián)邊kl的語義距離,KW(kl)表示kl的連接強(qiáng)度,kl?KL。

        KALN中的KD反映了關(guān)系概念間的關(guān)系內(nèi)涵或外延的重疊程度,由類似百度百科的關(guān)系形式概念背景獲得,來源于人工協(xié)作語義標(biāo)識(shí),語義相對固定,距離越近越易聯(lián)想,如三角形→等腰三角形。同時(shí)KW則反映了關(guān)系概念在特定領(lǐng)域頻繁同時(shí)激活的強(qiáng)度信息,是特定學(xué)習(xí)情景下相關(guān)概念組合出現(xiàn)的度量,其相對動(dòng)態(tài),強(qiáng)度越大,也更易聯(lián)想。如同人類在認(rèn)知過程中,在特定場合頻繁共現(xiàn)的強(qiáng)度也能激發(fā)人類情景下的聯(lián)想,如幾何中的三角形→面積。距離與強(qiáng)度是關(guān)系的兩個(gè)不同方面,如同學(xué)生由于教育差異,具有不同的認(rèn)知偏好和思維方式(對應(yīng)不同的概念連接強(qiáng)度),但學(xué)科的基本知識(shí)框架還是類同的(對應(yīng)類似的概念語義距離)。

        在人腦中,彌散的四通八達(dá)神經(jīng)網(wǎng)絡(luò)為任意兩個(gè)概念提供了關(guān)聯(lián)與學(xué)習(xí)的可能[1],為一無所知的嬰兒成長為頭腦復(fù)雜的成人提供了物理通道基礎(chǔ)。本文借鑒該彌散無序的思想,并且考慮領(lǐng)域概念獲取背景的局限性,假設(shè)任意兩個(gè)關(guān)系概念通過一定的距離都是連通的,如果語義距離小于間接連通的距離,則KALN關(guān)系概念間存在連接邊。下面結(jié)合該思路,進(jìn)行KALN基本模型的初始化,具體構(gòu)建步驟如下。

        (1)計(jì)算關(guān)聯(lián)任意兩個(gè)關(guān)系概念cti、ctj的可能邊klij的距離kdij,kdij=1/emax(cti,ctj),其中emax(cti,ctj)為最大的關(guān)系概念相關(guān)度。關(guān)系概念相關(guān)度是一種偏序關(guān)系的度量,即emax(cti,ctj)=max(e(cti,ctj),e(ctj,cti))。關(guān)系概念相關(guān)度定義見文獻(xiàn)[2,12],其基本思想就是關(guān)系概念間的外延或內(nèi)涵的集合重疊程度,取值范圍[0,1]。概念相關(guān)度emax(cti,ctj)∈[0,1],由此可知距離kdij取值最大為+∞,最小為1;當(dāng)i=j時(shí),emax(cti,ctj)=1,則kdij=1。

        (2)通過式(1)初始化KALN連接強(qiáng)度kwij。

        (3)重復(fù)步驟(1)、(2),直至所有的kdij、kwij計(jì)算完成,KALN初始化完成,具體見算法1。

        KALN為資源片段之間的主題關(guān)聯(lián)計(jì)算,提供了相對固定的基本語義與結(jié)構(gòu)支持。為了對離散的SM進(jìn)行管理與資源標(biāo)識(shí),下面構(gòu)建了資源激活關(guān)聯(lián)連接模型。

        定義3(資源關(guān)聯(lián)連接模型SALN)SALN可表示成三元組SALN=(SM,SL,SW),其中SM表示資源主題模式集,見定義1,關(guān)聯(lián)SL?SM×SM,SW(sl)表示sl的關(guān)聯(lián)權(quán)值,sl∈SL。

        資源關(guān)聯(lián)連接模型的構(gòu)建基于以下思想:如果資源主題模式SM包括的關(guān)系概念間在KALN中存在緊密的語義關(guān)聯(lián)時(shí),則資源模式間也存在較強(qiáng)的領(lǐng)域關(guān)聯(lián)。資源主題模式sm1、sm2間的關(guān)聯(lián)強(qiáng)度計(jì)算如式(2)所示。

        其中,kwij、kdij分別代表KALN中關(guān)系概念cti與ctj之間的關(guān)聯(lián)強(qiáng)度與連通距離,見定義2;topn、topm分別代表sm1、sm2中的關(guān)系概念數(shù)目,simii、simij則代表關(guān)系概念cti與ctj隸屬于sm1與sm2的程度,見定義1。SALN構(gòu)建步驟如下。

        (1)根據(jù)KALN鄰接矩陣M,M只保留主題模式sm1中關(guān)系概念對應(yīng)的行,以及sm2中關(guān)系概念對應(yīng)的列,得到當(dāng)前的KALN子集矩陣M′topn×topm,M′矩陣元素值為資源片段在當(dāng)前關(guān)系概念上的關(guān)聯(lián)程度。

        (2)針對矩陣M′的j列,計(jì)算表達(dá)式(3)。

        (3)使用表達(dá)式(3)分別計(jì)算sw12。

        通過以上步驟進(jìn)行SALN的構(gòu)建,建立資源間的聯(lián)系。sw12較大則代表主題模式1、2間領(lǐng)域相關(guān)程度較高。如果sw12≥θ1,并且滿足表達(dá)式(5),表示主題模式1、2間雷同,則進(jìn)行合并。

        其中,CT1、CT2表示兩個(gè)主題模式的主題向量;cti1、cti2表示向量中的公共關(guān)系概念;ex(cti1)、ex(cti2)表示公共關(guān)系概念的詞條外延集;θ2代表相似度閾值;simi12代表兩個(gè)片段主題模式之間的Jaccard相關(guān)系數(shù),表示關(guān)系概念精確外延詞條交集占比。雷同的主題模式需對共同的關(guān)系概念進(jìn)行合并操作,合并后的關(guān)系概念不變,關(guān)系概念相關(guān)度的更新見表達(dá)式(6)。

        其中,simi1i、simi2i表示主題模式1、2中合并前第i個(gè)公共關(guān)系概念的概念相關(guān)度。通過合并操作,可以增強(qiáng)一些重要的關(guān)系概念,相對也抑制了主題模式中的次要、噪音語義,為后續(xù)資源標(biāo)識(shí)組織提供更為精簡的主題模式集。

        KALN與SALN從語義的兩個(gè)不同層次,對資源進(jìn)行了標(biāo)識(shí),KALN表達(dá)了知識(shí)語義級的關(guān)聯(lián),SALN則綜合了語義與領(lǐng)域兩個(gè)層面的關(guān)聯(lián)。KALN、SALN子圖區(qū)域的變化,可反映學(xué)習(xí)者的學(xué)習(xí)歷史與興趣遷移軌跡,可以通過它們局部激活強(qiáng)度和覆蓋程度,從一定程度反映潛在資源推送需求,為后續(xù)資源推薦提供更多的上下文背景,為學(xué)習(xí)者提供更為準(zhǔn)確、多樣的資源。

        3.2資源標(biāo)識(shí)模型的擴(kuò)展

        資源的標(biāo)識(shí)組織,最終要為用戶服務(wù),其組織形式及變化擴(kuò)展應(yīng)該考慮或遵循人類的認(rèn)知變化規(guī)律。即KALN、SALN不是一成不變的,應(yīng)該反映開放資源本身及學(xué)習(xí)者個(gè)性的演化,并可以進(jìn)行自組織調(diào)整,例如不斷加入新資源,學(xué)習(xí)者的興趣偏好、學(xué)習(xí)歷史、認(rèn)知路徑變化等。為了增加資源語義模型的自適應(yīng)性,下面借鑒人類記憶擴(kuò)散過程對其進(jìn)行擴(kuò)展,使資源的語義標(biāo)識(shí)不僅反映資源內(nèi)容本身,也為個(gè)性化的資源需求提供模型能力支持。例如KALN中原始的關(guān)系概念“電氣”與“磁場”,由于這兩個(gè)關(guān)系概念外延詞條交集不大,其初始語義關(guān)聯(lián)并不強(qiáng),但如果學(xué)習(xí)者正在學(xué)習(xí)電磁學(xué),則它們會(huì)在資源中頻繁共現(xiàn),并且在該領(lǐng)域關(guān)聯(lián)強(qiáng)度應(yīng)該較強(qiáng),而隨著學(xué)習(xí)者學(xué)習(xí)內(nèi)容的偏移,它們之間的關(guān)聯(lián)又會(huì)慢慢衰減。該變化過程如同人類記憶增強(qiáng)與衰減過程,可以體現(xiàn)學(xué)習(xí)狀態(tài)或資源內(nèi)容的變化,具有自組織、模糊性的特點(diǎn)。

        同時(shí)基本的KALN、SALN的核心均為從關(guān)系形式背景中獲得關(guān)系概念,而單純通過協(xié)作知識(shí)庫(如百度百科)獲取的關(guān)系語義完整性還有一定的局限。考慮到資源主題模式對應(yīng)于實(shí)際存在的資源片段,這些資源片段的語義是通過關(guān)系概念展現(xiàn)的,關(guān)系概念在每個(gè)資源片段的共同出現(xiàn),都可看成關(guān)系概念間的一次領(lǐng)域激活,由此動(dòng)態(tài)調(diào)整KALN中關(guān)系概念間連接強(qiáng)度值KW,使KALN通過更廣泛的資源內(nèi)容協(xié)作,關(guān)聯(lián)語義反映領(lǐng)域知識(shí)實(shí)際組織情況。下面首先對知識(shí)關(guān)聯(lián)連接模型KALN進(jìn)行擴(kuò)展。

        3.2.1KALN基于多概念的同步激活與衰減

        KALN=(CT,KL,KD,KW),包括關(guān)系概念及其之間的連通距離與連接強(qiáng)度。連通距離KD反映它們之間的關(guān)系概念關(guān)聯(lián)程度,相對固定,其更新變化不在本文討論范圍之內(nèi)。KW這個(gè)連接強(qiáng)度在不同的學(xué)習(xí)情景中,則是相對動(dòng)態(tài)的。例如ct1、ct2之間在特定環(huán)境中(如某類資源或某類學(xué)習(xí)中)出現(xiàn)次數(shù)越頻繁,那么ct1、ct2之間的關(guān)聯(lián)激活應(yīng)該更活躍、容易,反之,它們之間的激活就會(huì)慢慢衰減、困難。

        如同人類認(rèn)知過程中,記憶增強(qiáng)與衰減是對立統(tǒng)一的,有增強(qiáng)沒有衰減,記憶必將達(dá)到生理認(rèn)知的極限,強(qiáng)度必將在注意力面前失去意義。領(lǐng)域?qū)<业闹R(shí)組織與記憶也遵循這個(gè)規(guī)律,其可以根據(jù)變化的學(xué)習(xí)環(huán)境,為學(xué)習(xí)者提供適宜的領(lǐng)域知識(shí)服務(wù)與指導(dǎo)。同理KALN如果一成不變或只增不減,也很難突出知識(shí)服務(wù)本身的時(shí)空動(dòng)態(tài)性。

        通過研究,認(rèn)知學(xué)家針對神經(jīng)通道強(qiáng)度提出了以下4個(gè)假設(shè)[1]:(1)每一次激發(fā)產(chǎn)生與神經(jīng)通道成正比的強(qiáng)度增量;(2)激發(fā)次數(shù)越多,增量越大;(3)神經(jīng)通道會(huì)因?yàn)樾玛惔x或大腦其他部分的工作,產(chǎn)生消退或抑制而衰減;(4)神經(jīng)通道強(qiáng)度越強(qiáng),越容易激發(fā)。借鑒認(rèn)知學(xué)家的以上理論,基于假設(shè)(1)~ (3),KALN中的KW變化,滿足微分方程(7)[1],KW在連接強(qiáng)度值方程中簡單記為w。

        其中,f代表激發(fā)頻次;ξw代表強(qiáng)度可調(diào)系數(shù);η代表衰減可調(diào)系數(shù);t代表KALN激活時(shí)序。根據(jù)假設(shè)(4)[1],可得:

        其中,ξf為激發(fā)頻次可調(diào)系數(shù)。

        通過對微分方程(7)、(8)求解,可以得到KALN中的連接強(qiáng)度KW的計(jì)算公式:

        其中,w0代表關(guān)系概念初始連接強(qiáng)度。從式(9)對t求導(dǎo)可知,=0時(shí)可得表達(dá)式(10):

        當(dāng)初始強(qiáng)度w0w0s時(shí),w逐步增強(qiáng)。人類記憶一般是衰減的,但如果ξfξw足夠大時(shí),即使很小的刺激也會(huì)產(chǎn)生很大的刺激強(qiáng)度,如同嬰兒一個(gè)小的刺激,激活強(qiáng)度可能病態(tài)增大,以致受到驚嚇甚至驚厥。通過調(diào)整ξf、ξw、η的參數(shù),可以獲得不同強(qiáng)度的w0s,使關(guān)系概念連接強(qiáng)度w呈現(xiàn)激活增強(qiáng)或抑制衰減的不同變化趨勢。

        ξf與激發(fā)頻次正相關(guān),把某主題模式sm看成Object,其包含的ct看成Attribute,由SM模式集構(gòu)建資源與概念間的形式概念背景。在此形式概念背景中,采用NGD(normalized Google distance)計(jì)算連通主題之間的領(lǐng)域關(guān)聯(lián)關(guān)系,如式(11)所示。

        其中,τ=0.000 001,λ=-1.0是經(jīng)驗(yàn)性常數(shù);NGD(sti,stj)表示關(guān)系概念 sti、stj的歸一化谷歌距離;f(sti)、f(sti,stj)代表關(guān)系概念在資源模式集SM中單獨(dú)或共同出現(xiàn)的次數(shù);N代表主題模式總數(shù)。ξfij越大代表

        sti、stj之間的相互激發(fā)越強(qiáng)。

        結(jié)合以上分析,本研究通過η響應(yīng)ξf值進(jìn)行動(dòng)態(tài)調(diào)整,實(shí)現(xiàn)連接強(qiáng)度的激活或相對抑制。強(qiáng)度系數(shù)ξw取固定經(jīng)驗(yàn)值1.0,η取值半開區(qū)間為(ξfw0(1-e-ηt),ξfw0],ξf越大,則η取值越偏向半?yún)^(qū)間起點(diǎn),即:

        由式(9)、(10)、(12)可知,ξf的增大變化可導(dǎo)致關(guān)系概念連接強(qiáng)度w衰減變慢,甚至關(guān)系概念連接強(qiáng)度的增長。

        綜上所述,關(guān)系概念初始語義距離越相近,則激活連接強(qiáng)度衰減越慢;關(guān)系概念領(lǐng)域共現(xiàn)越頻繁,則KALN中的激活強(qiáng)度越明顯。通過KALN中KW的η參數(shù)調(diào)整學(xué)習(xí),KALN可以反映關(guān)系概念語義、資源領(lǐng)域共現(xiàn)的信息,使得在資源標(biāo)識(shí)過程中,實(shí)現(xiàn)KALN的擴(kuò)展學(xué)習(xí)。

        該公司引進(jìn)歐洲專業(yè)涂層設(shè)備,主要提供基于工模具行業(yè)的硬質(zhì)涂層和基于汽車零部件的耐磨減摩涂層服務(wù)。硬質(zhì)涂層主要采用磁控電弧技術(shù),提供鉻鋁基的D+涂層、超硬切削的SC涂層、不銹鋼切削的專用SS涂層以及享有專利技術(shù)的鉻基EPAC涂層等?;谄嚵悴考腁risimit? DLC涂層則采用PECVD技術(shù),專注于摩擦學(xué)涂層市場,以降低(汽車)組件的摩擦與磨損。

        3.2.2SALN的擴(kuò)展

        同屬一篇文檔的資源片段的主題模式間一般存在顯性或隱性的領(lǐng)域關(guān)聯(lián),基于該假設(shè),對SALN模型中結(jié)點(diǎn)間的swij可進(jìn)行文檔結(jié)構(gòu)信息擴(kuò)展,由于篇幅問題,暫不作詳述。

        3.2.3KALN與SALN的增量更新

        在Web資源主題模式更新過程中,KALN中的KW與SALN中的SW均會(huì)動(dòng)態(tài)變化更新,二者均采用離線定時(shí)更新的方式。在資源標(biāo)識(shí)過程中,新的資源片段如果屬于某個(gè)既有主題模式,則把文檔編號(hào)加入主題模式即可,否則增加新的主題模式到SALN中。如同人類短時(shí)記憶與長時(shí)記憶的關(guān)系一樣,海馬中的短時(shí)記憶可以向大腦皮層的長時(shí)記憶轉(zhuǎn)化。KALN的更新,必將影響SALN的局部更新。

        為了減少增量更新過程中的計(jì)算工作量,SALN、KALN的增量更新只針對相關(guān)的關(guān)系概念進(jìn)行,暫不作深入優(yōu)化討論。

        4 算法實(shí)現(xiàn)

        算法1 KALN初始化算法

        輸入?yún)?shù):CT為通過開放協(xié)作知識(shí)庫獲取的關(guān)系概念集合,為String數(shù)組類型。

        輸出結(jié)果:初始的知識(shí)關(guān)聯(lián)連接網(wǎng)絡(luò)KALN,可采用三維數(shù)組k[|CT|][|CT|][2]表示,見定義2。

        1.定義sr[|CT|],sc[|CT|]//匯總k數(shù)組行、列

        2.for i=0 to|CT|{

        3.k[i][i][0]=1,sr[i]+=1,sc[i]+=1

        4.forj=i+1to|CT|{

        5.kdij=1/emax(CT[i],CT[j])

        6.k[i][j][0]=k[j][i][0]=kdij

        7.sr[i]+=kdij,sr[j]+=kdij

        8.sc[j]+=kdij,sc[i]+=kdij

        9.}}

        10.for i=0 to|CT|{

        11.k[i][i][1]=1.0/sr(i)

        12.forj=i+1to|CT|{

        13.kwij=k[i][j][0]/(min(sr[i],sc[j]))

        14.k[i][j][1]=k[j][i][1]=kwij

        15.}}

        16.輸出數(shù)組k,KALN初始化完成

        從算法1可知,KALN擴(kuò)展的工作量主要和關(guān)系概念數(shù)量m有關(guān),時(shí)間復(fù)雜度為O(m2),空間復(fù)雜度為O(m2),m為當(dāng)前關(guān)系概念數(shù)量。KALN是資源標(biāo)識(shí)的背景知識(shí)網(wǎng)絡(luò),該網(wǎng)絡(luò)計(jì)算可以離線預(yù)先處理。

        算法2 KALN增量擴(kuò)展算法

        k′=ExpdKALN(k,CT)

        輸入?yún)?shù):k為初始的知識(shí)關(guān)聯(lián)連接網(wǎng)絡(luò)KALN的數(shù)組,見算法1;CL為新加入資源集的關(guān)系概念向量List集合,其元素為CT類型;CT為某一資源對應(yīng)的關(guān)系概念集合,類似算法1。

        輸出結(jié)果:更新后的k′。

        1.定義類型為List的關(guān)系概念序列ST、ST′,其分量1表示關(guān)系概念內(nèi)涵,分量2表示其出現(xiàn)的頻次times

        2.Fori=0to|CL|{//遍歷新資源主題向量

        3.CTi=CL[i]//某資源的關(guān)系概念集合

        4.Fork=0to|CTi|{//遍歷某資源關(guān)系概念

        5.if(!ST.contains(CTi[k])){//新增

        6.ST=ST?{}

        7.}esle{//更新頻率

        8.times=ST.getvalue(CTi[k])

        9.ST=ST.remove(CTi[k]).add(CTi[k],times++>)

        10.}}

        11.Fori=0to|ST|{

        12.if(ST.getvalue(i)>θf)//出現(xiàn)次數(shù)大于閾值

        13.ST′=ST′?{ST.get(i)}

        14.ST.remove(i)

        15.}

        16.if(||ST′>θsize{//更新概念規(guī)模大于閾值

        17.Form=0to||ST′{

        18.Forn=mto||ST′{

        19.采用式(11)、(12)、(9)計(jì)算連接強(qiáng)度w

        20.更新ST′.get(m)、ST′.get(n)、w到k′

        21.}}

        22.輸出k′

        從算法2可知,KALN擴(kuò)展的工作量主要和新增資源集數(shù)量及其對應(yīng)的高頻關(guān)系概念的數(shù)量有關(guān),由于每個(gè)資源中的關(guān)系概念數(shù)量||CTi為固定常數(shù),即7±2,時(shí)間復(fù)雜度為O(n)+O(m2),空間復(fù)雜度為O(m2)+O(n),n為當(dāng)前資源數(shù)量,m為當(dāng)前高頻關(guān)系概念數(shù)量。算法2只針對高頻的關(guān)系概念進(jìn)行連接權(quán)值的批量更新,減少KALN的擴(kuò)展開銷。

        算法3 SALN基本構(gòu)建算法

        SALN=InitSALN(SM)

        輸入?yún)?shù):SM為新加入資源所涉及的關(guān)系模式集合,為List類型,其元素?cái)?shù)據(jù)類型為,其數(shù)據(jù)類型的兩個(gè)分量依次為關(guān)系概念向量、資源ID列表,見定義1分量。

        輸出結(jié)果:資源關(guān)聯(lián)連接網(wǎng)絡(luò)SALN,采用二維數(shù)組SN表示,見定義3.

        1.Fori=0to|SM|{

        2.Forj=i+1to|SM|{

        3.采用式(2),計(jì)算SN[i][j]=SN[j][i]=swij

        4.}}

        5.輸出SN

        由于每個(gè)主題模式中的關(guān)系概念數(shù)量為一個(gè)常數(shù),從算法3可知,SALN初始化的工作量主要和資源集對應(yīng)的主題模式數(shù)量m有關(guān),空間復(fù)雜度為O(m2),時(shí)間復(fù)雜度為O(m2),從中可知主題模式的規(guī)模直接影響資源標(biāo)識(shí)的效率。因此進(jìn)行主題模式的合并十分必要,SM的合并與SALN的增量更新暫沒討論。

        5 資源標(biāo)識(shí)步驟

        結(jié)合以上構(gòu)建的資源標(biāo)識(shí)模型,新的資源通過以下步驟完成語義標(biāo)識(shí)。

        (1)構(gòu)建KALN:借助開放協(xié)作數(shù)據(jù)庫,如百度百科條目數(shù)據(jù),進(jìn)行關(guān)系概念的獲取計(jì)算,構(gòu)建KALN。

        (2)資源預(yù)處理:把不同格式的資源,如PDF、html、ppt、txt,轉(zhuǎn)換成統(tǒng)一格式的文本。

        (3)資源文本處理:對統(tǒng)一格式的文本進(jìn)行預(yù)處理,如分詞、詞性標(biāo)注等,形成離散的關(guān)鍵詞。

        (4)資源關(guān)系概念識(shí)別:借助關(guān)系形式概念及圖論,對文本中的關(guān)鍵詞進(jìn)行資源關(guān)系概念標(biāo)識(shí)。

        (5)資源主題模式的獲取:獲取資源片段的關(guān)系概念向量,構(gòu)建其主題模式。

        (6)利用上一步獲取的資源片段的主題模式,采用式(2)對資源片段在SALN中進(jìn)行相似度計(jì)算。

        (7)如果存在足夠相似的主題模式,則該資源鏈接到該主題模式,否則新建一個(gè)主題模式,并增量添加到SALN。

        6 實(shí)驗(yàn)與評測

        為了評價(jià)實(shí)際資源標(biāo)識(shí)性能,本文從以下兩個(gè)方面進(jìn)行資源語義標(biāo)識(shí)模式準(zhǔn)確性評價(jià):

        (1)資源內(nèi)容的關(guān)聯(lián)關(guān)系在標(biāo)識(shí)模型中能否正確體現(xiàn),即本身關(guān)聯(lián)的資源在標(biāo)識(shí)模型中是否也是關(guān)聯(lián)的。

        (2)對于一個(gè)資源主題模式,其所具有的關(guān)聯(lián)語義鏈中,那些高權(quán)值的關(guān)聯(lián)語義鏈在關(guān)聯(lián)語義準(zhǔn)確度上能否高于那些低權(quán)值的關(guān)聯(lián)語義鏈。

        最為簡單可行的辦法是通過人工閱讀評價(jià)的方法,確定標(biāo)識(shí)后的資源語義關(guān)聯(lián)的效果。但為了增加評價(jià)的客觀性,本文主要通過同一原始目錄中的文本,使用SALN進(jìn)行標(biāo)識(shí),驗(yàn)證標(biāo)識(shí)后資源的相似性、關(guān)聯(lián)性。

        6.1實(shí)驗(yàn)環(huán)境

        在CPU為Intel Core i5-4200U,內(nèi)存為4 GB,OS 為64位的Windows 8的PC機(jī)上,采用Java開發(fā)語言和Eclipse開發(fā)平臺(tái)進(jìn)行實(shí)驗(yàn),數(shù)據(jù)采用PostgreSQL9.3進(jìn)行管理。

        6.2實(shí)驗(yàn)數(shù)據(jù)

        本文針對“初中物理在線”商用網(wǎng)站(http://www. czwlzx.com/)中的794篇物理文本資源進(jìn)行標(biāo)識(shí)實(shí)驗(yàn),這些實(shí)用的文本教育資源從內(nèi)容上分為機(jī)械運(yùn)動(dòng)、聲現(xiàn)象、光現(xiàn)象、力、電流與電路、電與磁、能源與可持續(xù)發(fā)展等11個(gè)一級章節(jié),以及能源、電流和電路、串聯(lián)和并聯(lián)、力、光的反射、長度、時(shí)間的測量、電動(dòng)機(jī)、運(yùn)動(dòng)的描述等40個(gè)二級章節(jié)。這些資源均為全國不同學(xué)校的老師或?qū)W生上傳的文本資源,結(jié)構(gòu)形式不一,為了對資源標(biāo)識(shí)效果進(jìn)行評價(jià)分析,資源原始一、二級目錄信息均保存在數(shù)據(jù)庫中。

        6.3實(shí)驗(yàn)結(jié)果及分析

        6.3.1資源標(biāo)識(shí)效果

        本文借助百度百科開放協(xié)作知識(shí)庫,通過文本分詞、去除停用詞等淺層文本處理,以及句法分析、關(guān)系概念連通處理后,可得到文本片段主題。由于實(shí)驗(yàn)文本數(shù)據(jù)長短不一,文本結(jié)構(gòu)也不規(guī)范,實(shí)驗(yàn)中把每個(gè)文本資源看成單一片段,其對應(yīng)的文本主題也看成一個(gè)主題模式。例如同為“電與磁”目錄下的文檔ID271、ID272對應(yīng)的資源主題模式sm271、sm272如表1所示,表格第一行信息包括關(guān)系概念及其在文本中的權(quán)值,第二行信息為文本中原始的詞條序列,該詞條序列屬于同列關(guān)系概念。

        Table 1 Sketch with sm271 of ID271 and sm272 of ID272表1 ID271文本sm271和ID272文本sm272示意

        sm271與sm272相關(guān)的關(guān)系概念KALN子圖如圖1所示,其中連接權(quán)值包括“初始連接強(qiáng)度/語義距離”兩部分,該初始的KALN基本反映了詞條之間的關(guān)聯(lián)關(guān)系,如“應(yīng)用物理”與“電磁學(xué)”之間的權(quán)值為0.019/1.757,而“社會(huì)”與“磁場”間的權(quán)值為0/∞,這與實(shí)際語義情況比較吻合。KALN的構(gòu)建質(zhì)量與爬取的形式背景的完備程度密切相關(guān),在當(dāng)前KALN狀態(tài)下,兩個(gè)主題模式間的關(guān)聯(lián)度可通過式(2)計(jì)算得sw(sm271,sm272)=0.025 344。

        Fig.1 Sub graph of relational concept圖1 關(guān)系概念的子圖示意

        在以上基本標(biāo)識(shí)思路上,本文對KALN的擴(kuò)展模型準(zhǔn)確率、召回率、平均關(guān)聯(lián)度進(jìn)行了驗(yàn)證。根據(jù)開放資源既有標(biāo)識(shí)特點(diǎn),與一資源關(guān)聯(lián)度大于某閾值的關(guān)聯(lián)資源在同一目錄下,則認(rèn)為是正確標(biāo)識(shí);所有本身關(guān)聯(lián)資源的標(biāo)識(shí)關(guān)聯(lián)度超過了平均關(guān)聯(lián)度的占比為其召回率。為了體現(xiàn)上文說明的準(zhǔn)確關(guān)聯(lián)準(zhǔn)則,即不僅評價(jià)模型的關(guān)聯(lián)語義,同時(shí)評價(jià)模型關(guān)聯(lián)的相對強(qiáng)弱能力,實(shí)驗(yàn)對資源既有一、二級目錄標(biāo)識(shí),在KALN擴(kuò)展前后進(jìn)行了評價(jià),具體結(jié)果如表2。

        Table 2 Result of annotating resources表2 資源標(biāo)識(shí)關(guān)聯(lián)結(jié)果

        KALN的擴(kuò)展,可以動(dòng)態(tài)調(diào)整領(lǐng)域關(guān)系概念的連接強(qiáng)度,使其更加符合同一語料的關(guān)系概念共現(xiàn)關(guān)聯(lián)的情況。從表2中可知,資源間平均關(guān)聯(lián)度由擴(kuò)展前的0.008 5變?yōu)閿U(kuò)展后的0.194 2,說明資源包含的關(guān)系概念間的連接強(qiáng)度得以普遍加強(qiáng)。由于語料質(zhì)量與規(guī)模的限制,主題模式間連接強(qiáng)度普遍增加的同時(shí),也整體上引入了一些噪音數(shù)據(jù),導(dǎo)致以平均關(guān)聯(lián)度為閾值,召回率和準(zhǔn)確率均有所下降,如一級目錄的召回率由78.34%下降為76.60%,準(zhǔn)確率由原38.23%也下降為31.99%;但資源以Top1關(guān)聯(lián)度為閾值時(shí),擴(kuò)展前后準(zhǔn)確率是上升的,其準(zhǔn)確率擴(kuò)展前后分別達(dá)到73.25%與82.60%,說明KALN的擴(kuò)展對真正關(guān)聯(lián)的部分概念增大程度更大。從表2中可以看出,為了提高后續(xù)資源標(biāo)識(shí)的準(zhǔn)確性,選取平均關(guān)聯(lián)度作為資源的連接閾值是不合理的,一級目錄選取Top3關(guān)聯(lián)度較為合適,二級目錄選擇Top2關(guān)聯(lián)度較為合適,這樣資源間可以形成較為準(zhǔn)確并且多樣化的關(guān)聯(lián)。Top1代表與某資源最為關(guān)聯(lián)的前一個(gè)關(guān)聯(lián)度,其他同理。

        一、二級目錄準(zhǔn)確率的差異,是由于一級目錄寬泛,二級目錄標(biāo)識(shí)更為精準(zhǔn)而形成的。Top2關(guān)聯(lián)度為閾值的一、二級目錄的準(zhǔn)確率相差不是很大,說明模型中的關(guān)聯(lián)程度能較好體現(xiàn)資源本身的關(guān)聯(lián)精準(zhǔn)程度。RCAM-Top2資源SALN見圖2。

        Fig.2 SALN structure schematic圖2SALN示意

        因?yàn)镵ALN假設(shè)每個(gè)關(guān)系概念通過有限的距離均是連通的,所以圖2不存在孤立的資源結(jié)點(diǎn),每個(gè)資源平均有2.542個(gè)鄰居結(jié)點(diǎn)。結(jié)點(diǎn)度的分布接近power law分布,即y=2 429.9x-2.52,其R2=0.896,Correlation= 0.708。

        模型進(jìn)行資源標(biāo)識(shí)時(shí),主要和既有資源主題模式數(shù)量、資源標(biāo)識(shí)關(guān)系概念數(shù)量有關(guān),與物理在線資源相關(guān)的原始主題模式數(shù)量為844個(gè),每個(gè)資源使用前9個(gè)關(guān)系概念標(biāo)識(shí),通過多輪主題模式合并后,主題模式精簡到791個(gè)主題模式。每個(gè)主題模式采用9個(gè)關(guān)系概念及其外延詞條表達(dá),而兩主題模式間采用一個(gè)語義關(guān)聯(lián)數(shù)值進(jìn)行表達(dá),存儲(chǔ)空間為586 KB,較為合理。由于模型定義的特點(diǎn),相比資源的開放性增長,后續(xù)資源的主題模式增長會(huì)緩慢得多,但具體數(shù)據(jù)還需后續(xù)的進(jìn)一步驗(yàn)證和優(yōu)化。

        6.3.2與相關(guān)資源組織模型的結(jié)構(gòu)比較

        由于資源標(biāo)識(shí)模型的效果不僅與模型策略有關(guān),也與其領(lǐng)域知識(shí)的構(gòu)建規(guī)模和質(zhì)量關(guān)系密切,因此表3只給出了相關(guān)資源組織模型的網(wǎng)絡(luò)結(jié)構(gòu)比較信息。語義網(wǎng)本體是文獻(xiàn)[7]中利用DAML圖書館中的語義本體構(gòu)建的網(wǎng)絡(luò);WWW網(wǎng)絡(luò)的數(shù)據(jù)則來自文獻(xiàn)[14];Words Network的數(shù)據(jù)來自文獻(xiàn)[15];關(guān)聯(lián)語義鏈網(wǎng)絡(luò)的數(shù)據(jù)則來自文獻(xiàn)[16]。

        Table 3 Comparison of resource organization models表3 相關(guān)資源組織模型比較

        由于RCAM-Top2網(wǎng)絡(luò)是基于Top2關(guān)聯(lián)度構(gòu)建的,RCAM-Top10則是基于Top10關(guān)聯(lián)度構(gòu)建的,故此它們資源間的平均連通路徑長度變化較大,前者更為稀疏。RCAM-Top10和小世界網(wǎng)絡(luò)Words Network模型特點(diǎn)接近。相比半自動(dòng)的語義網(wǎng)本體模型,RCAM與關(guān)聯(lián)語義鏈網(wǎng)絡(luò)構(gòu)建更為方便,均為自動(dòng)構(gòu)建,萬維網(wǎng)的連接網(wǎng)絡(luò)具有較大的隨機(jī)性。RCAM構(gòu)建基于關(guān)系概念以及認(rèn)知規(guī)律,語義與結(jié)構(gòu)可以進(jìn)行擴(kuò)展,可通過設(shè)置不同的網(wǎng)絡(luò)連接閾值,控制標(biāo)識(shí)的準(zhǔn)確性或激活范圍,在特定的上下文環(huán)境下,可以進(jìn)行不同的資源轉(zhuǎn)向控制。

        7 總結(jié)與展望

        本文借助對傳統(tǒng)形式概念的擴(kuò)展,建立基于關(guān)系的形式概念,采用關(guān)系概念及主題模式對資源進(jìn)行標(biāo)識(shí),為資源提供概念與結(jié)構(gòu)上的標(biāo)識(shí)語義。同時(shí)借鑒人類記憶的激活擴(kuò)散、衰減遺忘機(jī)制,對模型的關(guān)聯(lián)強(qiáng)度進(jìn)行動(dòng)態(tài)學(xué)習(xí)調(diào)整,使其更好反映Web資源標(biāo)識(shí)的時(shí)空動(dòng)態(tài)性與學(xué)習(xí)者的個(gè)性需求。本文主題模式的合并約簡、模型的增量更新以及參數(shù)調(diào)整的收斂、調(diào)整規(guī)律,更為精準(zhǔn)的KALN擴(kuò)展規(guī)律及其結(jié)合個(gè)性化資源推薦應(yīng)用均需進(jìn)一步深入研究。

        References:

        [1]Liu Hanhui.Analysis of the mechanism and application of memory model and neural system[M].Tianjin:Tianjin University Press,2015.

        [2]Xia Jiali,Cheng Chunlei,Chen Hui,et al.The strategy of extracting Chinese entities relation based on predicate concept connectivity[J].Journal of Frontiers of Computer Science and Technology,2014,8(11):1345-1357.

        [3]Dublin core metadata initiative(DCMI)[R/OL].(2008-06-07)[2016-02-28].http://dublincore.org/.

        [4]Salton G,Yang C S.On the specification of term values in automatic indexing[J].Journal of Documentation,1973,29 (4):351-372.

        [5]Resource description framework(RDF)[R/OL].[2016-02-28]. http://www.w3.org/TR/2014/REC-rdf11-concepts-20140225/.

        [6]ISO/IEC.Topic maps data model[S/OL].(2006)[2016-02-28]. http://www.topicmaps.org/.

        [7]Gil R,Garcia R.Measuring the semantic Web[J].AIS SIGSEMIS Bulletin,2004,1(2):69-72.

        [8]Yang Yuehua,Du Junping,Ping Yuan.Ontology-based intelligent information retrieval system[J].Journal of Software, 2015,36(7):1675-1687.

        [9]Xu Ge,Wang Houfeng.The development of topic models in natural language processing[J].Chinese Journal of Computers,2011,34(8):1423-1437.

        [10]Wang Shaonan,Zong Chengqin.A dual-LDA method on Chinese word sense representation and induction[J/OL]. Chinese Journal of Computers.(2016-01-24)[2016-02-28]. http://www.cnki.net./kcms/detail/11.1826.TP.20160124.2008. 004.html.

        [11]Wille R.Restructuring lattice theory:an approach based on hierarchies of concepts[C]//LNCS 5548:Proceedings of the7th International Conference on Formal Concept Analysis, Darmstadt,Germany,May 21-24,2009.Berlin,Heidelberg: Springer,2009:314-339.

        [12]Cheng Chunlei,Xia Jiali,Cao Chonghua,et al.Research on Web text topic extraction model with relational concept[J]. Journal of Chinese Computer Systems,2016,37(5):972-978.

        [13]Boulton D.Cognitive science:the conceptual components of reading&what reading does for the mind[EB/OL].[2016-02-28].http://www.childrenofthecode.org/interviews/stanovich.htm.

        [14]Kleinberg J,Lawrence S.The structure of the Web[J].Science, 2001,294:1849-1850.

        [15]Ferre R,Sole R.The small world of human language[J]. Proceedings of the Royal Society:B,2001,268:2261-2265.

        [16]Xu Zheng.Building association link network for managing large-scale Web resources[D].Shanghai:Shanghai University,2012.

        附中文參考文獻(xiàn):

        [1]劉漢輝.記憶分析模型及其神經(jīng)系統(tǒng)機(jī)理與應(yīng)用[M].天津:天津大學(xué)出版社,2015.

        [2]夏家莉,程春雷,陳輝,等.謂詞概念連通度的中文實(shí)體關(guān)系抽取策略[J].計(jì)算機(jī)科學(xué)與探索,2014,8(11):1345-1357.

        [8]楊月華,杜軍平,平源.基于本體的智能信息檢索系統(tǒng)[J].軟件學(xué)報(bào),2015,36(7):1675-1687.

        [9]徐戈,王厚峰.自然語言處理中主題模型的發(fā)展[J].計(jì)算機(jī)學(xué)報(bào),2011,34(8):1423-1437.

        [10]王少楠,宗成慶.一種基于雙通道LDA模型的漢語詞義表示與歸納方法[J/OL].計(jì)算機(jī)學(xué)報(bào).(2016-01-24)[2016-02-28].http://www.cnki.net./kcms/detail/11.1826.TP.20160124. 2008.004.html.

        [12]程春雷,夏家莉,曹重華,等.關(guān)系概念的Web文本主題抽取模型研究[J].小型微型計(jì)算機(jī)系統(tǒng),2016,37(5):972-978.

        [16]徐崢.大規(guī)模網(wǎng)絡(luò)資源環(huán)境下關(guān)聯(lián)語義鏈網(wǎng)絡(luò)模型及其應(yīng)用研究[D].上海:上海大學(xué),2012.

        CHENG Chunlei was born in 1976.He is a Ph.D.candidate and associate professor at Jiangxi University of Finance and Economics,and the member of CCF.His research interests include text mining and decision support system.程春雷(1976—),男,江西財(cái)經(jīng)大學(xué)博士研究生、副教授,CCF會(huì)員,主要研究領(lǐng)域?yàn)槲谋就诰颍瑳Q策支持系統(tǒng)。

        XIA Jiali was born in 1965.She received the Ph.D.degree from Huazhong University of Science and Technology in 2003.Now she is a professor and Ph.D.supervisor at Jiangxi University of Finance and Economics.Her research interests include data mining,real-time database system and software engineering.

        夏家莉(1965—),女,2003年于華中科技大學(xué)獲得博士學(xué)位,現(xiàn)為江西財(cái)經(jīng)大學(xué)教授、博士生導(dǎo)師,主要研究領(lǐng)域?yàn)閿?shù)據(jù)挖掘,實(shí)時(shí)數(shù)據(jù)庫系統(tǒng),軟件工程。

        *The Science and Technology Support Program of Jiangxi Province under Grant No.20141BBE50031(江西省科技支撐計(jì)劃);the Natural Science Foundation of Jiangxi Province under Grant No.20132BAB201028(江西省自然科學(xué)基金);the Medical Research Program of Health Department of Jiangxi Province under Grant No.2013A100(江西省衛(wèi)生廳中醫(yī)藥科研計(jì)劃);the Research Program of Jiangxi University of Traditional Chinese Medicine under Grant Nos.2013ZR0069,2013jzzdxk022(江西中醫(yī)藥大學(xué)校級課題).

        Received 2016-04,Accepted 2016-06.

        CNKI網(wǎng)絡(luò)優(yōu)先出版:2016-06-01,http://www.cnki.net/kcms/detail/11.5602.TP.20160601.1517.002.html

        文獻(xiàn)標(biāo)志碼:A

        中圖分類號(hào):TP391

        doi:10.3778/j.issn.1673-9418.1604023

        Research on Semantic Annotation Model of Web Resources Based on Relational Concept*

        CHENG Chunlei1,2+,XIAJiali1
        1.School of Information Management,Jiangxi University of Finance and Economics,Nanchang 330032,China 2.School of Computer Science,Jiangxi University of Traditional Chinese Medicine,Nanchang 330004,China +Corresponding author:E-mail:chunlei_cheng@163.com

        Abstract:In the Web environment,resources have rich contents,various forms,different description standards as well as discrete organizational structures.Problems,such as the lack of semantics and domain knowledge and artificial workload,limit them in the personalized resource recommendation and the obtaining application.This paper, based on the relationship between the concept of activated diffusion and the thought of layered resource semantic identification,establishes the relational concept annotation model(RCAM).RCAM simulates human memory activation spreading process and considers memory enhancement and forgetting mechanism to achieve the more dynamic and personalized related organizations of Web resources.RCAM regards the concept of a relationship as semantic elements,and the fragment relationship concept set as the semantic scheme.With the flexible identification granularity and relatively completed sematic logic,RCAM provides new research ideas to Web education resource identification.Experiment shows that RCAM can provide more background knowledge,adapt to dynamic resource organi-zation with different learning scenarios and learning personality,and it aims at the open Web resources.As a result, RCAM has better universality and extensibility.

        Key words:Web resources annotation;relational concept;activation and spreading;relational concept annotation model(RCAM)

        二区三区日本高清视频| 午夜三级网| 国产亚洲精选美女久久久久| 亚洲综合一区二区三区久久| 久久午夜福利电影| 亚洲日本中文字幕天天更新| 一本到无码AV专区无码| 国产精品美女自在线观看| 人妻少妇哀求别拔出来| 一边吃奶一边摸做爽视频| 国产在线网址| 亚洲精品在线观看自拍| 国产麻花豆剧传媒精品mv在线 | 日本一区二区三区四区高清不卡| 黑人巨大精品欧美一区二区免费 | 久久精品国产久精国产果冻传媒| 在线观看免费午夜大片| 久久久久久亚洲精品中文字幕| 亚洲天堂免费视频| 国产精品亚洲在钱视频| av网站免费线看精品| 成年无码av片完整版| 国产精品无码久久久久久久久作品| 一区二区精品天堂亚洲av| 成在线人av免费无码高潮喷水| 亚洲va欧美va国产综合| 日韩极品视频在线观看免费| av天堂最新在线播放| 在线看片免费人成视频久网下载| 2022Av天堂在线无码| 少妇一级内射精品免费| 狠狠色狠狠色综合网| 欧美丰满大屁股ass| 精品无码国产一二三区麻豆| 偷拍一区二区三区高清视频| 99亚洲男女激情在线观看| 国产男女插插一级| 亚洲精品美女中文字幕久久| 久久天天躁狠狠躁夜夜不卡| 四虎4545www国产精品| 亚洲综合网中文字幕在线|