亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于三支概念分析的地理試題自動(dòng)解題

        2022-05-10 02:29:40洪啟航楊思春
        關(guān)鍵詞:概念分析實(shí)體試題

        洪啟航,楊思春

        (安徽工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院, 安徽 馬鞍山 243032)

        隨著計(jì)算機(jī)技術(shù)的快速發(fā)展,人工智能技術(shù)滲透到各個(gè)領(lǐng)域,如智能管理、智能優(yōu)化等[1-2].近年來,國(guó)內(nèi)外研究機(jī)構(gòu)開始研究如何讓計(jì)算機(jī)來自動(dòng)解題,比如日本大學(xué)入學(xué)考試機(jī)器人、科大訊飛高考答題機(jī)器人等.目前,自動(dòng)解題已成為人工智能領(lǐng)域的研究熱點(diǎn),除了基于數(shù)學(xué)模型的試題自動(dòng)解題外[3],還出現(xiàn)了應(yīng)用于地理等學(xué)科的自動(dòng)解題系統(tǒng)[4-5].作為自動(dòng)解題技術(shù)的核心,解題知識(shí)的獲取直接決定了自動(dòng)解題系統(tǒng)的性能.現(xiàn)有自動(dòng)解題系統(tǒng)主要通過手工或半自動(dòng)方式從試題文本及相關(guān)資源中獲取相關(guān)解題知識(shí).但是,對(duì)自動(dòng)解題系統(tǒng)來說,這些知識(shí)可能還不足以支持正確解題,還需要深度挖掘知識(shí).

        形式概念分析[6]作為數(shù)據(jù)挖掘領(lǐng)域一種有效的數(shù)據(jù)分析和知識(shí)獲取工具,可以挖掘?qū)ο?樣本)與屬性(特征)之間隱含的各種類型規(guī)則知識(shí),并已成功應(yīng)用于形式?jīng)Q策分析、屬性簡(jiǎn)約、知識(shí)獲取[7-10]等領(lǐng)域.傳統(tǒng)的形式概念分析理論僅支持二支決策,三支概念分析將具有兩支決策的形式概念分析推廣為支持三支決策,進(jìn)而實(shí)現(xiàn)更為有效的數(shù)據(jù)分析和知識(shí)發(fā)現(xiàn)[11-14].本文基于三支概念分析理論,通過挖掘試題文本中隱含的解題知識(shí),拓展現(xiàn)有自動(dòng)解題系統(tǒng)的隱含解題知識(shí)獲取途徑,為自動(dòng)解題的語(yǔ)義分析提供更充分的支持,進(jìn)而提升自動(dòng)解題系統(tǒng)的性能.

        1 試題文本語(yǔ)義分析

        對(duì)試題文本進(jìn)行語(yǔ)義分析是自動(dòng)解題系統(tǒng)的基礎(chǔ),它直接關(guān)系到自動(dòng)解題系統(tǒng)的性能.本文利用相關(guān)自然語(yǔ)言處理技術(shù),通過對(duì)試題文本進(jìn)行分詞、詞性標(biāo)注、關(guān)鍵詞提取、實(shí)體關(guān)聯(lián)類及其屬性提取等操作,實(shí)現(xiàn)對(duì)試題文本的關(guān)鍵特征信息提取,進(jìn)而為后續(xù)獲取隱含解題知識(shí)提供基礎(chǔ).

        1) 分詞和詞性標(biāo)注.采用開源中文分詞工具包結(jié)巴分詞(Jieba)和詞性標(biāo)注器NLTK[18]對(duì)試題文本進(jìn)行分詞和詞性標(biāo)注,同時(shí)結(jié)合領(lǐng)域詞典提高分詞準(zhǔn)確率.本文以地理課程為例,所構(gòu)造的領(lǐng)域詞典共收集4 930個(gè)術(shù)語(yǔ)詞,分成10個(gè)不同的類型,并以[關(guān)鍵字,分類,上級(jí),下級(jí)]四元組的形式存儲(chǔ).為了提高試題文本分詞結(jié)果的準(zhǔn)確率,對(duì)分詞結(jié)果進(jìn)行預(yù)處理,包括去除副詞、虛詞、停用詞等;加入領(lǐng)域詞典以保證領(lǐng)域詞匯不被分開.

        試題1:減少各個(gè)國(guó)家和地區(qū)的貿(mào)易限制、控制和減免關(guān)稅等是下列哪個(gè)國(guó)際組織的主要職能?

        A. IOC B. OAO

        C. OPEC D. WTO

        對(duì)該試題進(jìn)行分詞和詞性標(biāo)注后的結(jié)果為:

        減少/vi各個(gè)/v國(guó)家/n和/v地區(qū)/n的/p貿(mào)易/n限制/n、控制/vi和/f減免/vi關(guān)稅/n等/f是/v下列/r哪個(gè)/r國(guó)際/n組織/n的/p主要/r職能/n?/wky

        A. /n IOC/n B. /n OAO/n

        C. /n OPEC/n D. /n WTO/n

        試題1中的“貿(mào)易”和“限制”通過領(lǐng)域詞典結(jié)合成“貿(mào)易限制”,“國(guó)際”和“組織”通過領(lǐng)域詞典結(jié)合成“國(guó)際組織”.

        2) 關(guān)鍵詞提取.利用TextRank提取試題文本中的關(guān)鍵詞.TextRank是一種基于詞語(yǔ)鏈條之間共現(xiàn)關(guān)系的文本提取算法.試題1應(yīng)用TextRank算法得到關(guān)鍵詞集合[‘貿(mào)易限制’,‘關(guān)稅’,‘國(guó)際組織’,‘主要職能’].

        3) 實(shí)體關(guān)聯(lián)類及其屬性提取.基于三支概念分析理論進(jìn)行試題文本隱含解題知識(shí)獲取需要從試題文本中提取決策形式背景構(gòu)建所對(duì)應(yīng)的對(duì)象和屬性信息.實(shí)體關(guān)聯(lián)類及其屬性提取的具體流程為:① 把試題文本中所有的關(guān)鍵詞作為實(shí)體;② 針對(duì)每個(gè)實(shí)體分別計(jì)算它與領(lǐng)域詞典中每個(gè)概念的相似度,把相似度排名前二的概念作為該實(shí)體的關(guān)聯(lián)類,并作為后續(xù)所需構(gòu)建決策形式背景的對(duì)象集;③ 搜索該實(shí)體及其實(shí)體關(guān)聯(lián)類在領(lǐng)域詞典的鍵值,得到包含實(shí)體的四元組集合;④ 檢索實(shí)體及其實(shí)體關(guān)聯(lián)類的上級(jí)與同級(jí)信息,若能檢索到(≠?)則將該信息添加到該實(shí)體的實(shí)體關(guān)聯(lián)類集合;⑤ 檢索實(shí)體及其實(shí)體關(guān)聯(lián)類的下級(jí)信息,若能檢索到則將該信息作為后續(xù)所需構(gòu)建決策形式背景的屬性集.

        對(duì)于試題1,其實(shí)體關(guān)聯(lián)類及其屬性提取的具體步驟為:① 根據(jù)試題1得到的關(guān)鍵詞集合為:[‘貿(mào)易限制’,‘關(guān)稅’,‘國(guó)際組織’,‘主要職能’] 為試題實(shí)體;② 計(jì)算每個(gè)實(shí)體與領(lǐng)域詞典中每個(gè)概念的相似度,把相似度排名前二的概念作為該實(shí)體的關(guān)聯(lián)類,并作為后續(xù)所需構(gòu)建決策形式背景的對(duì)象集,試題1中‘國(guó)際組織’=[‘國(guó)際機(jī)構(gòu)’,‘國(guó)際團(tuán)體’];③ 搜索每個(gè)實(shí)體及其實(shí)體關(guān)聯(lián)類在領(lǐng)域詞典的鍵值,得到包含實(shí)體的四元組集合,‘關(guān)稅’的四元組集合為:[實(shí)體:‘關(guān)稅’,上級(jí):‘稅收’,下級(jí):‘優(yōu)惠關(guān)稅’、‘保護(hù)關(guān)稅’、‘反傾銷關(guān)稅’、‘反補(bǔ)貼關(guān)稅’、‘報(bào)復(fù)關(guān)稅’,同級(jí):未檢索到(?)];④ 檢索實(shí)體及其實(shí)體關(guān)聯(lián)類的上級(jí)與同級(jí)信息,若能檢索到則將該信息添加到該實(shí)體的實(shí)體關(guān)聯(lián)類集合,‘關(guān)稅’:上級(jí)檢索到‘稅收’,同級(jí)未檢索到,將‘稅收’加入‘關(guān)稅’的實(shí)體關(guān)聯(lián)類集合;⑤ 檢索實(shí)體及其實(shí)體關(guān)聯(lián)類的下級(jí)信息,若能檢索到則將該信息作為后續(xù)所需構(gòu)建決策形式背景的屬性集,‘稅收’:下級(jí)檢索到‘稅收優(yōu)惠關(guān)稅’、‘保護(hù)關(guān)稅’、‘反傾銷關(guān)稅’、‘反補(bǔ)貼關(guān)稅’、‘報(bào)復(fù)關(guān)稅’,將這些下級(jí)信息添加到 ‘關(guān)稅’的屬性集合.

        2 基于三支概念分析的試題文本隱含解題知識(shí)獲取

        基于三支概念分析理論,對(duì)試題文本進(jìn)行語(yǔ)義分析后,通過試題文本決策形式背景構(gòu)造、三支概念格構(gòu)建和決策規(guī)則提取實(shí)現(xiàn)試題文本中隱含解題知識(shí)的獲取.

        2.1 試題文本的決策形式背景構(gòu)造

        對(duì)試題文本進(jìn)行三支概念分析時(shí),根據(jù)試題文本中每個(gè)實(shí)體的關(guān)聯(lián)類及其屬性來構(gòu)造試題文本的決策形式背景.

        根據(jù)試題1中提取的每個(gè)實(shí)體關(guān)聯(lián)類及其屬性,構(gòu)造該試題的決策形式背景,如表1所示.表1中:G為試題的實(shí)體關(guān)聯(lián)類集合,G={‘國(guó)際組織’,‘貿(mào)易限制’,‘關(guān)稅’,‘稅收’,‘主要職能’},以X1—X5表示;M為實(shí)體的屬性集,M=[‘惠關(guān)稅’,‘保護(hù)關(guān)稅’,‘聯(lián)合國(guó)’,‘世界衛(wèi)生組織’,‘管理國(guó)際問題’],以C1—C5表示;試題的4個(gè)選項(xiàng)作為決策屬性集N,N=[‘IOC’,‘OAO’,‘OPEC ’,‘WTO’],以V1—V4表示;×表示XI對(duì)象具有CJ/VJ屬性,其中對(duì)象與屬性的關(guān)系以I表示,對(duì)象與決策屬性的關(guān)系以J表示.

        表1 決策形式背景

        2.2 試題文本的三支概念格構(gòu)建

        表1所示決策形式背景的三支概念格具體構(gòu)建過程為:

        1) 構(gòu)造表1所示決策形式背景的補(bǔ)背景L(K-),如表2所示.

        表2 決策形式背景的補(bǔ)背景

        2) 采用Cbo算法[14-15,17]構(gòu)建表1所示決策形式背景的概念格L(G,M,I)和L(G,N,J),如圖1、圖2所示.

        圖1 概念格L(G,M,I)

        圖2 概念格L(G,N,J)

        3) 采用文獻(xiàn)[17]中的三支概念格構(gòu)造算法,分別構(gòu)建表1所示決策形式背景的對(duì)象導(dǎo)出三支概念格OEL(G,M,I)和OEL(G,N,J),如圖3、圖4所示.同理,構(gòu)建屬性導(dǎo)出三支概念格AEL(G,N,J)和AEL(G,M,I),如圖5、圖6所示.

        圖3 對(duì)象導(dǎo)出三支概念格OEL(G,M,I)

        圖4 對(duì)象導(dǎo)出三支概念格OEL(G,N,J)

        圖5 屬性導(dǎo)出三支概念格AEL(G,N,J)

        圖6 屬性導(dǎo)出三支概念格AEL(G,M,I)

        4) 對(duì)于屬性導(dǎo)出候選三支概念格AEL(K)中的((A1,B1),C1)和((A2,B2),C2),若C1=C2 且 (A1?A2或B1?B2),則((A1,B1),C1)作為冗余概念刪除;對(duì)于對(duì)象導(dǎo)出候選三支概念格OEL(K)中的(A1,(B1,C1))和((A2((B2,C2)),若A1=A2且(C1?C2或B1?B2),則(A1,(B1,C1))作為冗余概念刪除.

        2.3 基于三支合并概念格的試題文本決策規(guī)則提取

        在構(gòu)建對(duì)象/屬性導(dǎo)出三支概念格基礎(chǔ)上,構(gòu)建對(duì)象/屬性導(dǎo)出合并三支概念格OAEL(G,M,I)和對(duì)象/屬性導(dǎo)出合并三支概念格OAEL(G,N,J),然后基于所構(gòu)建的對(duì)象/屬性導(dǎo)出合并三支概念格實(shí)現(xiàn)決策規(guī)則提取.基于對(duì)象/屬性導(dǎo)出合并三支概念格的規(guī)則提取流程為:

        1) 構(gòu)建決策形式背景的補(bǔ)背景;

        2) 根據(jù)形式背景分別生成概念格L(G,M,I)與決策概念格L(G,N,J);

        3) 對(duì)概念格L(G,M,I)分別構(gòu)建對(duì)象導(dǎo)出三支概念格OEL(G,M,I)與屬性導(dǎo)出三支概念格AEL(G,M,I);

        4) 對(duì)概念格L(G,N,J)分別構(gòu)建屬性導(dǎo)出三支概念格AEL(G,N,J)與屬性導(dǎo)出三支概念格AEL(G,N,J);

        5) 對(duì)AEL(G,M,I)中的每個(gè)概念((X,Y),A)),若OEL(G,M,I)中存在對(duì)應(yīng)概念(X,(A,B))或(Y,(B,A)),則生成新概念((X,Y), (A,B)),基于以上方法,根據(jù)表1的決策形式背景(G,M,I,N,J),分別構(gòu)建對(duì)象/屬性導(dǎo)出合并三支概念格OAEL(G,M,I)與對(duì)象/屬性導(dǎo)出合并三支概念格OAEL(G,N,J);

        6) 若OAEL(G,M,I)中存在概念((X,Y),(A,B)),OAEL(G,N,J)中存在概念((Z,W),(C,D)),且滿足X?Z、Y?W,則導(dǎo)出新規(guī)則R=R∪{A→C,B→D},相比文獻(xiàn)[17]中X=Z且Y=W時(shí)導(dǎo)出的規(guī)則,該方法可以得到更多有用規(guī)則,但同時(shí)也會(huì)生成更多冗余規(guī)則;

        7) 去除冗余規(guī)則,對(duì)規(guī)則(X,{A→C})和((Y,{B→D}),若滿足X=Y、A?B、C?D,則規(guī)則((Y,{B→D})是冗余規(guī)則,同時(shí),前提或結(jié)論為?的規(guī)則也為冗余規(guī)則;

        8) 簡(jiǎn)化規(guī)則,對(duì)于規(guī)則A→C、規(guī)則B→F,若有A=B,則用新規(guī)則A→C∪F替代原規(guī)則;

        9) 置信度計(jì)算,進(jìn)一步優(yōu)化規(guī)則.

        這里,規(guī)則的置信度和支持度分別定義為:

        (1)

        式中:X為對(duì)象集;V為決策屬性集;L(V)為決策屬性為VI的對(duì)象構(gòu)成的集合.

        3 試驗(yàn)結(jié)果與分析

        3.1 試驗(yàn)數(shù)據(jù)

        本文以地理課程為例,試驗(yàn)數(shù)據(jù)主要來自學(xué)科網(wǎng)、新東方在線網(wǎng)絡(luò)課程、億庫(kù)地理、組卷網(wǎng)、百度百科以及中學(xué)地理課程教材,收集了1 027道地理選擇題,題型涵蓋了地理試題中10個(gè)不同的類.

        3.2 試驗(yàn)結(jié)果分析

        為驗(yàn)證本文所提隱含解題知識(shí)獲取方法對(duì)自動(dòng)解題的貢獻(xiàn),在前期開發(fā)的地理課程自動(dòng)解題原型系統(tǒng)的基礎(chǔ)上,通過向原來的本體知識(shí)庫(kù)加入所獲取的三支概念格規(guī)則來驗(yàn)證實(shí)際解題效果.

        表3給出了傳統(tǒng)本體知識(shí)庫(kù)及加入三支概念格規(guī)則后的本體知識(shí)庫(kù)在各類試題上的有效解題結(jié)果.由表3可見:與傳統(tǒng)本體知識(shí)庫(kù)的自動(dòng)解題效果相比,加入三支概念格規(guī)則的本體知識(shí)庫(kù)自動(dòng)解題效果比傳統(tǒng)方法提高了4.8%;加入三支概念格規(guī)則的本體知識(shí)庫(kù)在對(duì)比類、陳述類試題上的解題效果有明顯提升,這是因?yàn)檫@類試題的解答往往需要一定的推理,而基于三支概念分析從試題文本中所獲取的相關(guān)決策規(guī)則在推理方面有明顯的優(yōu)勢(shì);本文所提方法在含有圖片或表格類試題上的解題效果提升不明顯,這是因?yàn)樵跇?gòu)建試題本體時(shí)是通過百度API接口實(shí)現(xiàn)圖片文字識(shí)別并結(jié)合人工描述圖片信息,而圖片文字識(shí)別技術(shù)及人工描述圖片信息可能與實(shí)際信息存在一定出入,對(duì)于這類題目往往不能構(gòu)建出有效本體.后續(xù)研究將考慮引入OpenCV模塊實(shí)現(xiàn)圖片非文字信息的圖像識(shí)別.

        表3 傳統(tǒng)本體知識(shí)庫(kù)和加入三支概念格規(guī)則的本體知識(shí)庫(kù)在各類試題上的有效解題結(jié)果

        4 結(jié)語(yǔ)

        針對(duì)現(xiàn)有自動(dòng)解題系統(tǒng)難以獲取試題文本中隱含解題知識(shí)的問題,本文基于三支概念分析理論,通過決策形式背景構(gòu)造、三支概念格構(gòu)建和決策規(guī)則提取,實(shí)現(xiàn)試題文本中隱含解題知識(shí)的獲取.同時(shí),將所獲取的這些隱含解題知識(shí)加入到傳統(tǒng)的本體知識(shí)庫(kù)中,以提升現(xiàn)有自動(dòng)解題系統(tǒng)的解題效果.試驗(yàn)結(jié)果驗(yàn)證了三支概念格規(guī)則對(duì)自動(dòng)解題的有效性.后續(xù)研究中,將逐步擴(kuò)大試題集規(guī)模和覆蓋面,使得本文方法具有更好的適用性;對(duì)其他學(xué)科(比如歷史/語(yǔ)文學(xué)科)的試題進(jìn)行試驗(yàn),進(jìn)一步驗(yàn)證本文方法的通用性.

        猜你喜歡
        概念分析實(shí)體試題
        科幻與科普的關(guān)系:基于歷史文獻(xiàn)和概念分析的討論
        2021年高考數(shù)學(xué)模擬試題(四)
        前海自貿(mào)區(qū):金融服務(wù)實(shí)體
        2019年高考數(shù)學(xué)模擬試題(五)
        《陳涉世家》初三復(fù)習(xí)試題
        2019屆高考數(shù)學(xué)模擬試題(二)
        實(shí)體的可感部分與實(shí)體——兼論亞里士多德分析實(shí)體的兩種模式
        兩會(huì)進(jìn)行時(shí):緊扣實(shí)體經(jīng)濟(jì)“釘釘子”
        振興實(shí)體經(jīng)濟(jì)地方如何“釘釘子”
        “有無對(duì)比法”在經(jīng)濟(jì)評(píng)價(jià)中的運(yùn)用及相關(guān)概念分析
        激情偷拍视频一区二区| 国产在线精品一区二区不卡| 亚洲VA不卡一区| 色婷婷亚洲一区二区在线| 极品尤物精品在线观看| 丰满少妇三级全黄| 国产av天堂成人网| av网址大全在线播放| 中文字幕精品一区二区三区| 国产精品亚洲αv天堂无码| 色综合天天网| 国产美女遭强高潮网站| 国产高清白浆| 成人免费av高清在线| 波多野结衣爽到高潮大喷| 1000部精品久久久久久久久 | 国产免费视频一区二区| 水蜜桃精品视频在线观看| 毛片a级毛片免费观看| 国产AV无码一区精品天堂| 久久99久久99精品观看| 97精品熟女少妇一区二区三区| 乱色精品无码一区二区国产盗| 久久久久99精品成人片试看| 成人国产自拍在线播放| 日本不卡在线视频二区三区| 中文字幕在线亚洲日韩6页| 手机看片国产日韩| 亚洲一区二区视频蜜桃| 国产一级内射视频在线观看| 亚洲av成人无码网站…| 欧美日韩在线观看免费| 亚洲av免费高清不卡| 人妻夜夜爽天天爽三区丁香花| 精产国品一二三产区m553麻豆 | 精品久久有码中文字幕| 中国丰满熟妇av| 久久99久久99精品观看| 日本a级一级淫片免费观看| 亚洲精品午夜无码电影网| 国产高清国内精品福利99久久 |