亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        古詩(shī)詞文化交融的學(xué)習(xí)教育平臺(tái)建設(shè)研究

        2024-05-16 16:37:41梁藝馨翟潔李東睿熊瀚銳
        中國(guó)新通信 2024年4期
        關(guān)鍵詞:知識(shí)圖譜可視化古詩(shī)詞

        梁藝馨 翟潔 李東睿 熊瀚銳

        摘要:針對(duì)當(dāng)前古詩(shī)詞及相關(guān)領(lǐng)域知識(shí)數(shù)量龐大且關(guān)聯(lián)性較弱的情況,本文研究了古詩(shī)詞知識(shí)圖譜可視化的相關(guān)技術(shù)。本平臺(tái)的搭建包括可視化圖譜展示、智能問(wèn)答、古詩(shī)分類(lèi)、詩(shī)人行跡等核心模塊。本文給出了相應(yīng)的關(guān)鍵技術(shù)和實(shí)現(xiàn)算法,并利用以上技術(shù)搭建了一個(gè)高交互性的可視化系統(tǒng)。該系統(tǒng)以圖譜形式對(duì)古詩(shī)詞及相關(guān)知識(shí)進(jìn)行可視化展示,為學(xué)習(xí)者提供了一個(gè)交互性強(qiáng)、趣味性高的古詩(shī)詞學(xué)習(xí)可視化學(xué)習(xí)教育平臺(tái),具有較高的教育教學(xué)價(jià)值,同時(shí)可以為相關(guān)領(lǐng)域的學(xué)習(xí)者提供一個(gè)針對(duì)性強(qiáng)的古詩(shī)詞知識(shí)庫(kù)。

        關(guān)鍵詞:古詩(shī)詞;知識(shí)圖譜;可視化;文本識(shí)別;意象分類(lèi)

        眾所周知,古詩(shī)詞是中華文明五千年的傳承,是每個(gè)中國(guó)人生長(zhǎng)的土壤,然而,在全面智能化的今天,國(guó)內(nèi)關(guān)于古詩(shī)詞的知識(shí)圖譜仍不完善,導(dǎo)致古詩(shī)詞和傳統(tǒng)文化的知識(shí)網(wǎng)絡(luò)還比較零散,缺乏有機(jī)結(jié)合。此外,目前還沒(méi)有一個(gè)完整的、收錄并分類(lèi)總結(jié)古詩(shī)詞意象的知識(shí)庫(kù),也不存在可以將古詩(shī)詞自動(dòng)分類(lèi)的系統(tǒng)。

        為了解決上述問(wèn)題,本文基于可視化與自然語(yǔ)言處理技術(shù),創(chuàng)建了一個(gè)基于古詩(shī)詞和其他傳統(tǒng)文化交融的學(xué)習(xí)教育平臺(tái),本平臺(tái)具有可視化圖譜展示、智能問(wèn)答、古詩(shī)分類(lèi)和詩(shī)人行跡等四個(gè)核心模塊,可以有效地解決學(xué)習(xí)者在閱讀和欣賞古詩(shī)詞時(shí)由于相關(guān)知識(shí)缺乏,無(wú)法進(jìn)行良好的學(xué)習(xí)和記憶,以及學(xué)習(xí)者難以在大量的古詩(shī)詞和傳統(tǒng)文化數(shù)據(jù)中高效獲取所需信息的問(wèn)題。

        一、實(shí)現(xiàn)可視化圖譜的相關(guān)技術(shù)介紹

        (一)古詩(shī)詞領(lǐng)域知識(shí)庫(kù)構(gòu)建

        本文以權(quán)威的古詩(shī)詞網(wǎng)站和專(zhuān)業(yè)古典文學(xué)書(shū)籍為基礎(chǔ),創(chuàng)建了對(duì)象-古詩(shī)詞類(lèi)別庫(kù),基于事件間的因果邏輯的自然文本處理技術(shù),并結(jié)合事理知識(shí)圖譜的構(gòu)建創(chuàng)建了古詩(shī)詞-事件知識(shí)庫(kù),將上述兩個(gè)知識(shí)庫(kù)融合為描述對(duì)象-古詩(shī)詞-事理庫(kù)。

        (二)歷史沿革事理圖譜子圖構(gòu)建

        將事理知識(shí)圖譜和智能化技術(shù)運(yùn)用于古詩(shī)詞、中國(guó)歷史等領(lǐng)域,不僅有益于對(duì)中華優(yōu)秀傳統(tǒng)文化進(jìn)行推廣和學(xué)習(xí),還起到了知識(shí)融合的效果。通過(guò)事件關(guān)系抽取技術(shù)[1],我們獲得古詩(shī)詞中事件間的邏輯關(guān)系,并實(shí)現(xiàn)了事理古詩(shī)詞知識(shí)庫(kù)的搭建,同時(shí)構(gòu)建了面向古詩(shī)詞學(xué)習(xí)等熱點(diǎn)的因果事理圖譜。通過(guò)這種方法構(gòu)建的古詩(shī)詞學(xué)習(xí)平臺(tái),相比傳統(tǒng)的古詩(shī)詞學(xué)習(xí)方法,節(jié)省了整合資源的時(shí)間,提高學(xué)習(xí)者獲取關(guān)鍵信息的速度,滿足人們對(duì)學(xué)習(xí)和閱讀古詩(shī)詞的需求,具有重要意義。

        1.描述對(duì)象-古詩(shī)詞-歷史事件庫(kù)的構(gòu)建

        本文采用自頂向下的方法進(jìn)行描述對(duì)象-古詩(shī)詞-歷史事件庫(kù)的構(gòu)建,因此,首先需要?jiǎng)?chuàng)建模式圖,包括:

        ①總體模式圖

        總體模式圖包括:古詩(shī)詞中事物實(shí)體、人物實(shí)體、景物實(shí)體、古詩(shī)詞實(shí)體、歷史事件實(shí)體及實(shí)體間的關(guān)系。

        ②歷史事件事理圖譜的模式圖

        為了直觀展示古詩(shī)詞-古建筑內(nèi)部的聯(lián)系以及二者之間的關(guān)系,首先要建立古詩(shī)詞-古建筑層次結(jié)構(gòu)圖。

        在古詩(shī)詞領(lǐng)域中,存在很多上下位關(guān)系。本項(xiàng)目采用作者、時(shí)期(即朝代)等因素作為古詩(shī)詞相關(guān)知識(shí)的下層知識(shí)。作者、時(shí)期又各自包含其他子概念,從而形成上下位關(guān)系的層次結(jié)構(gòu)。

        此外,為了更清晰地描述圖譜的結(jié)構(gòu),本文根據(jù)一部分歷史事件知識(shí)實(shí)體創(chuàng)建了歷史事件事理圖譜的模式圖。該模式圖使用整體和先后關(guān)系、并列關(guān)系以及因果關(guān)系的圖示來(lái)描述事理圖譜的結(jié)構(gòu)概念。

        圖1展示了歷史事件事理圖譜一部分的整體結(jié)構(gòu),從圖中每個(gè)圓圈節(jié)點(diǎn)代表歷史事件,節(jié)點(diǎn)之間的有向連線代表關(guān)系。

        2.歷史事件事理圖譜子圖的構(gòu)建算法

        事件事理圖譜全圖構(gòu)建的基本思路為:匹配全圖,截取子圖。

        事件事理圖譜子圖構(gòu)建的算法:①提取起止事件節(jié)點(diǎn);②使用起止節(jié)點(diǎn)和全圖中的所有節(jié)點(diǎn)進(jìn)行匹配;③在全圖中取起止節(jié)點(diǎn)之間的所有節(jié)點(diǎn)以及起止節(jié)點(diǎn);④取這些節(jié)點(diǎn)之間的全部有向邊。

        從一首古詩(shī)詞的賞析文本中提取到對(duì)應(yīng)的起始事件節(jié)點(diǎn)和終止事件節(jié)點(diǎn),將其存入事件子圖數(shù)據(jù)表中,當(dāng)需要構(gòu)建一個(gè)相應(yīng)子圖時(shí),將這兩個(gè)起止事件節(jié)點(diǎn)與圖譜全圖中的事件節(jié)點(diǎn)進(jìn)行對(duì)比匹配,匹配成功后選取起止事件節(jié)點(diǎn)及兩者之間的所有事件節(jié)點(diǎn)作為子圖。

        二、智能問(wèn)答部分的技術(shù)實(shí)現(xiàn)

        (一)智能問(wèn)答的實(shí)現(xiàn)流程

        該模塊提供模糊查詢的功能。學(xué)習(xí)者在搜索欄輸入問(wèn)題后點(diǎn)擊“確認(rèn)”按鈕,后臺(tái)會(huì)提取學(xué)習(xí)者問(wèn)題中的關(guān)鍵詞,并與存儲(chǔ)的問(wèn)題庫(kù)進(jìn)行相似性計(jì)算。系統(tǒng)將根據(jù)相似度從高到低的順序顯示相關(guān)的答案,讓用戶選擇最關(guān)心的問(wèn)題,并給出相應(yīng)的答案,從而使學(xué)習(xí)者獲取相關(guān)的知識(shí)內(nèi)容及回答,輸出結(jié)果如圖2所示。

        此外,如果學(xué)習(xí)者輸入的搜索內(nèi)容為空,則不進(jìn)行頁(yè)面跳轉(zhuǎn),保持原頁(yè)面不變。如果搜索內(nèi)容不為空且在后臺(tái)數(shù)據(jù)庫(kù)中有相關(guān)的數(shù)據(jù)存儲(chǔ),則顯示相應(yīng)的結(jié)果。如果沒(méi)有相關(guān)的數(shù)據(jù)存儲(chǔ),則不進(jìn)行頁(yè)面跳轉(zhuǎn),仍然顯示原頁(yè)面。學(xué)習(xí)者可以點(diǎn)擊“重置”按鈕清空輸入欄中的內(nèi)容,以便進(jìn)行重新搜索。

        (二)古詩(shī)詞分類(lèi)模塊的技術(shù)實(shí)現(xiàn)

        1. 意象實(shí)體識(shí)別

        漢語(yǔ)作為象形文字,相對(duì)于拼音文字如英文而言更為復(fù)雜,并且古詩(shī)詞與現(xiàn)代漢語(yǔ)的句型、句式存在差異,其中包括倒裝、駢句、省略等現(xiàn)象,這些現(xiàn)象會(huì)對(duì)識(shí)別產(chǎn)生重大影響,導(dǎo)致沖突。因此本項(xiàng)目選擇使用“基于神經(jīng)網(wǎng)絡(luò)”的命名體識(shí)別[2]方法。

        盡管如此,由于古詩(shī)詞文體的特殊性,針對(duì)古詩(shī)詞的NER任務(wù)[3]來(lái)說(shuō)往往要更有挑戰(zhàn)性,下面列舉幾點(diǎn):

        中文文本中不存在明顯的界限標(biāo)志,而且“詞”在中文里本來(lái)就是一個(gè)很模糊的概念,中文也不具備英文中的字母大小寫(xiě)等形態(tài)指示。

        古詩(shī)詞的用字、句型靈活多變,有些詞語(yǔ)在脫離上下文語(yǔ)境的情況下無(wú)法判斷是否是命名實(shí)體,即使是命名實(shí)體,當(dāng)其處在不同的上下文語(yǔ)境下,可能表示不同的實(shí)體類(lèi)型,此外古詩(shī)詞中存在許多特殊句式,增加了實(shí)體識(shí)別的難度。例如“腰白玉之環(huán)”中存在“腰”名詞動(dòng)用為“在腰上佩戴”;“將軍角弓不得控,都護(hù)鐵衣冷難著?!敝写嬖诨ノ默F(xiàn)象。

        命名實(shí)體存在嵌套現(xiàn)象,例如“氣蒸云夢(mèng)澤,波撼岳陽(yáng)城”在“岳陽(yáng)城”中還嵌套著同樣是地名的“陽(yáng)城”,而且這種現(xiàn)象在具體地名中尤其嚴(yán)重,容易導(dǎo)致分析詩(shī)句描寫(xiě)地點(diǎn)時(shí)判別錯(cuò)誤。

        ④古詩(shī)詞中存在借代和引用的情況,如《滕王閣序》中出現(xiàn)了“勝地不常,盛筵難再;蘭亭已矣,梓澤丘墟。”這里提到了“蘭亭”這一古建筑名稱(chēng),但實(shí)際上,該文是在描寫(xiě)滕王閣而非蘭亭。

        ⑤古詩(shī)詞里廣泛存在簡(jiǎn)化表達(dá)現(xiàn)象,例如,在“煙波江上使人愁”中的“江”實(shí)際指的是“長(zhǎng)江”,但在“醉不成歡慘將別,別時(shí)茫茫江浸月”中的江則指代的是“湓江”,因此,要分析簡(jiǎn)化表達(dá)所指代的具體地名,必須結(jié)合上下文和寫(xiě)作背景,不能一概而論。

        ⑥命名體(本項(xiàng)目研究的古詩(shī)詞意象)中普遍存在相同意象卻有不同的名稱(chēng),如“月華”“小蟾”“玄兔”等都是用來(lái)表示月亮的,而“金陵”“石頭城”“江寧”都是現(xiàn)南京的別稱(chēng),如果不進(jìn)行分類(lèi)總結(jié),將會(huì)極大程度降低意象的代表性和相似性。

        為了解決上述問(wèn)題,本項(xiàng)目選擇使用基于字的BiLSTM-CRF[4]模型

        2.實(shí)現(xiàn)原理

        經(jīng)過(guò)分析,本團(tuán)隊(duì)認(rèn)為古詩(shī)詞分類(lèi)的最主要依據(jù)是古詩(shī)詞中包括的意象。例如,包含“樓蘭”“玉門(mén)關(guān)”“羌笛”的古詩(shī)詞很大概率屬于“邊塞詩(shī)”;包含“畫(huà)眉”“妝奩”的古詩(shī)詞多屬于“閨怨詩(shī)”。因此,本團(tuán)隊(duì)選擇“意象”作為古詩(shī)詞分類(lèi)的依據(jù)。具體實(shí)現(xiàn)原理如下:

        本文篩選出第一層級(jí)的意象,如“羌笛”“胡雁”等具有唯一指向性的意象,如表2所示,只要詩(shī)詞中存在此意象,就直接將該詩(shī)劃分為“邊塞詩(shī)”;對(duì)于第二層級(jí)的意象,如“柳”“杜宇”等具有典型性但不具有唯一指向性的意象,如表3所示,利用相關(guān)性計(jì)算,最后求出該詩(shī)詞是各種類(lèi)別詩(shī)詞的可能,從而進(jìn)行分類(lèi)。而對(duì)于第三層級(jí)的意象,如“白云”“流水”“青山”“日出”“溫泉”“山茶”等不具有指向性的意象,本項(xiàng)目采取自動(dòng)剔除的措施,即此類(lèi)意象不參與詩(shī)詞類(lèi)別的劃分。

        3.技術(shù)實(shí)現(xiàn)

        本項(xiàng)目收錄了古詩(shī)詞網(wǎng)記載的古詩(shī)詞,從中選取了最具代表性的“唐詩(shī)三百首”和“宋詞三百首”,作為樣本,通過(guò)人工標(biāo)注意象的形式,利用基于字的BiLSTM-CRF模型,評(píng)測(cè)中所采用BIO標(biāo)注集,劃分結(jié)果如表4所示。

        構(gòu)建古詩(shī)詞中的同義詞詞庫(kù),如:“月華”“小蟾”“玄兔”等都是用來(lái)表示月亮的,而“金陵”“石頭城”“江寧”等都是現(xiàn)南京的別稱(chēng),如果不加以分類(lèi)總結(jié),會(huì)極大程度降低意象的代表性和相似性,因此在意象分析的時(shí)候,本項(xiàng)目選擇構(gòu)建一個(gè)同義詞詞庫(kù),如表5所示,進(jìn)而提高結(jié)果的正確率。

        三、詩(shī)人行跡部分的技術(shù)實(shí)現(xiàn)

        (一)地點(diǎn)實(shí)體識(shí)別

        本文基于智能問(wèn)答模塊構(gòu)建的意象庫(kù),構(gòu)建了“地點(diǎn)庫(kù)”,用以識(shí)別詩(shī)詞中包含的地點(diǎn)信息,從而服務(wù)于后續(xù)的詩(shī)人行跡的地圖繪制。

        (二)詩(shī)詞地圖的繪制

        本項(xiàng)目收錄百度百科上的詩(shī)人“人物生平”部分,并按詩(shī)人劃分存入文件,后將詩(shī)人生平文本在“地點(diǎn)庫(kù)”遍歷一遍,輸出地點(diǎn)識(shí)別結(jié)果。

        后將識(shí)別出的全部地點(diǎn)遍歷“省數(shù)據(jù)庫(kù)”,將地點(diǎn)精確到“省”。

        利用百度地圖提供的基于百度地圖的應(yīng)用程序接口,在地圖上標(biāo)注出識(shí)別到的地點(diǎn)。

        導(dǎo)入詩(shī)人詩(shī)詞庫(kù),按照地點(diǎn)分類(lèi),歸類(lèi)到對(duì)應(yīng)的地點(diǎn)坐標(biāo)下。

        四、結(jié)束語(yǔ)

        為了解決當(dāng)下古詩(shī)詞知識(shí)圖譜不完善的問(wèn)題,本項(xiàng)目基于可視化和命名實(shí)體識(shí)別技術(shù)搭建了一個(gè)學(xué)習(xí)教育平臺(tái),該平臺(tái)包括可視化圖譜展示、智能問(wèn)答、古詩(shī)分類(lèi)和詩(shī)人行跡等四個(gè)核心模塊。為了實(shí)現(xiàn)詩(shī)人行跡和詩(shī)詞分類(lèi)的功能,本項(xiàng)目提出并實(shí)現(xiàn)了意象識(shí)別算法,并創(chuàng)新提出了第一層級(jí)意象、第二層級(jí)意象和第三層級(jí)意象的概念。這可以有效解決學(xué)者在閱讀和鑒賞古詩(shī)詞時(shí)由于相關(guān)知識(shí)的缺乏而無(wú)法很好地學(xué)習(xí)和記憶,以及文學(xué)工作者在大量的古詩(shī)詞和傳統(tǒng)文化數(shù)據(jù)中高效獲取所需信息的問(wèn)題。

        作者單位:梁藝馨 翟潔 李東睿 熊瀚銳 華東理工大學(xué)

        參考文獻(xiàn)

        [1] 姜磊,劉琦,趙肄江等.面向知識(shí)圖譜的信息抽取技術(shù)綜述[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2022,31(07):46-54.

        [2] 陳志峰. 基于深度神經(jīng)網(wǎng)絡(luò)的中文命名實(shí)體識(shí)別方法研究[D].福建工程學(xué)院,2022.

        [3] 張鳳荔,黃鑫,王瑞錦等.基于BERT多知識(shí)圖融合嵌入的中文NER模型[J].電子科技大學(xué)學(xué)報(bào),2023,52(03):390-397.

        [4] 湯潔儀,李大軍,劉波.基于BERT-BiLSTM-CRF模型的地理實(shí)體命名實(shí)體識(shí)別[J].北京測(cè)繪,2023,37(02):143-147.

        梁藝馨(2002.10-),女,漢族,遼寧東港,本科,學(xué)生,研究方向:智能科學(xué)與技術(shù);

        翟潔(1977-)女,漢族,江蘇南通,華東理工大學(xué),講師,研究方向:大模型、知識(shí)圖譜、大數(shù)據(jù)分析、教育改革與發(fā)展;

        李東睿(2002.03.14-),男,漢族,黑龍江牡丹江,本科,學(xué)生,研究方向:智能科學(xué)與技術(shù);

        熊瀚銳(2002.6.28),男,漢族,湖南常德,本科,學(xué)生,研究方向:軟件工程。

        猜你喜歡
        知識(shí)圖譜可視化古詩(shī)詞
        基于CiteSpace的足三里穴研究可視化分析
        踏青古詩(shī)詞
        基于Power BI的油田注水運(yùn)行動(dòng)態(tài)分析與可視化展示
        云南化工(2021年8期)2021-12-21 06:37:54
        基于CGAL和OpenGL的海底地形三維可視化
        “融評(píng)”:黨媒評(píng)論的可視化創(chuàng)新
        我和古詩(shī)詞
        趣讀古詩(shī)詞
        近十五年我國(guó)小學(xué)英語(yǔ)教學(xué)研究的熱點(diǎn)、問(wèn)題及對(duì)策
        基于知識(shí)圖譜的產(chǎn)業(yè)集群創(chuàng)新績(jī)效可視化分析
        基于知識(shí)圖譜的智慧教育研究熱點(diǎn)與趨勢(shì)分析
        明星性猛交ⅹxxx乱大交| 国内精品久久久久久无码不卡 | 精品亚洲成a人在线观看 | 国产亚洲成av人片在线观黄桃| 99久久综合精品五月天| 乱伦一区二| 日本高清一区二区三区视频| 亚洲av综合日韩精品久久| 漂亮人妻被强了完整版| 久久99精品久久水蜜桃| 3d动漫精品啪啪一区二区下载| 中文字幕无码家庭乱欲| 欧美黑人xxxx性高清版| 久久久久无码中文字幕| 丝袜美腿在线播放一区二区| 国产综合精品久久99之一| 色偷偷偷久久伊人大杳蕉| 色老汉免费网站免费视频| 亚洲国产精品自产拍久久蜜AV | 欧洲国产精品无码专区影院| 全程国语对白资源在线观看| 国产91精品高潮白浆喷水| 精品久久久久久无码中文字幕| 国产suv精品一区二区69| 精品人妻一区二区三区蜜桃| 91九色极品探花内射| 精品久久综合日本久久综合网| 俺去啦最新地址| 亚洲av无码不卡| 国产成人自产拍免费视频| 精品国产a毛片久久久av| 国产玉足榨精视频在线观看| 毛片亚洲av无码精品国产午夜| 久热香蕉精品视频在线播放| 人人爽亚洲aⅴ人人爽av人人片| 国产午夜三级精品久久久| 国产精品国产三级国产专区不| 亚洲女同一区二区| 久久精品国产精品国产精品污| 国产精品无码专区综合网| 澳门精品一区二区三区|