關(guān)鍵詞:作戰(zhàn)指揮;教材;知識圖譜
0 引言
教材作為人類知識的主要載體,其內(nèi)容和形式直接影響能力培養(yǎng)、教學(xué)效果和學(xué)習(xí)效率。高質(zhì)量教材體系的建設(shè)是一個全面而復(fù)雜的過程,涉及多個方面的內(nèi)容和目標(biāo)。教材體系可按教育階段、內(nèi)容形式和學(xué)科體系等方式進(jìn)行分類,系統(tǒng)化、規(guī)范化的一套教材及其管理機(jī)制對學(xué)科專業(yè)建設(shè)具有重要影響。知識圖譜(Knowledge Graph) 作為知識組織和知識表示的新技術(shù),已在多個領(lǐng)域顯現(xiàn)出強(qiáng)大的專業(yè)知識信息整合能力和智能檢索能力。知識圖譜在教育領(lǐng)域的研究由來已久,研究范圍包括基于知識圖譜的新型教材建設(shè)[1]、學(xué)科核心素養(yǎng)發(fā)展導(dǎo)向的教育領(lǐng)域知識圖譜構(gòu)建[2]、基于知識圖譜的教育數(shù)字化轉(zhuǎn)型,以及基于知識圖譜的增強(qiáng)型混合式學(xué)習(xí)的教學(xué)實(shí)踐與思考[3]等。面向不同教育層次的知識圖譜是實(shí)現(xiàn)個性化授導(dǎo)的基礎(chǔ),也是教育人工智能領(lǐng)域需要優(yōu)先開展的基礎(chǔ)性工作[4]。
本文主要從橫向和縱向兩個維度考慮作戰(zhàn)指揮教材體系的構(gòu)建。橫向維度關(guān)注單本教材的建設(shè),縱向維度則涉及教材對應(yīng)課程的學(xué)科專業(yè)體系。通過梳理教材建設(shè)與專業(yè)課程教材之間的邏輯關(guān)系,構(gòu)建軍隊(duì)院校作戰(zhàn)指揮教材的知識圖譜,探索基于知識圖譜的教材建設(shè)管理、教材體系研究和智能化學(xué)習(xí)輔助,為作戰(zhàn)指揮教材的發(fā)展提供新的視角和解決方案。
1 作戰(zhàn)指揮教材分析
作戰(zhàn)指揮是指揮員及其指揮機(jī)關(guān)對所屬部隊(duì)實(shí)施作戰(zhàn)的過程。作戰(zhàn)指揮教材是指面向教育教學(xué)和軍事學(xué)科發(fā)展需求,用于支撐教學(xué)大綱中明確的“作戰(zhàn)指揮”課程板塊教學(xué)的教材。這些教材遵循人才培養(yǎng)和作戰(zhàn)指揮能力生成的規(guī)律,突出學(xué)科知識體系和作戰(zhàn)基本理論,重點(diǎn)闡述各層級、各領(lǐng)域作戰(zhàn)指揮的基本內(nèi)容、程序和方法,體現(xiàn)院校教育的系統(tǒng)性、完整性和基礎(chǔ)性,為打牢各級指揮員的作戰(zhàn)指揮基本功提供有力支撐。
作戰(zhàn)指揮教材可以從多個角度進(jìn)行分類。從地位和作用角度分為核心教材、基本教材和拓展教材;從教育階段的角度分為本科階段教材、研究生階段教材、初級培訓(xùn)階段教材等;從內(nèi)容的角度分為理論教材和實(shí)踐教材;從學(xué)科分類的角度分為戰(zhàn)略指揮教材、戰(zhàn)役指揮教材、戰(zhàn)術(shù)教材和保障教材。
教材體系是指用統(tǒng)一的觀點(diǎn)來處理整個教學(xué)內(nèi)容,因此可按照教育和培訓(xùn)階段構(gòu)建教材架構(gòu),包括專科高等教育、本科高等教育、研究生教育等。各教育和培訓(xùn)階段可選取指揮相關(guān)專業(yè),并繼續(xù)選取用于支撐“作戰(zhàn)指揮”課程模塊教學(xué)的教材,戰(zhàn)略、聯(lián)合指揮、戰(zhàn)術(shù)和保障類教材全面覆蓋,從而構(gòu)成相對完整的作戰(zhàn)指揮教材體系。
在教材體系的梳理中,需要考慮兩個維度。一是橫向,即單本教材建設(shè)周期的維度,從申報、審批、編寫、審定到教材使用、評估反饋和更新的整個過程形成的體系;二是縱向,即從教材對應(yīng)課程的學(xué)科專業(yè)維度,形成教材知識點(diǎn)對學(xué)科知識點(diǎn)的涵蓋和銜接等體系。
1.1 教材建設(shè)周期維度
作戰(zhàn)指揮教材的建設(shè)生命周期包括教材申報、教材編寫、教材審定、教材使用、教材評價反饋和教材更新等環(huán)節(jié),如圖1所示。
教材申報:是教材使用單位根據(jù)教學(xué)大綱、人才培養(yǎng)方案和課程教學(xué)計(jì)劃等,明確教材適用對象、適用階段及教學(xué)目標(biāo),深入調(diào)研分析學(xué)員需求、教育政策及學(xué)科發(fā)展趨勢等因素,并向上級教材管理單位提出教材建設(shè)申請。
教材編寫:包括教材編寫計(jì)劃的制定、教材大綱的編寫、內(nèi)容的撰寫、自審和修訂,是教材建設(shè)周期的核心階段。應(yīng)由教學(xué)經(jīng)驗(yàn)豐富且具備深厚學(xué)術(shù)背景的專家擔(dān)任主編,組建編寫團(tuán)隊(duì),根據(jù)編寫依據(jù)進(jìn)行撰寫。編寫過程需經(jīng)歷多次修改和完善。
教材審定:是在教材編寫完成后,由本學(xué)科專業(yè)的專家和教材建設(shè)專家進(jìn)行綜合審定,嚴(yán)格按照編寫標(biāo)準(zhǔn)和程序,以確保教材質(zhì)量。
教材使用:是在審定通過后,投入實(shí)際教學(xué)中。新投入教學(xué)中的教材必須經(jīng)過2到3輪教學(xué)實(shí)踐檢驗(yàn),才能趨于穩(wěn)定。
評價反饋:是在教材使用過程中,通過收集和分析教員及學(xué)員對教材的使用感受、問題和質(zhì)量等方面的反饋信息,建立評價指標(biāo),對教材內(nèi)容和質(zhì)量進(jìn)行監(jiān)督和評估。通過評估現(xiàn)有教材的結(jié)構(gòu)、邏輯性和可讀性,確保教材內(nèi)容的系統(tǒng)性和連貫性,并監(jiān)控教材使用情況。一般教材評價指標(biāo)包括教材內(nèi)容結(jié)構(gòu)、適用性、知識的全面性、準(zhǔn)確性及深度、是否符合心理發(fā)展規(guī)律、學(xué)員能否通過教材掌握基本理論和技能、以及教材的呈現(xiàn)和配套資源等。
教材更新:是在評價反饋機(jī)制的基礎(chǔ)上,針對使用過程中收集的問題和建議,對教學(xué)內(nèi)容的邏輯性、實(shí)用性和實(shí)時性等方面進(jìn)行持續(xù)的改進(jìn)、修訂和更新。
1.2 學(xué)科專業(yè)維度
不同教材內(nèi)容之間的內(nèi)在聯(lián)系和順序安排,確保了教學(xué)內(nèi)容的連貫性、系統(tǒng)性和遞進(jìn)性,為學(xué)科專業(yè)和課程的培養(yǎng)目標(biāo)提供支撐,有助于學(xué)員逐步構(gòu)建知識體系。具體體現(xiàn)在以下幾個方面:
1) 層次性。教材知識點(diǎn)按照由淺入深的層次進(jìn)行組織,例如,先講解基礎(chǔ)理論,再深入高級理論;先教授簡單技能,再進(jìn)行技能進(jìn)階。此外,不同級別的教材也存在層次關(guān)系,以適應(yīng)不同階段能力培訓(xùn)目標(biāo)的需求。
2) 順序性。教材的順序性體現(xiàn)在教材內(nèi)容的安排上,按照邏輯順序進(jìn)行組織,并且先修教材為后續(xù)教材提供基礎(chǔ)知識。
3) 關(guān)聯(lián)性。不同教材之間可能存在內(nèi)容交叉和聯(lián)系。理順教材間的關(guān)聯(lián)性可以幫助學(xué)員理解知識點(diǎn)之間的內(nèi)在聯(lián)系,促進(jìn)綜合思維和能力的發(fā)展。
4) 遞進(jìn)性。教材內(nèi)容的設(shè)計(jì)應(yīng)體現(xiàn)知識和技能的遞進(jìn)發(fā)展,促進(jìn)學(xué)員在原有基礎(chǔ)上的拓展和深化,逐步建立知識體系結(jié)構(gòu),形成系統(tǒng)化的認(rèn)知。
5) 互補(bǔ)性。教材之間可能存在互補(bǔ)關(guān)系,例如,理論教材與實(shí)踐教材的結(jié)合,或不同視角和方法的教材相互補(bǔ)充,以提升學(xué)員對同一問題的理解深度和廣度。
軍隊(duì)院校作戰(zhàn)指揮教材涉及作戰(zhàn)指揮相關(guān)專業(yè),包括戰(zhàn)術(shù)、指揮和裝備等多類課程。從教育階段的角度對作戰(zhàn)指揮相關(guān)專業(yè)進(jìn)行體系梳理,各教育階段再按照專業(yè)進(jìn)行細(xì)分,各專業(yè)再按課程模塊進(jìn)行再細(xì)分,直到具體課程使用的具體教材。
2 作戰(zhàn)指揮教材知識圖譜介紹
2.1 教材知識圖譜
知識圖譜的概念最早由Google于2012年提出,主要用于完善搜索引擎。它是一種基于圖的數(shù)據(jù)結(jié)構(gòu),由節(jié)點(diǎn)(Point) 和邊(Edge) 組成[5]。每個節(jié)點(diǎn)表示一個“實(shí)體”,而每條邊則表示實(shí)體與實(shí)體之間的“關(guān)系”。知識圖譜本質(zhì)上是一種語義網(wǎng)絡(luò),使用符號形式結(jié)構(gòu)化地描述物理世界中的概念及其相互關(guān)系,如圖2 所示。
知識圖譜的基本元素包括實(shí)體(Entity) 、關(guān)系(Re?lation) 和屬性(Attribute) 。實(shí)體之間通過關(guān)系相互聯(lián)結(jié),形成復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)。三元組是構(gòu)建知識圖譜的核心,通常表示為<實(shí)體,關(guān)系,實(shí)體>或<實(shí)體,屬性,屬性值>的形式。通過三元組的組合和推導(dǎo),可以建立實(shí)體之間的關(guān)系和屬性,從而構(gòu)建出知識圖譜的結(jié)構(gòu)。其中,實(shí)體和屬性值構(gòu)成節(jié)點(diǎn),關(guān)系和屬性構(gòu)成邊。關(guān)系和屬性之間沒有明顯的界限,根據(jù)應(yīng)用場景和分析算法,兩者可以相互轉(zhuǎn)換。形式化描述為:知識圖譜G由模式圖Gs、數(shù)據(jù)圖Gd以及兩者之間的關(guān)系R組成。
其中,Ns表示類(節(jié)點(diǎn))的集合,Es表示屬性(邊)的集合,例如rdfs:subClassOf、rdfs:equivalentClass;Nd表示實(shí)例(實(shí)體)和字符串(屬性值)節(jié)點(diǎn)的集合,Ed表示邊的集合。Ns對應(yīng)知識圖譜中的概念,Nd對應(yīng)知識圖譜中的實(shí)體,Ed對應(yīng)知識圖譜中的關(guān)系,連接兩個節(jié)點(diǎn)表示一條三元組事實(shí),例如。
知識圖譜一般分為通用知識圖譜和領(lǐng)域知識圖譜。通用知識圖譜是一個通用知識的結(jié)構(gòu)化知識庫,包含了大量的事實(shí)性知識、概念性知識和詞匯性知識,覆蓋面廣,適用于多種領(lǐng)域和應(yīng)用場景。領(lǐng)域知識圖譜,也稱為行業(yè)知識圖譜或垂直知識圖譜[6],是特定領(lǐng)域的知識庫,例如金融知識圖譜、醫(yī)療知識圖譜、教育知識圖譜等。其構(gòu)建需要基于領(lǐng)域數(shù)據(jù),具備領(lǐng)域特征和嚴(yán)格的數(shù)據(jù)模式,必須對該領(lǐng)域知識的深度和準(zhǔn)確性有充分的理解。因此,領(lǐng)域知識圖譜通常具有更專業(yè)的知識結(jié)構(gòu)和更詳細(xì)的領(lǐng)域細(xì)節(jié)。
教材知識圖譜通過結(jié)構(gòu)化的知識表示和智能檢索技術(shù),極大地提升了教材的可管理性和教學(xué)的個性化水平,為教育領(lǐng)域的數(shù)字化轉(zhuǎn)型提供了有力支持。教材知識圖譜是教育行業(yè)的領(lǐng)域知識圖譜,利用知識圖譜技術(shù)重構(gòu)和展示教材體系的工具。它將教材建設(shè)內(nèi)容、學(xué)科專業(yè)、課程教材及教材知識點(diǎn)等視為構(gòu)建知識圖譜的實(shí)體,將知識點(diǎn)之間的包含關(guān)系、課程教材間的銜接關(guān)系及教材建設(shè)流程視為知識圖譜的關(guān)系。教材、知識點(diǎn)及其關(guān)系被視為三元組,通過圖形化方式組織教材體系,最終形成語義網(wǎng)。教材知識圖譜不僅能夠提高教學(xué)效率和質(zhì)量,還提供個性化學(xué)習(xí)體驗(yàn),支持智能教育模式,優(yōu)化教材內(nèi)容,建設(shè)新型教材,并促進(jìn)教育資源的共享,從而推動教學(xué)領(lǐng)域的數(shù)字化轉(zhuǎn)型。例如,許斌[7]提出的基礎(chǔ)教育知識圖譜在智慧教育中的應(yīng)用之一為知識鏈接,可以通過教材知識圖譜將某一知識點(diǎn)鏈接到各類教材中,查看不同層次和類型教材中的相關(guān)關(guān)系,從而促進(jìn)學(xué)員完善自身的知識體系。
2.2 作戰(zhàn)指揮教材知識圖譜應(yīng)用
作戰(zhàn)指揮教材知識圖譜為軍事教育和訓(xùn)練提供了創(chuàng)新的支持工具[8],特別是在提高教學(xué)效果、促進(jìn)知識理解和應(yīng)用等方面。應(yīng)用模式不僅需要緊密結(jié)合作戰(zhàn)指揮的實(shí)際需求,還要充分考慮教學(xué)過程中的認(rèn)知規(guī)律。作戰(zhàn)指揮類教材知識圖譜主要應(yīng)用在兩個方面,面向教學(xué)工作和面向教學(xué)管理工作。如圖3所示。
2.2.1 面向教學(xué)工作
針對作戰(zhàn)指揮教材的復(fù)雜性,構(gòu)建結(jié)構(gòu)化、可視化的知識體系能夠幫助學(xué)員更好地理解和掌握作戰(zhàn)指揮知識,并在腦海中系統(tǒng)形成作戰(zhàn)指揮的整體結(jié)構(gòu)。通過利用作戰(zhàn)指揮知識圖譜中的脈絡(luò)體系,并根據(jù)學(xué)員的知識背景、學(xué)習(xí)進(jìn)度和興趣提供定制化的學(xué)習(xí)路徑,引導(dǎo)學(xué)員逐步深入學(xué)習(xí),實(shí)現(xiàn)從理論到實(shí)踐的有效轉(zhuǎn)化。
2.2.2 面向教學(xué)管理工作
在教學(xué)管理層面,知識圖譜可以實(shí)現(xiàn)教材內(nèi)容的高效管理和應(yīng)用,提升教學(xué)內(nèi)容的組織性和系統(tǒng)性,同時促進(jìn)教學(xué)資源的共享和再利用。具體措施包括:
1) 知識點(diǎn)分類。對作戰(zhàn)指揮教材內(nèi)容進(jìn)行細(xì)致的分類,例如戰(zhàn)術(shù)原理、指揮流程、案例分析、裝備保障等,從而形成一個清晰的分類體系。
2) 教材內(nèi)容標(biāo)準(zhǔn)化。對每個分類下的知識點(diǎn)進(jìn)行標(biāo)準(zhǔn)化處理,包括統(tǒng)一術(shù)語、概念解釋和知識點(diǎn)結(jié)構(gòu),確保知識內(nèi)容的一致性和準(zhǔn)確性。
3) 教材體系分析。對現(xiàn)有的作戰(zhàn)指揮教材體系進(jìn)行深入分析,以確保教材內(nèi)容的全面性和系統(tǒng)性,識別可能存在的知識空白或重復(fù),從而為教材的優(yōu)化和更新提供科學(xué)依據(jù)。
4) 教材體系合理性分析。在教學(xué)管理工作中,確保教材體系在內(nèi)容、結(jié)構(gòu)和教學(xué)目標(biāo)方面的合理性,以為學(xué)員提供高效、系統(tǒng)的學(xué)習(xí)體驗(yàn)。
3 作戰(zhàn)指揮教材知識圖譜構(gòu)建
作戰(zhàn)指揮教材知識圖譜的構(gòu)建過程主要分為三個部分:知識建模、知識抽取和知識融合。
3.1 知識建模
在作戰(zhàn)指揮教材知識圖譜構(gòu)建過程中[5],主要包含以下步驟:
首先,構(gòu)建作戰(zhàn)指揮教材知識圖譜的模式層,通過結(jié)合專家知識,采用自上而下的方法構(gòu)建教材本體,并定義概念類及其相互之間的關(guān)系。
其次,進(jìn)行知識抽取工作,從教材中提取作戰(zhàn)指揮相關(guān)的知識三元組,并將其存儲在圖數(shù)據(jù)庫中。
最后,開展知識融合工作,并實(shí)現(xiàn)可視化展示,從而構(gòu)建出科學(xué)完整的作戰(zhàn)指揮教材知識圖譜。
1) 模式層。知識圖譜的概念模型,對數(shù)據(jù)層進(jìn)行規(guī)范和約束,可以采用本體作為知識圖譜的模式層。
2) 數(shù)據(jù)層。是本體的實(shí)例,知識以(實(shí)體1,關(guān)系,實(shí)體2) 或(實(shí)體3,屬性,屬性值)的三元組形式存儲。
知識建模即為構(gòu)建知識圖譜的模式層,如圖4所示。通過這種結(jié)構(gòu),可以有效地管理和利用作戰(zhàn)指揮教材的知識,提升教學(xué)質(zhì)量和管理效率。
知識建??梢圆捎米皂斚蛳隆⒆缘紫蛏匣騼烧呦嘟Y(jié)合的方式[10]。由于領(lǐng)域知識通常難以獲得、樣本數(shù)量有限且要求精度高,通常采取自頂向下的構(gòu)建方式,由領(lǐng)域?qū)<医Y(jié)合領(lǐng)域知識的特點(diǎn)進(jìn)行知識建模。自頂向下構(gòu)建知識圖譜的過程從頂層概念開始,逐步細(xì)化概念和關(guān)系,形成數(shù)據(jù)層次結(jié)構(gòu)。首先,確定頂層概念。領(lǐng)域?qū)<腋鶕?jù)專業(yè)知識和應(yīng)用場景設(shè)計(jì)領(lǐng)域的頂層概念和分類;然后細(xì)化概念和關(guān)系。確定頂層概念之后,逐步細(xì)化這些概念及其之間的關(guān)系,需確保概念和關(guān)系的準(zhǔn)確性與全面性;最后,通過知識圖譜構(gòu)建人員與專家進(jìn)行討論和驗(yàn)證,不斷完善和調(diào)整概念與關(guān)系的定義。通過領(lǐng)域?qū)<业膮f(xié)作,構(gòu)建出高質(zhì)量的本體模型,為后續(xù)的知識抽取和知識推理等任務(wù)奠定基礎(chǔ)。作戰(zhàn)指揮教材的知識建模過程可分為以下三步。
第一步,以作戰(zhàn)指揮教材建設(shè)需求為牽引,結(jié)合作戰(zhàn)指揮教材知識圖譜的應(yīng)用場景,從教材體系的建設(shè)周期和學(xué)科專業(yè)體系的橫縱兩個維度進(jìn)行考慮,以確定作戰(zhàn)指揮教材的知識范圍。教材建設(shè)周期體系知識包括教材的申報、編寫、審定、選用、評價和更新等;學(xué)科專業(yè)體系知識則包括專業(yè)課程對應(yīng)關(guān)系、教學(xué)大綱、人才培養(yǎng)方法以及教材知識點(diǎn)等。
第二步,進(jìn)行作戰(zhàn)指揮教材本體建模[11]。結(jié)合作戰(zhàn)指揮教材知識圖譜在作戰(zhàn)指揮教材建設(shè)管理和知識體系梳理中的主要應(yīng)用場景,選取、抽象并凝練作戰(zhàn)指揮學(xué)科專業(yè)、課程、教材內(nèi)容及教材建設(shè)周期中的主要概念,構(gòu)建教材建設(shè)生命周期、專業(yè)課程體系和教材知識點(diǎn)體系三類概念本體,其本體結(jié)構(gòu)如圖5 所示。
第三步,進(jìn)行作戰(zhàn)指揮教材關(guān)系建模。教材建設(shè)周期概念之間的關(guān)系大部分可定義為屬性,包括申報時間、審定時間、使用時間、適用對象、主編、審定專家、教材類型等等。教材內(nèi)部及教材之間的關(guān)系包括兩類,一般關(guān)系和領(lǐng)域關(guān)系。其中領(lǐng)域關(guān)系指教材領(lǐng)域特有的關(guān)系,如依賴關(guān)系、支撐關(guān)系等[12]。一般關(guān)系中,“包含”關(guān)系即層級關(guān)系,是概念與其他概念或?qū)嵗g的上下級關(guān)系,比如知識點(diǎn)包含更細(xì)的知識點(diǎn);“順序”關(guān)系是知識點(diǎn)之間、教材之間前后順序關(guān)系,可參考章節(jié)目錄和課題體系。軍隊(duì)院校作戰(zhàn)指揮教材知識圖譜關(guān)系建模如表1所示。
3.2 知識抽取
知識抽取包括實(shí)體抽取、關(guān)系抽取和屬性抽取[13]。實(shí)體抽取,又稱為命名實(shí)體識別(NER) ,即識別并抽取原始文本中的概念和實(shí)體。關(guān)系抽取和屬性抽取是從原始文本中抽取主謂賓三元組。目前,實(shí)體抽取主要依賴于基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的條件隨機(jī)場、LSTM-CRF、雙層BiLSTM等算法[14]。關(guān)系抽取主要采用卷積神經(jīng)網(wǎng)絡(luò)(CNN) 、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN) 及MUSA-BiLSTM-CRF[15]等方法。傳統(tǒng)的實(shí)體關(guān)系抽取方法屬于管道抽取,即先進(jìn)行實(shí)體抽取,再進(jìn)行關(guān)系抽取,這種方式容易導(dǎo)致抽取誤差的累積。為了克服這些缺點(diǎn),研究人員提出了聯(lián)合抽取方法,即同時進(jìn)行實(shí)體和關(guān)系的抽取,相關(guān)算法包括基于自注意力的BiLSTM[16]和ALBERT-BiLSTM-CRF[17]。
對于教材知識圖譜,原始文本數(shù)據(jù)可以分為三類:第一類是與教材建設(shè)相關(guān)的申報書、審批意見、教材編寫指南、教材建設(shè)文件、使用情況說明和監(jiān)測反饋表等;第二類是與學(xué)科課程相關(guān)的軍隊(duì)院校專業(yè)分類、教學(xué)大綱、人才培養(yǎng)方案及課程教學(xué)計(jì)劃等;第三類是與教材內(nèi)容相關(guān)的章節(jié)目錄、一級標(biāo)題、二級標(biāo)題及其包含的知識點(diǎn)等。其中,大部分?jǐn)?shù)據(jù)相對容易轉(zhuǎn)化為結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),而小部分則為非結(jié)構(gòu)化數(shù)據(jù)。針對作戰(zhàn)指揮教材的數(shù)據(jù)類型,采取不同的抽取方法:對結(jié)構(gòu)化的專業(yè)課程分類數(shù)據(jù),采用D2R[18]方法直接導(dǎo)入圖數(shù)據(jù)庫;對教材章節(jié)目錄等數(shù)據(jù),首先利用規(guī)則抽取方法生成半結(jié)構(gòu)化數(shù)據(jù),再利用包裝器導(dǎo)入圖數(shù)據(jù)庫;而對于教材編寫指南等非結(jié)構(gòu)化數(shù)據(jù),由于軍事領(lǐng)域缺乏開放數(shù)據(jù)源且無大量訓(xùn)練集,在領(lǐng)域?qū)嶓w數(shù)量有限的情況下,采用基于詞典和規(guī)則的抽取方法[19]來進(jìn)行實(shí)體、屬性和關(guān)系的提取。
基于詞典和規(guī)則的抽取方法包括建立所有實(shí)體的實(shí)體詞典、屬性詞典和關(guān)系抽取規(guī)則。通過利用《軍語》、“ 作戰(zhàn)指揮術(shù)語清單”等文獻(xiàn),構(gòu)建作戰(zhàn)指揮教材的實(shí)體詞典和屬性詞典。例如,教材實(shí)體“裝甲步兵班戰(zhàn)術(shù)教材”可建立“主編”和“適用對象”等屬性,而知識點(diǎn)實(shí)體“班戰(zhàn)術(shù)基礎(chǔ)動作”可以建立“出現(xiàn)時間”和“對應(yīng)能力”等屬性。隨后,將詞典導(dǎo)入分詞工具進(jìn)行分詞,最后利用抽取規(guī)則進(jìn)行知識抽取。例如,規(guī)則模板為“實(shí)體+屬性”,抽取的實(shí)例為“裝甲步兵班戰(zhàn)術(shù)教材的主編是張三”,提取的三元組為(裝甲步兵班戰(zhàn)術(shù)教材,主編,張三)。
3.3 知識融合
各院校的作戰(zhàn)指揮教材在術(shù)語規(guī)范和縮略稱謂上略有不同,這導(dǎo)致同一實(shí)體可能存在多個不同的稱謂。因此,知識融合是一個必不可少的過程。作戰(zhàn)指揮教材的知識融合是指在相同框架下進(jìn)行不同來源教材的關(guān)系數(shù)據(jù)理解、沖突數(shù)據(jù)消解和冗余數(shù)據(jù)合并等,包括實(shí)體消歧和知識合并等[20]。作戰(zhàn)指揮教材教材知識整合如圖6所示。
實(shí)體消歧旨在建立不同來源教材實(shí)體之間的等價關(guān)系,解決命名實(shí)體指稱項(xiàng)的歧義問題,并通過多種方法確保在不同上下文中能準(zhǔn)確識別真正指代的實(shí)體[21]。這一過程對于提高信息檢索和知識管理的準(zhǔn)確性至關(guān)重要。例如,“教材審核”和“教材審定”都可指向“教材審定”,“裝甲步兵”和“裝步”都指向“裝甲步兵”。實(shí)體消歧的方法主要包括基于規(guī)則的實(shí)體消歧、基于聚類的實(shí)體消歧、基于實(shí)體鏈接的實(shí)體消歧,以及結(jié)合詞向量和圖模型的方法等。
基于規(guī)則的實(shí)體消歧,通過構(gòu)建實(shí)體映射庫將不同的表述映射為同一實(shí)體;基于聚類的實(shí)體消歧則通過聚類算法對實(shí)體進(jìn)行分類,解決同一個詞在不同上下文中可能指代不同實(shí)體的問題;基于實(shí)體鏈接的實(shí)體消歧是通過將命名實(shí)體指稱項(xiàng)鏈接到知識庫中的特定實(shí)體來消除歧義;結(jié)合詞向量和圖模型的實(shí)體消歧方法則通過提取實(shí)體指稱項(xiàng)背景文本的關(guān)鍵詞及候選實(shí)體文本的關(guān)鍵詞,利用訓(xùn)練好的模型對這些關(guān)鍵詞進(jìn)行交叉相似度計(jì)算,從而實(shí)現(xiàn)特定領(lǐng)域內(nèi)實(shí)體的準(zhǔn)確消歧[22]。
3.4 作戰(zhàn)指揮教材知識圖譜構(gòu)建結(jié)果
現(xiàn)階段,圖數(shù)據(jù)庫通過節(jié)點(diǎn)、邊和屬性的圖形結(jié)構(gòu)來表示和存儲數(shù)據(jù),并采用專門的圖查詢語言,如Cypher和Gremlin,進(jìn)行數(shù)據(jù)查詢。由于其更適合表達(dá)復(fù)雜的關(guān)系查詢和快速處理多層關(guān)系等特點(diǎn),圖數(shù)據(jù)庫已成為知識圖譜存儲的主流方式。項(xiàng)目組開發(fā)了知識圖譜構(gòu)建平臺,以圖數(shù)據(jù)庫Neo4j存儲教材知識,封裝結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的抽取方法。通過圖形化界面構(gòu)建作戰(zhàn)指揮教材知識圖譜的模式層,對三種類型的數(shù)據(jù)進(jìn)行抽取,進(jìn)而構(gòu)建圖譜數(shù)據(jù)層。
通過該平臺,對兩本步兵戰(zhàn)術(shù)教材進(jìn)行抽取,提取的部分實(shí)體、屬性和關(guān)系如圖7所示。該圖展示了步兵班戰(zhàn)術(shù)教材建設(shè)、步兵班戰(zhàn)術(shù)課程、步兵分隊(duì)?wèi)?zhàn)術(shù)課程和步兵指揮專業(yè)等實(shí)體及其之間的關(guān)系。
4 結(jié)束語
本文梳理了作戰(zhàn)指揮教材體系,闡述了知識圖譜的定義及其一般構(gòu)建流程,分析了作戰(zhàn)指揮教材的數(shù)據(jù)特點(diǎn)和知識圖譜的應(yīng)用場景?;诖?,構(gòu)建了作戰(zhàn)指揮教材知識圖譜的概念、屬性和關(guān)系,并提出了針對作戰(zhàn)指揮教材知識圖譜的構(gòu)建方法。
教材知識圖譜的應(yīng)用場景非常廣泛,可以用于教材建設(shè),從而促進(jìn)教材建設(shè)的科學(xué)管理;可以用于課程教材體系分析,以檢查學(xué)科知識的交叉和遺漏等問題;還可以應(yīng)用于個性化教學(xué),利用知識圖譜及圖嵌入算法處理個性化教學(xué)的知識需求;此外,它還能幫助學(xué)員理清學(xué)習(xí)路徑。下一步的工作將不斷根據(jù)新的應(yīng)用場景,納入更多的教材領(lǐng)域知識,更新和豐富知識圖譜,并進(jìn)一步開發(fā)基于作戰(zhàn)指揮教材知識圖譜的智能問答、智能分析、智能搜索和智能推薦等應(yīng)用形式。