亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        語義技術(shù)在中小學歷史教育中的應用實踐

        2016-11-21 01:22:05袁小群武漢大學信息管理學院
        圖書館理論與實踐 2016年10期
        關(guān)鍵詞:本體檢索實體

        徐 雷,袁小群(武漢大學信息管理學院)

        語義技術(shù)在中小學歷史教育中的應用實踐

        徐雷,袁小群
        (武漢大學信息管理學院)

        為了提高師生對中小學歷史在線教育的用戶體驗,采用語義技術(shù)對中小學歷史教學資源進行了深度的語義處理、標注與組織,以教學知識點為中心,建立了教育資源組織本體,構(gòu)建了中小學歷史教育知識庫,在此基礎上設計了一個歷史教育學習平臺,提供歷史教材精讀、歷史知識檢索、歷史知識可視化以及在線歷史試題庫等功能,可滿足用戶全方位的學習需求。

        語義技術(shù);信息組織;語義標注;在線教育

        1 語義技術(shù)概述

        語義技術(shù)(Semantic Technology)是一系列關(guān)于信息資源處理與組織技術(shù)的總稱,包括自然語言處理技術(shù)、信息抽取與挖掘分析技術(shù)、語義Web技術(shù)等。尤其是語義Web技術(shù),已經(jīng)在諸多領域廣泛應用,如生物醫(yī)學、數(shù)字圖書館、語義出版等。通過使用語義技術(shù),對傳統(tǒng)的數(shù)字圖書文獻資源進行語義標注、語義關(guān)聯(lián)等富語義化操作,形成可操作性和互動性強的新型電子資源,這種語義增強型的數(shù)字資源具有精確查詢、閱讀便利等諸多優(yōu)勢,近年來已引起學術(shù)界和產(chǎn)業(yè)界的關(guān)注。目前已經(jīng)出現(xiàn)了許多相關(guān)文獻資源的詞匯標準,如PRISM、BIBO、FRBR等,圖書文獻資源的關(guān)聯(lián)數(shù)據(jù)集(Linked Data)[1]也日益增多,而且涌現(xiàn)出許多優(yōu)秀的應用案例及平臺,如納米出版物、[2]審稿流程語義處理平臺SWJ、[3]學術(shù)文獻語義發(fā)布平臺SemanticLancet、[4]知識管理平臺KIM、[5]科學文獻標注平臺DOMEO、[6]圖書文獻關(guān)聯(lián)數(shù)據(jù)集探索平臺Rkbexplorer、[7]Elsevier的文獻知識增強平臺Reflect[8]等。

        本文采用語義技術(shù)設計了關(guān)于中小學歷史教育的語義分析系統(tǒng),對中小學歷史教育資源進行了語義處理,建立了教育資源組織本體及中小學歷史教育知識庫。平臺的應用豐富了用戶的教學與學習過程,對圖書教材資源的語義處理及在線教育活動具有實踐意義。

        2 中小學歷史教學資源處理

        2.1處理流程

        打破傳統(tǒng)教育資源組織方式的局限,提升師生對教育資源的使用體驗,最基礎的工作必須從教育資源本身入手,改變現(xiàn)有資源粗粒度的組織方式,而語義技術(shù)則可滿足資源細粒度組織的需求。本文使用語義技術(shù)對中小學歷史教育過程中的資源,如教材、教輔、試題以及相關(guān)的網(wǎng)絡多媒體資源進行深度處理,包括各種文本、課件、圖片、音頻和視頻等,對非數(shù)字化的資源首先進行數(shù)字化處理。整個教學資源的處理流程如圖1所示。

        圖1 教學資源處理流程

        在該流程中,首先收集中小學歷史教育相關(guān)的資源,如各種教材、教輔、試題等各種紙質(zhì)與電子資源,并對重要的紙質(zhì)資源進行數(shù)字化,形成中小學歷史教育資源庫。由于資源種類眾多、內(nèi)容質(zhì)量參差不齊,師生不可能掌握全部資源內(nèi)容,因此,本文對資源進行了初步篩選,結(jié)合教師的建議,確定資源處理的邊界。隨后進行資源的語義化操作,在該階段先賦予每一種資源一個唯一的URI(本文以http://base.com表示基URI,以示說明),包括每一張圖片、每一個文本文檔、每一個PPT等。該部分的處理是為了便于資源的識別以及更深一步的語義化。在該階段可對資源的元數(shù)據(jù)進行描述,如資源的作者、來源、出版時間、相關(guān)機構(gòu)等信息。由于學生對知識的學習主要體現(xiàn)在知識點的掌握上,因此,本文對教學知識點進行了層次化、結(jié)構(gòu)化、語義化,即教學知識體系,以教學知識點為中心來組織教學資源。同時,為了提高資源庫的可擴展性,構(gòu)建了教育資源組織本體以對各種資源進行統(tǒng)一的組織;在后續(xù)語義化階段,需要對文本資源進行片段化、賦予子URI、關(guān)鍵詞識別、實體關(guān)聯(lián)操作以及多媒體資源的語義內(nèi)容分析、資源的元數(shù)據(jù)描述等語義化處理。并使用上一階段結(jié)構(gòu)化好的知識點體系,結(jié)合歷史領域知識本體對各個資源進行語義標注與關(guān)聯(lián)。所有資源語義化處理完成后,對這些資源進行索引、存儲,形成中小學歷史教育知識庫。

        2.2建立歷史教育知識體系及教學資源組織本體

        教師授課與學生上課都是圍繞一個知識體系來進行教學內(nèi)容組織的,而知識體系具體而言就是由一系列知識點有機聯(lián)系而構(gòu)成的。本文按照這一思想,以教學大綱中規(guī)定的知識點為中心來組織教學資源,將大綱中的知識體系規(guī)范化、層次化并采用語義技術(shù)豐富化。當然,根據(jù)不同省市地區(qū)學校的差異,教學大綱可以存在差異,需要根據(jù)本地的教學需求來語義化教學大綱。該過程需要相關(guān)授課教師參與,以確定知識點的范疇。

        具體來講,首先,根據(jù)教學大綱中確定的知識點,進行結(jié)構(gòu)化組織,確定知識點之間的層級關(guān)系、關(guān)聯(lián)關(guān)系,并將每一個知識點都賦予一個URI標識,如http://base.com/knowledgepoint1。知識點之間除了層次關(guān)系外,還具有自己的屬性(property),如知識點涉及的實體、關(guān)鍵詞、主題、來源等信息。以“五四運動”知識點為例,該知識點也稱為“五四愛國運動”,其上級知識點為“反帝反封建愛國運動”,類型為“事件”,主題為“運動”,涉及的人物實體有“陳獨秀”、“李大釗”等。另外,該知識點作為事件類型,還有事件發(fā)生的起因、經(jīng)過、結(jié)果、時間、地點等信息都將得到表述。該過程的實現(xiàn)手段主要采用正則表達式,對教學大綱中的文本內(nèi)容進行解析,構(gòu)建各個知識點之間的關(guān)系及知識點間的內(nèi)容信息。其形式化處理后的Turtle[9]三元組格式如片段1所示。

        其中Knowledgepoint是本文構(gòu)建的教學資源組織本體的核心概念,表示知識點,topic、related_entities、related_points等詞匯表示資源的主題、涉及的實體、相關(guān)知識點等,其中主題的標注是通過檢測知識點文本中的關(guān)鍵詞集合的主題分布來實現(xiàn)的,并輔助人工檢查來完善。該本體結(jié)構(gòu)的具體內(nèi)容見表1至表3。將所有的知識點按照這樣的形式組織好之后,使用知識點URI來標注教材、多媒體資源。

        由于原始概念體系比較復雜,上述3個表只羅列了核心的類屬結(jié)構(gòu),其他如教材的元數(shù)據(jù)、試題的難易程度、學生類別、作者信息等都沒有顯示在上述表格中。該概念體系是組織教育資源的基礎,以知識點為中心來組織教育資源,符合師生教學與學習過程特點。由于不涉及領域性極強的知識,該概念體系的構(gòu)建主要參考了教學資源的內(nèi)容、教師的教學經(jīng)驗來手工構(gòu)建。其中“領域本體”概念是一個擴展概念,通過該概念可以關(guān)聯(lián)到具體的領域,如數(shù)學、歷史等。對于本文而言,是歷史教育,本文通過結(jié)合已有研究成果、[10]相關(guān)的結(jié)構(gòu)化歷史資源,同時考慮到學生的知識接受能力,主要確定了歷史人物、事件、時間、地點等核心歷史概念。在此基礎上對該歷史領域本體進行內(nèi)容完善與實體填充,如某歷史事件的發(fā)生時間、參與人物,某歷史人物出版的著作、參與的活動等,即構(gòu)建了更細粒度的歷史知識圖譜。

        表1 教學資源組織本體核心術(shù)語

        表2 術(shù)語屬性

        表3 術(shù)語之間的關(guān)系

        歷史教學知識體系及教學資源組織本體、歷史領域知識本體的構(gòu)建是為了確定一個歷史教學資源組織的體系結(jié)構(gòu),來對教學資源進行更好的標注、關(guān)聯(lián)組織,構(gòu)建中小學歷史教育知識庫。

        2.3歷史教學資源語義化及教育知識庫構(gòu)建

        在對資源進行語義化操作之前,每一個獨立的資源都被賦予了一個唯一的URI。以人教版7年級上冊歷史教材為例,該資源被數(shù)字化為文本資源,并被賦予URI為http://base.com/textbook1/。首先使用自然語言分詞工具,對其進行分詞、詞性標注,設計算法識別出教材中的實體以及關(guān)鍵詞,如歷史人物、時間、地點、歷史事件、文化遺址等。將這些信息使用RDFa[11]語法進行類型標注,并和已構(gòu)建的歷史領域知識本體中的相應實體進行關(guān)聯(lián),以其中第1課為例,最終教材的形式化結(jié)果如片段2所示。

        該文本片段使用RDFa進行標識,其中的人物實體使用typeof=“Figure”進行了標識,并使用objectid指定其外部URI標識符用于關(guān)聯(lián)歷史領域本體知識庫。

        結(jié)構(gòu)化片段2已經(jīng)深入到詞匯層面,對于段落、課程、單元、教材等更高粒度的資源結(jié)構(gòu)化則作如下處理:將教材、教材內(nèi)容介紹、教材目錄、教材內(nèi)容的段落、圖表、課程、單元等都賦予一個URI標識,進行結(jié)構(gòu)化處理。仍以中學7年級的歷史上冊教材為例,結(jié)構(gòu)化處理后的整本教材的Turtle三元組表示如片段3所示。

        限于版面,片段3只是一部分,它將教材的所有部分,包括標題、課程、單元、圖表等都進行了碎片化組織。結(jié)合片段1和片段2,教材的內(nèi)容使用知識點進行了標注,教材中的關(guān)鍵詞和實體也進行了標注,并且和歷史領域知識本體進行了關(guān)聯(lián)。經(jīng)過知識點標注的教材自然而然就集成了知識點本身的信息,可以和經(jīng)知識點標注的多媒體資源進行關(guān)聯(lián),這樣就實現(xiàn)了對相同知識點、關(guān)鍵詞、實體、主題信息的共享。這樣做的好處是,不同的課程、單元、教材等不同粒度的文本資源都可以通過其共有的知識點、實體、主題來發(fā)生聯(lián)系。如主題標注為“農(nóng)業(yè)生產(chǎn)”的段落可以聚集在一起,涉及相同知識點的課程可以聚集在一起,包含相同實體的資源可以聚集在一起,而這些關(guān)聯(lián)關(guān)系的集成并不像字符串匹配那樣的機制,而是通過共享相同的URI來實現(xiàn),關(guān)聯(lián)的準確性更高。

        使用知識點對教材進行語義標注時,可以只標注若干段落,某一課也可以被多個知識點標注,單元的知識點可通過其包含的課程的知識點集合來標注。知識點的標注是結(jié)合知識點信息,如知識點涉及的關(guān)鍵詞、實體集合、主題等和待標注文本中提取的關(guān)鍵詞、實體信息進行相似度匹配實現(xiàn)的。除了將教材進行語義化處理外,相關(guān)的教學多媒體資源如PPT、圖像、視頻、試題等也可以采用同樣的方法進行語義處理。

        當所有的資源都進行了語義標注后,將所有這些語義化資源使用LarKC[12]語義處理平臺進行索引并存儲,形成中小學歷史教育知識庫,并在此基礎上為師生提供歷史教育的知識服務。

        3 中小學歷史教育語義分析系統(tǒng)設計

        3.1系統(tǒng)架構(gòu)

        語義分析系統(tǒng)的架構(gòu)如圖2所示。

        圖2 系統(tǒng)架構(gòu)

        歷史教育知識庫使用LarKC大規(guī)模語義數(shù)據(jù)計算平臺來存儲和加載,該平臺可以提供SPARQL[13](類似于SQL)服務端查詢服務,用于處理用戶提交的各種查詢需求,查詢返回JSON結(jié)果供前臺4個功能模塊調(diào)用。

        3.2功能模塊

        (1)教材精讀。教材是經(jīng)過語義結(jié)構(gòu)化處理過的,不同于一般的電子教材。在該教材中學生可以了解教材中標注實體的詳細信息?!安懿佟钡臉俗⑿畔?,當鼠標移至該標注上,將促發(fā)一個SPARQL查詢事件。由于經(jīng)過標注,前端JavaScript先獲取該標注的objectid組成URI,并封裝為SPARQL語句,通過Http協(xié)議將該查詢提交到服務端,查詢并返回JSON結(jié)果,該結(jié)果通過彈出標簽的形式顯示在該標注的旁邊,作為對該標注實體的具體解釋,此過程大大減少了學生獲取信息的步驟。

        同時,每一課都被相關(guān)知識點的URI所標注,且該知識點也標注了其他多媒體資源。因此在閱讀每一課時,通過后臺執(zhí)行的關(guān)聯(lián)檢索(SPARQL查詢),可以動態(tài)獲取該課相關(guān)的多媒體資源。

        (2)資源檢索。根據(jù)資源語義標注的特點,資源檢索可劃分為公共屬性檢索、教材檢索和資源庫檢索三種方式。其中,公共屬性檢索方式分為主題、大綱、朝代、國家?guī)追N檢索方式。主題即資源所涉及的領域,大綱是依據(jù)教材大綱設計的。如在主題中輸入“文化藝術(shù)”,查詢教材和資源中屬于“文化藝術(shù)”的文本段落和多媒體資源。目前,該系統(tǒng)將教材和多媒體資源的檢索結(jié)果通過不同的標簽進行區(qū)分,通過結(jié)果可以看到檢索的結(jié)果并不是通過匹配“文化藝術(shù)”來實現(xiàn),而是通過語義關(guān)聯(lián)檢索實現(xiàn)的。大綱查詢則直接查詢知識點。由于系統(tǒng)設置了查詢建議功能,即只需輸入幾個字,即可在下拉列表中顯示可能需要檢索的內(nèi)容,以提高檢索的精確度。

        教材檢索和資源庫檢索功能是將該公共屬性的檢索結(jié)果分開,設置單獨的檢索功能。其中教材檢索可以通過在課程的標題和內(nèi)容中檢索,資源庫檢索可以通過資源的類型、主題等維度進行檢索。所有的檢索操作在后臺都會封裝為SPARQL查詢,不再細述。

        (3)知識圖譜。知識圖譜對應于歷史教育知識庫中的歷史領域知識本體庫,學生可以通過該功能獲取教材內(nèi)容的可視化結(jié)果。該可視化圖形可以拖動、縮放,節(jié)點可以擴展,同時節(jié)點自身的信息也可以展示,進行基于該實體的教材檢索和資源檢索,這樣就可以將知識圖譜和資源檢索功能無縫連接起來,實現(xiàn)更好的檢索體驗。

        (4)在線試題。在線試題是專門為學生設計的。傳統(tǒng)的試題一般作為課程測試、單元測試的補充來衡量學生的學習情況,試題的價值沒有全部發(fā)揮。利用語義技術(shù),可以使試題的價值得到充分利用。由于每一道試題都使用了知識點進行標注,不同的知識點具有自己的主題、關(guān)鍵詞等信息,同時試題本身的來源、年份、難易程度、對應課程等信息也進行了標注,可根據(jù)這部分關(guān)聯(lián)信息動態(tài)的獲取相關(guān)的試題集合,重組為一套新的試卷。如檢索“鴉片戰(zhàn)爭”,通過知識點的關(guān)聯(lián)檢索,題目中不含有“鴉片戰(zhàn)爭”的試題以及不在同一個單元的試題但涉及“鴉片戰(zhàn)爭”的題目將會被檢索到。這樣就實現(xiàn)了試題資源的動態(tài)組合,使學生對知識點的掌握將更為全面,而不僅僅局限在相應的課程單元之上。

        4 結(jié)語

        本文使用語義技術(shù),構(gòu)建了歷史教育資源組織本體,對中小學歷史教育資源進行了語義標注、語義關(guān)聯(lián),構(gòu)建了中小學歷史教育知識庫,實現(xiàn)了基于該知識庫的多維度語義檢索應用。如查看某一課,通過該課程涉及的知識點可以找到與該課程相關(guān)的多媒體資源;通過該知識點相關(guān)的知識點可以獲取更多的其它資源;通過知識點涉及的主題,可以檢索到相關(guān)主題的課程、試題等;通過檢索某個實體,可以檢索該實體相關(guān)的知識點,進而得到相關(guān)課程、多媒體資源等。豐富的多媒體資源是在線教育的優(yōu)勢所在,對多媒體資源進行語義化處理,可以幫助用戶更好地圍繞所學知識進行有益擴展,加深對知識的掌握程度。同時,考慮到用戶在移動端學習的需求,該平臺設計了自適應功能可在不同瀏覽器及系統(tǒng)上運行。

        中小學歷史教育知識庫的構(gòu)建使用了諸多信息技術(shù),如自然語言處理技術(shù)、信息抽取技術(shù)、語義Web技術(shù)等。本文構(gòu)建的知識庫,對數(shù)字化的內(nèi)容進行拆分和標注,抽取其中的實體詞匯、關(guān)鍵詞以及實體之間的關(guān)系,對資源內(nèi)容按照知識點、知識主題進行劃分、抽取。對資源抽取的粒度越精細,表示對資源的知識挖掘越深,后續(xù)呈現(xiàn)給學生、教師的知識將越豐富,知識的融合重組能力將越強,有利于提供個性化的知識搜索與推薦功能,從而克服傳統(tǒng)教育資源粗粒度組織帶來的弊端,這是未來該平臺繼續(xù)改進的方向。

        [1]Linked Data Connect Distributed Data across the Web[EB/OL].[2016-01-21].http://linkeddata.org/.

        [2]Clare A,et al.Exploring the Generation and Integration of Publishable Scientic Facts Using the Concept of Nano-publications[C].Hersonissos:SePublica-WorkshoponSemanticPublishing,2011:13-17.

        [3]Hu Y,et al.A Linked data driven and Semantic Allyenabled Journal Portal for Scientometrics[M]//Lecture Notes in Computer Science.Berlin:Springer,2013:114-129.

        [4]Semantic Lancet Project[EB/OL].[2016-01-21]. http://www.semanticlancet.eu.

        [5]Ontotext Semantic News Publishing Ontotext[EB/OL].[2015-10-12].http://www.ontotext.com/kim.

        [6]CiccareseP,etal.Opensemanticannotationof scientific publications using DOMEO[J].Biomedical Semantics,2012,3(S-1):S1.

        [7]RKB Explorer[EB/OL].[2016-01-21].http://www. rkbexplorer.com.

        [8]Reflect[EB/OL].[2015-10-12].http://reflect.ws.

        [9]RDF 1.1 Turtle[EB/OL].[2016-01-21].https: //www.w3.org/TR/turtle/.

        [10]董慧,等.基于語義系統(tǒng)的中華史籍分析研究[J].圖書館理論與實踐,2015(4):1-5,46.

        [11]RDFa[EB/OL].[2016-01-21].http://rdfa.info/.

        [12]LarKC:The Large Knowledge Collider[EB/OL].[2016-01-21].http://www.larkc.org/.

        [13]SPARQL1.1 QueryLanguage[EB/OL].[2016-01-21].https://www.w3.org/TR/sparql11-query/.

        Application and Practice of Semantic Technology in Primary and Middle School History Education

        Xu Lei,Yuan Xiao-qun

        In order to improve the teachers'and students'user experience of online history education in primary and middle schools,this article applies semantic technologies to make a deep semantic processing,labeling and organization of history teaching resources,and establishes an education resource ontology as well as constructs a history knowledge repository centered on teaching knowledge.Based on above research,this article designs a history education learning platform with the functions such as intensive reading textbooks,history and knowledge retrieval,historical knowledge visualization and online history test and so on,which can meet comprehensive leaning needs of the users.

        Semantic Technologies;Information Organization;Semantic Annotation;Online Education

        G250.76

        B

        1005-8214(2016)10-0001-05

        本文系國家自然科學青年基金“網(wǎng)絡本體質(zhì)量及適應性的評估研究”(項目編號:71503189)研究成果之一。

        徐雷(1986-),男,武漢大學信息管理學院講師,研究方向:本體與語義網(wǎng)、數(shù)字圖書館;袁小群(1976-),男,武漢大學信息管理學院副教授,研究方向:數(shù)字出版、內(nèi)容分發(fā)。

        2016-02-21[責任編輯]閻秋娟

        猜你喜歡
        本體檢索實體
        Abstracts and Key Words
        哲學分析(2023年4期)2023-12-21 05:30:27
        對姜夔自度曲音樂本體的現(xiàn)代解讀
        中國音樂學(2020年4期)2020-12-25 02:58:06
        前海自貿(mào)區(qū):金融服務實體
        中國外匯(2019年18期)2019-11-25 01:41:54
        2019年第4-6期便捷檢索目錄
        實體的可感部分與實體——兼論亞里士多德分析實體的兩種模式
        哲學評論(2017年1期)2017-07-31 18:04:00
        兩會進行時:緊扣實體經(jīng)濟“釘釘子”
        振興實體經(jīng)濟地方如何“釘釘子”
        專利檢索中“語義”的表現(xiàn)
        專利代理(2016年1期)2016-05-17 06:14:36
        《我應該感到自豪才對》的本體性教學內(nèi)容及啟示
        文學教育(2016年27期)2016-02-28 02:35:15
        Care about the virtue moral education
        卷宗(2013年6期)2013-10-21 21:07:52
        欧美饥渴熟妇高潮喷水水| 青青草视频在线观看绿色| 国产三a级三级日产三级野外| 欧美乱人伦人妻中文字幕| 男人无码视频在线观看| 国产黄片一区视频在线观看| 亚洲精品在线一区二区| 少妇人妻中文字幕hd| 久久日本三级韩国三级| www.av在线.com| 中文字幕亚洲精品专区| 7777色鬼xxxx欧美色妇| 国产偷国产偷亚洲清高| 亚洲a∨好看av高清在线观看| 九七青青草视频在线观看| 又色又爽又黄高潮的免费视频| 熟女俱乐部五十路二区av| 亚洲精品国产精品av| 国产日产桃色精品久久久| 无码va在线观看| 久久99欧美| 亚洲男女视频一区二区| 日韩精品熟妇一区二区三区| 色八区人妻在线视频免费 | 国产成人喷潮在线观看| 国产一区二区三区在线观看精品| 美女福利一区二区三区在线观看 | 国产女主播免费在线观看| 亚洲毛片在线免费视频| 护士人妻hd中文字幕| 亚洲人妻无缓冲av不卡| 在线观看高清视频一区二区三区| 天天做天天摸天天爽天天爱 | 宅男66lu国产在线观看| 无码人妻丰满熟妇精品区| 男人的av天堂狠狠操| 国产一区二区三区激情视频| 久久久久国产一区二区| 精品国产三级a| 日本高清一区二区不卡| 国产精品久久久久久久|