亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        面向個性化學(xué)習(xí)的MOOC資源庫系統(tǒng)開發(fā)

        2022-03-21 21:39:09彭琰孔令圓鄭汀華馬華
        計(jì)算機(jī)時(shí)代 2022年3期
        關(guān)鍵詞:系統(tǒng)開發(fā)個性化學(xué)習(xí)資源庫

        彭琰 孔令圓 鄭汀華 馬華

        摘? 要: 近年來基于MOOC的在線學(xué)習(xí)方式開始大規(guī)模普及,但是,海量的MOOC資源紛繁復(fù)雜,各大MOOC學(xué)習(xí)平臺之間的課程數(shù)據(jù)也并未實(shí)現(xiàn)整合共享,從而使學(xué)習(xí)者在挑選合適的學(xué)習(xí)資源時(shí)面臨極大困難。因此,設(shè)計(jì)并實(shí)現(xiàn)了一個面向個性化學(xué)習(xí)的MOOC資源庫系統(tǒng)。文章介紹了該系統(tǒng)的整體結(jié)構(gòu)、課程數(shù)據(jù)分類與建模方法、課程資源與知識點(diǎn)的映射方法、資源爬蟲的設(shè)計(jì)和系統(tǒng)集成情況。該系統(tǒng)具有良好的實(shí)用性和可擴(kuò)展性,可為個性化學(xué)習(xí)的MOOC推薦平臺提供關(guān)鍵的基礎(chǔ)數(shù)據(jù)及相關(guān)資源。

        關(guān)鍵詞: 個性化學(xué)習(xí); 數(shù)據(jù)爬取; MOOC; 資源庫; 系統(tǒng)開發(fā)

        中圖分類號:G642? ? ? ? ? 文獻(xiàn)標(biāo)識碼:A? ? ? ? ? 文章編號:1006-8228(2022)03-73-04

        Abstract: In recent years, MOOC online learning has been popularized on a large scale. However, the online MOOC resources are numerous and complicated, and the course data among the major online MOOC learning platforms has not been integrated and shared, so that the learners face great difficulties in selecting suitable learning resources. Aiming at this issue, a MOOC resource library system for personalized learning was designed and implemented. The overall structure of the system, curriculum data classification and modeling methods, curriculum resources and knowledge points mapping methods, resource crawler design and system integration effects are introduced in this paper. The system has good practicability and scalability, and can provide key basic data and related resources for the MOOC personalized learning recommendation platform.

        Key words: personalized learning; data crawling; MOOC; resource library; system development

        0 引言

        近年來,在新冠肺炎疫情背景下,在線教育教學(xué)[1]得到快速發(fā)展。iMedia Research(艾媒咨詢)研究顯示,未來在線教育市場規(guī)模將保持逐年增長態(tài)勢,2019年市場規(guī)模已突破4000億元,受疫情影響,預(yù)計(jì)2025年中國在線教育市場規(guī)模將達(dá)到8000億元,2020到2025年的復(fù)合增長率將達(dá)11.4%。同時(shí)在線教育也為學(xué)習(xí)者提供了一種多元化的學(xué)習(xí)模式,它具有時(shí)間和地點(diǎn)靈活、可重復(fù)學(xué)習(xí)等優(yōu)點(diǎn),然而各大在線MOOC學(xué)習(xí)平臺課程數(shù)據(jù)紛繁復(fù)雜,網(wǎng)站之間的課程數(shù)據(jù)也未實(shí)現(xiàn)整合共享,課程知識點(diǎn)關(guān)聯(lián)性不強(qiáng)。

        針對此現(xiàn)狀,我們爬取各大在線學(xué)習(xí)平臺中的海量課程數(shù)據(jù),在建立課程資源與知識點(diǎn)的映射關(guān)系的基礎(chǔ)上,開發(fā)了一個擁有豐富知識元結(jié)構(gòu)[2]的MOOC共享資源庫,以為個性化學(xué)習(xí)平臺[3]提供關(guān)鍵的基礎(chǔ)數(shù)據(jù)和相關(guān)資源。

        1 MOOC資源庫建設(shè)思路

        現(xiàn)今,國內(nèi)外已有大量在線教育平臺,例如,學(xué)堂在線、中國大學(xué)MOOC、Educoder、Coursera、EDX、Udemy等。非專業(yè)教育學(xué)習(xí)平臺上也有許多高效的學(xué)習(xí)資源,例如,bilibili、貼吧。面對互聯(lián)網(wǎng)上紛繁復(fù)雜的課程信息、視頻信息、實(shí)訓(xùn)內(nèi)容等海量開放資源,我們采用自行設(shè)計(jì)的爬蟲進(jìn)行數(shù)據(jù)爬取并運(yùn)用SQL語句對爬取得到的數(shù)據(jù)進(jìn)行處理加工,通過去重以減少數(shù)據(jù)冗余,將處理過后的數(shù)據(jù)集存入本地?cái)?shù)據(jù)庫,再經(jīng)過知識點(diǎn)關(guān)聯(lián)和課程建模之后上傳至云端服務(wù)器,以提供給學(xué)習(xí)推薦系統(tǒng)使用。

        MOOC在線教育平臺經(jīng)過近些年來的快速發(fā)展,在課程種類、課程數(shù)量和質(zhì)量等方面都有了顯著提升。國內(nèi)的中國大學(xué)MOOC、學(xué)堂在線等已成為了在線課堂學(xué)習(xí)的主流網(wǎng)站,它們可供學(xué)習(xí)的課程較為全面,課程視頻受到廣大學(xué)習(xí)者的喜愛。這些網(wǎng)站提供了豐富的MOOC數(shù)據(jù)來源,基于它們進(jìn)行課程知識點(diǎn)的掛接已具備可行性,通過掛接知識點(diǎn),可極大地減少后續(xù)課程建模以及MOOC資源的知識點(diǎn)關(guān)聯(lián)工作量,從而為面向個性化學(xué)習(xí)的MOOC推薦系統(tǒng)提供可擴(kuò)展、易維護(hù)的基礎(chǔ)資源庫支持。

        本系統(tǒng)擬使用Python開發(fā)數(shù)據(jù)爬蟲??紤]到MOOC資源庫所需的課程數(shù)據(jù)種類繁多,所需爬取的網(wǎng)站各有不同,無法直接采用Scrapy框架[4],因此自行設(shè)計(jì)爬蟲結(jié)構(gòu),采用Python HTTP+request對不同網(wǎng)站的課程數(shù)據(jù)進(jìn)行爬取,使用標(biāo)簽數(shù)據(jù)分析庫XML以及Beautifulsoup作用域分析爬取下來的標(biāo)簽類型數(shù)據(jù),提取所需數(shù)據(jù)并對獲得的數(shù)據(jù)經(jīng)SQL語句處理后存入本地MySQL數(shù)據(jù)庫中。

        2 MOOC資源庫系統(tǒng)設(shè)計(jì)

        2.1 整體架結(jié)構(gòu)

        程序分成三個部分,第一部分為數(shù)據(jù)的爬取;第二部分包括課程數(shù)據(jù)的分類處理、課程建模和知識點(diǎn)關(guān)聯(lián);第三部分為提供相應(yīng)數(shù)據(jù)接口,為個性化學(xué)習(xí)平臺提供數(shù)據(jù)支持。爬取到的數(shù)據(jù)經(jīng)過初步的去重處理后使用SQL存入數(shù)據(jù)庫,在第二階段應(yīng)用相應(yīng)的pymysql庫從數(shù)據(jù)庫提取數(shù)據(jù)進(jìn)行分析處理。

        爬蟲程序的主體使用了Python HTTP+request庫。爬取的數(shù)據(jù)均由BeautifulSoup庫對標(biāo)簽類型的數(shù)據(jù)進(jìn)行分析,采用自行設(shè)定的標(biāo)簽庫進(jìn)行分類及查找。得到標(biāo)簽庫返回?cái)?shù)據(jù)之后,使用Python正則表達(dá)re模塊以及Word2vec語義切詞技術(shù)[5],對所需的課程信息進(jìn)行處理,最后使用相應(yīng)的SQL語句對得到的課程數(shù)據(jù)進(jìn)行去重后存入本地?cái)?shù)據(jù)庫。程序爬蟲大致流程如圖1所示。

        2.2 課程數(shù)據(jù)分類與建模

        建立了12個Word2vec詞向量模型,分別對應(yīng)12個課程大類,同時(shí)為12個課程大類分別劃分其中的具體標(biāo)簽。每個課程大類中的標(biāo)題和課程簡介部分,被單獨(dú)提取為一個文本文件作為初始語料,對爬取的課程簡介使用jieba庫進(jìn)行切詞,使用TF-IDF算法[6]計(jì)算得到計(jì)算機(jī)類語料的關(guān)鍵詞,然后對所得到的數(shù)據(jù)進(jìn)行訓(xùn)練,得到詞向量模型,此過程重復(fù)多次。然后針對課程詳細(xì)信息表中的每一門課程,根據(jù)其標(biāo)題與課程簡介中含有標(biāo)簽或其相似詞的情況,獲得課程與標(biāo)簽的相關(guān)度,進(jìn)而構(gòu)建課程標(biāo)簽表。課程數(shù)據(jù)標(biāo)簽、類別劃分及部分課程數(shù)據(jù)如圖2、圖3和圖4所示。

        2.3 課程資源與知識點(diǎn)的映射關(guān)聯(lián)

        本資源庫針對各類不同課程,如Java、Python等,構(gòu)建了全局知識點(diǎn)框架,對所爬取的各類學(xué)習(xí)資源進(jìn)行知識點(diǎn)關(guān)聯(lián)映射,進(jìn)而構(gòu)建了一個內(nèi)容豐富、邏輯清晰的學(xué)習(xí)資源庫。以Java課程為例,以思維導(dǎo)圖方式呈現(xiàn)的Java知識點(diǎn)框架部分內(nèi)容如圖5所示。

        我們將其關(guān)聯(lián)的MOOC學(xué)習(xí)資源(例如,課件資源、教學(xué)視頻資源、試題資源)與上述劃分的一級知識點(diǎn)、二級知識點(diǎn)進(jìn)行關(guān)聯(lián),進(jìn)行隸屬M(fèi)OOC資源的匹配、難度級別的匹配,同時(shí)以合理的方式進(jìn)行編號與重命名,以為后續(xù)平臺后端接口的調(diào)用提供支持。最終完成的學(xué)習(xí)資源庫的數(shù)據(jù)庫存儲格式、文件編排樣式如圖6~圖8所示。

        2.4 資源爬蟲的設(shè)計(jì)

        針對課程資源的選取范圍應(yīng)廣泛但不重復(fù),多樣但不冗余,同時(shí)非專業(yè)教育學(xué)習(xí)網(wǎng)站上的優(yōu)秀課程資源也是我們數(shù)據(jù)選取的方向,并且,針對不同課程的要求,需要個性化定制爬取資源,對于需要視頻、課件以及章節(jié)試題的課程將提供相應(yīng)的數(shù)據(jù)資源。同時(shí)對于與課程類別相關(guān)的知識資源,進(jìn)行選擇性爬取,選取各大MOOC網(wǎng)站熱度高的相關(guān)知識資源。程序目前支持的MOOC網(wǎng)站信息如圖8所示。

        程序部分實(shí)現(xiàn)代碼示例如下:

        def main(url):

        """解析命令行參數(shù)并調(diào)用相關(guān)模塊進(jìn)行下載"""

        if re.match(r'https?://www.icourse163.org/(spoc/)?

        (course|learn)/', url):

        from moocs import icourse163 as mooc

        elif re.match(r'https?://www.xuetangx.com/courses/

        .+/about', url):

        from moocs import xuetangx as mooc

        elif re.match(r'https?://mooc.study.163.com/

        (course|learn)/', url):

        from moocs import study_mooc as mooc

        elif re.match(r'https?://www.icourses.cn/web/sword/portal/

        videoDetail', url):

        from moocs import icourses as mooc

        elif re.match(r'https?://www.livedu.com.cn/ispace4.0/

        moocxjkc/toKcView.do\?kcid=', url):

        from moocs import livedu as mooc

        else:

        print('課程地址有誤!')

        sys.exit(1)

        3 MOOC資源庫系統(tǒng)實(shí)現(xiàn)

        本系統(tǒng)現(xiàn)已被集成到真實(shí)的個性化MOOC推薦系統(tǒng)(115.159.54.233:8080/moocrec),并部署于騰訊云服務(wù)器。系統(tǒng)實(shí)現(xiàn)效果圖如圖9所示。集成后的推薦效果如圖10和圖11所示。

        4 結(jié)束語

        本文開發(fā)的面向個性化學(xué)習(xí)的MOOC資源庫系統(tǒng),是以自行設(shè)計(jì)的爬蟲結(jié)構(gòu)為基礎(chǔ),使用了Python HTTP+request和Word2vec語義切詞技術(shù),通過從各大MOOC網(wǎng)站上獲取課程數(shù)據(jù),進(jìn)行課程數(shù)據(jù)去重、分類及課程數(shù)據(jù)知識點(diǎn)的掛接,為面向個性化學(xué)習(xí)的MOOC推薦平臺提供關(guān)鍵的基礎(chǔ)數(shù)據(jù)和資源來源。該系統(tǒng)充分挖掘了課程數(shù)據(jù)間的相關(guān)性并進(jìn)行了標(biāo)簽化處理,使各課程的數(shù)據(jù)資源能更好更快捷的為個性化推薦平臺所使用,系統(tǒng)具有良好的實(shí)用性和可擴(kuò)展性。未來研究中,我們將逐步擴(kuò)展課程數(shù)據(jù)源的廣度及深度,為學(xué)習(xí)者精選更優(yōu)質(zhì)和多樣的學(xué)習(xí)資源。

        參考文獻(xiàn)(References):

        [1] 管佳,李奇濤.中國在線教育發(fā)展現(xiàn)狀、趨勢及經(jīng)驗(yàn)借鑒[J].中國電化教育,2014(8):62-66

        [2] 武建光,蘇云梅,于琦,等.基于知識元的學(xué)術(shù)文獻(xiàn)分類研究[J].情報(bào)理論與實(shí)踐,2019,42(3):160-165

        [3] 孔令圓,彭琰,鄭汀華,馬華.面向個性化學(xué)習(xí)的慕課資源推薦系統(tǒng)開發(fā)[J].計(jì)算機(jī)時(shí)代,2021(7):46-49

        [4] 韓貝,馬明棟,王得玉.基于Scrapy框架的爬蟲和反爬蟲研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2019,29(2):139-142

        [5] 李曉,解輝,李立杰.基于Word2vec的句子語義相似度計(jì)算研究[J].計(jì)算機(jī)科學(xué),2017,44(9):256-260

        [6] 路健,范增民,劉彩娜.基于TF-IDF算法的供應(yīng)鏈信息定向挖掘模型[J].計(jì)算機(jī)仿真,2021,38(7):153-156,349

        3125501908202

        猜你喜歡
        系統(tǒng)開發(fā)個性化學(xué)習(xí)資源庫
        健身氣功開放課程資源庫建設(shè)研究
        貴州●石斛種質(zhì)資源庫
        教學(xué)資源支持下的Sakai個性化學(xué)習(xí)研究
        基于網(wǎng)絡(luò)數(shù)據(jù)分析的計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)開發(fā)
        信息化環(huán)境下基于“盒子魚”App的高中英語個性化學(xué)習(xí)的模式和策略
        微視頻在初中英語聽力教學(xué)中的應(yīng)用探索
        高中歷史信息化教育資源庫應(yīng)用探索
        基于SOA的在線學(xué)習(xí)資源集成模式的研究
        變電站監(jiān)控信息接入驗(yàn)收系統(tǒng)的研發(fā)與應(yīng)用
        發(fā)射機(jī)房運(yùn)行監(jiān)控系統(tǒng)關(guān)鍵技術(shù)的解決方案
        精品人妻少妇av中文字幕| 亚洲综合色婷婷久久| 少妇勾引视频网站在线观看| 精品国产中文字幕久久久| 亚洲av无码专区在线观看成人| 50岁退休熟女露脸高潮| 就去吻亚洲精品欧美日韩在线| 奇米影视第四色首页| 色 综合 欧美 亚洲 国产| 欧美日韩国产免费一区二区三区欧美日韩 | 日日碰狠狠添天天爽超碰97| 久久青草国产精品一区| 天堂视频一区二区免费在线观看| 亚洲综合久久中文字幕专区一区 | 草草久久久无码国产专区| 亚洲色AV性色在线观看| 麻豆国产成人av高清在线| 亚洲一区二区免费在线观看视频| 男女边摸边吃奶边做视频韩国| 国产精品 亚洲 无码 在线| 国产av丝袜旗袍无码网站| 国产精品免费久久久免费| 亚洲精品高清av在线播放| 日本二区三区在线免费| 国产播放隔着超薄丝袜进入| 日韩免费无码一区二区三区| 国产亚洲精品福利在线| 日本久久视频在线观看| 久久亚洲春色中文字幕久久| 亚洲国产a∨无码中文777| 蜜桃视频一区二区三区在线观看| 欧美一级在线全免费| 亚洲伊人久久综合精品| 日韩人妻精品中文字幕专区| 国产精品 人妻互换| 亚洲无码a∨在线视频| 日本在线一区二区三区视频| 日本伊人精品一区二区三区| 中国丰满熟妇xxxx性| 亚洲国产成人久久综合一区77 | 久久无码高潮喷水|