亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于文本挖掘技術(shù)的教育類文獻(xiàn)主題識別方法研究

        2022-10-31 09:43:48苗馮博王甜甜董哲原辛瑞昊
        吉林化工學(xué)院學(xué)報 2022年7期
        關(guān)鍵詞:人工智能研究教育

        馮 欣,苗馮博**,王甜甜**,董哲原**,叢 萍***,辛瑞昊

        (1.吉林化工學(xué)院 信息與控制工程學(xué)院,吉林 吉林 132022;2.吉林化工學(xué)院 理學(xué)院,吉林 吉林 132022)

        隨著信息化時代的發(fā)展,人工智能、大數(shù)據(jù)等新興技術(shù)引起了全球經(jīng)濟(jì)結(jié)構(gòu)、社會生活和工作方式的深刻變革.教育作為傳承文明、創(chuàng)新知識的主要領(lǐng)域,應(yīng)該主動迎接新一輪科技革命和產(chǎn)業(yè)革命的浪潮,通過信息化與教育的深度融合,構(gòu)建智能化教育體系.近日,國家主席習(xí)近平在國際人工智能與教育大會致賀信中強(qiáng)調(diào),要高度重視人工智能在教育領(lǐng)域的應(yīng)用,積極推動人工智能和教育深度融合,促進(jìn)教育變革創(chuàng)新,加快發(fā)展伴隨每個人一生的教育、平等面向每個人的教育、更加開放靈活的教育.推動人工智能與教育領(lǐng)域深度融合發(fā)展,可以加快我國教育向數(shù)字化、信息化和智能化轉(zhuǎn)變[1-2].

        基于知識圖譜的文本挖掘技術(shù)是人工智能在教育領(lǐng)域的成功應(yīng)用之一[3].相較于傳統(tǒng)文獻(xiàn)研究法或問卷調(diào)查法分析,知識圖譜分析優(yōu)勢在于將信息學(xué)、圖形學(xué)、計量學(xué)結(jié)合形成交叉科學(xué)研究問題,通過大數(shù)據(jù)分析和可視化技術(shù)[4]探尋科學(xué)前沿領(lǐng)域的海量文獻(xiàn)數(shù)據(jù)信息之間的關(guān)聯(lián),展示學(xué)科前沿領(lǐng)域的進(jìn)展和趨勢.本文對中國知網(wǎng)(CNKI)數(shù)據(jù)庫收錄的教育領(lǐng)域高質(zhì)量學(xué)術(shù)期刊進(jìn)行知識圖譜分析,采用文本挖掘技術(shù)對文獻(xiàn)的關(guān)鍵詞和摘要進(jìn)行主題詞抽取與擴(kuò)充,利用K-means聚類等方法搭建、擴(kuò)充、分類文獻(xiàn)知識模型,從高頻關(guān)鍵詞、文獻(xiàn)主題和熱點詞聚類的統(tǒng)計結(jié)果來探討當(dāng)前教育領(lǐng)域的研究熱點和發(fā)展趨勢.

        1 基于自然語言處理的文獻(xiàn)分析方法

        1.1 基于Jieba分詞的人工智能教育主題詞擴(kuò)充

        為實現(xiàn)教育文獻(xiàn)的精準(zhǔn)分析,提升統(tǒng)計結(jié)果的可信度[5],通過TF-IDF算法[6]結(jié)合Jieba分詞技術(shù)進(jìn)一步擴(kuò)充文獻(xiàn)主題詞.本文采用TF-IDF的權(quán)值計算公式為:

        w=f1*f2=m/M*log[D/(DW+1)],

        (1)

        其中:w表示指定詞的權(quán)值;f1表示該詞在所在文本中出現(xiàn)的頻率(TF);f2為該詞的逆文本頻率(IDF);m表示該詞在指定文檔中出現(xiàn)的次數(shù);M表示指定文檔的總詞數(shù);D表示文檔庫中的總文檔數(shù);DW是出現(xiàn)該詞的文檔數(shù),并且在分母處加1防止分母為零的情況出現(xiàn).

        具體步驟,見圖1,首先,通過語料庫中的詞、詞頻、詞性等屬性構(gòu)建前綴詞典;其次,根據(jù)前綴詞典對文本進(jìn)行圖文掃描并切分;因為對于每個字都有多種切分方法,所以對于切分后的每個字,構(gòu)建一個以字的位置為key,以劃分的末尾位置所構(gòu)成的列表為value的映射;之后,根據(jù)切分結(jié)果的映射,得到每個字所有可能生成詞的有向無環(huán)圖;然后,利用基于詞典的逆向最大匹配法原理,采用從后往前的方式,從待分詞句子的句尾向句首進(jìn)行計算;最后,根據(jù)動態(tài)規(guī)劃計算最大概率路徑,從而得到最大概率的切分組合[7-8].

        1.2 基于K-means算法的研究內(nèi)容聚類

        為了更深層次剖析人工智能教育文獻(xiàn)研究內(nèi)容中的主要研究方向,本文通過運(yùn)用K-means算法[9]結(jié)合余弦距離函數(shù)對研究內(nèi)容主題詞進(jìn)行聚類[10].算法具體步驟如下:

        1.給定數(shù)據(jù)集X,樣本x∈X,從X中隨機(jī)選取K個樣本作為初始聚類中心記為c1,c2,…,ck;

        2.根據(jù)余弦相似性度量函數(shù)計算所有樣本與初始聚類中心的相似度,根據(jù)相似度將所有的樣本劃分為K個簇X1,X2,…,XK,然后,計算每個簇內(nèi)的平均值,作為新的聚類中心;

        3.計算聚類準(zhǔn)則函數(shù)為:

        (2)

        其中cj為簇Xj的聚類中心,d(x,cj)為余弦相似性度量函數(shù);

        4.重復(fù)步驟2和步驟3直到f值最小,則終止算法.

        2 文獻(xiàn)主題知識圖譜分析

        2.1 數(shù)據(jù)來源和數(shù)據(jù)預(yù)處理

        采用文本挖掘和數(shù)據(jù)分析等方法,研究人工智能背景下教育領(lǐng)域的熱點信息和發(fā)展趨勢.選取中國知網(wǎng)(CNKI)數(shù)據(jù)庫作為數(shù)據(jù)源,檢索主題包含“人工智能”和“教育”的文獻(xiàn),檢索時間跨度為2010年至2020年,去除非學(xué)術(shù)文獻(xiàn)后,為保證統(tǒng)計結(jié)果的可信度及預(yù)測模型的精準(zhǔn)度,需要選取具有代表性和高質(zhì)量特點的文獻(xiàn)數(shù)據(jù),因此保留SCI、EI、北大核心、CSSCI等高質(zhì)量學(xué)術(shù)期刊,最終共檢索到1 651篇文獻(xiàn)作為研究樣本.

        通過網(wǎng)絡(luò)爬蟲技術(shù)[11]獲取的文獻(xiàn)數(shù)據(jù)包括10類:文獻(xiàn)篇名、第一作者、來源期刊、第一作者所在單位、發(fā)表時間、引用次數(shù)、下載次數(shù)、關(guān)鍵詞、摘要和文獻(xiàn)頁數(shù).采用Python開源框架獲取和處理檢索到的研究樣本.將獲取到的文獻(xiàn)信息整理并存儲到Excel文件中,剔除2篇沒有頁碼信息的文獻(xiàn),共獲得文獻(xiàn)數(shù)據(jù)1 649條.除了關(guān)鍵詞外,文獻(xiàn)的摘要也蘊(yùn)含研究的主題信息,為了更全面地分析文獻(xiàn)主題,從文獻(xiàn)摘要中運(yùn)用自然語言處理進(jìn)行主題詞抽取,用于擴(kuò)充文獻(xiàn)的主題詞[12].擴(kuò)充后共得到關(guān)鍵詞5 331個,其中頻數(shù)大于1的關(guān)鍵詞共有1 567個.為了進(jìn)一步細(xì)化分析,將關(guān)鍵詞分為研究對象、研究內(nèi)容和研究方法[13].本文通過引用文獻(xiàn)、規(guī)則判斷和專家審核將主題詞分為三類,分別為研究對象(O)、研究內(nèi)容(T)和研究方法(M).具體研究過程,見圖2.

        2.2 基于網(wǎng)絡(luò)拓?fù)涞闹黝}詞頻度分析

        為發(fā)現(xiàn)高頻主題詞和關(guān)注度較高的主題詞,在對文獻(xiàn)主題詞進(jìn)行了選取和預(yù)處理基礎(chǔ)上,進(jìn)行了詞頻統(tǒng)計和TF-IDF平均值計算.根據(jù)詞頻統(tǒng)計排名,剔除無法明確定義類型的主題詞以后,篩選頻數(shù)前45名的主題詞,得到人工智能教育研究高頻主題詞,并列舉出前20的高頻主題詞,見表1.從提取的主題詞可以發(fā)現(xiàn),人工智能、教育、學(xué)習(xí)、教師、機(jī)器人等是高頻關(guān)鍵詞,說明將這些研究方面作為主題進(jìn)行研究的學(xué)者較多,代表著研究領(lǐng)域的核心和熱點研究方向.依據(jù)高頻主題詞在文獻(xiàn)中的關(guān)系,由此構(gòu)建了高頻主題詞網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),見圖3.

        表1 人工智能教育研究高頻主題詞

        2.3 基于聚類算法的主題詞分析

        研究對象作為研究領(lǐng)域的研究客體,從高頻主題詞統(tǒng)計表中可以看出,教育和教師是最為常見的研究客體.研究對象根據(jù)屬性不同也可以分為不同的類別.對于不同的研究群體,熱點研究對象分別是教師(142)、學(xué)生(78)、高校(73)等.

        研究內(nèi)容反映了研究領(lǐng)域中重點關(guān)注的問題和現(xiàn)象.本文對研究主題詞進(jìn)行余弦相似性分析和k-means聚類,將主題詞分為3類并得到以研究內(nèi)容為聚類中心的3個簇,聚類中心分別為信息化、人才培養(yǎng)、智能.根據(jù)主題詞判斷文獻(xiàn)所屬類別,將所有文獻(xiàn)分為3個類別.各類研究主題的年度分布,見圖4.

        從聚類中心可以看出在人工智能教育研究中,人才培養(yǎng)[14]和智能化正在逐漸成為研究的核心和熱點.通過信息化促進(jìn)培養(yǎng),已經(jīng)成為一種必然趨勢.

        研究中所采用的理論或模型稱為研究方法,由于研究方法類的主題詞數(shù)量少、頻數(shù)低,所以在主題詞分析中往往被忽略,本文則將研究方法單獨(dú)列為一項主題進(jìn)行分析,從而更好地了解領(lǐng)域內(nèi)學(xué)者們使用的研究方法.從高頻主題詞統(tǒng)計表中可以看出,除了學(xué)習(xí)(476)和研究(89)這兩個通用的方法外,融合(74)為人工智能教育的主要研究方法.人工智能與教育的融合是一次教育的革命,打破了傳統(tǒng)學(xué)校和教室的界限,倡導(dǎo)以學(xué)習(xí)者為中心的教育理念,促使個性化學(xué)習(xí)或定制學(xué)習(xí)成為現(xiàn)實.

        2.4 基于詞頻共現(xiàn)的研究熱點分析

        在一段時間內(nèi)相似主題文獻(xiàn)共同探討的話題稱為研究熱點.傳統(tǒng)的知識圖譜分析,使用關(guān)鍵詞進(jìn)行聚類分析,專家再根據(jù)分類結(jié)果分析得出熱點研究領(lǐng)域,這樣得到的結(jié)果是以標(biāo)簽為代表的聚類端點,缺少研究對象和研究內(nèi)容的相關(guān)性探討.為進(jìn)一步對熱點領(lǐng)域進(jìn)行分析,本文利用研究對象(O)和研究內(nèi)容(T)的熱力圖進(jìn)行熱點展示,見圖5.從圖中可以看出,教師對應(yīng)的熱門主題詞是智能、人工智能、教學(xué)、技術(shù)、實踐等,可見教師主要致力于探索人工智能下課程教學(xué)變革;線上線下結(jié)合的混合教學(xué)模式,成為當(dāng)前高校教育關(guān)注的熱點,學(xué)生應(yīng)用人工智能學(xué)習(xí)平臺可以給教育提供更多知識資源;教育智能化要求校園向環(huán)境智能化發(fā)展,高校也在逐步推行創(chuàng)新創(chuàng)業(yè)人才培養(yǎng)機(jī)制,探尋智能助力下高?,F(xiàn)代化的可能路徑.

        在構(gòu)建主題詞庫后,通過網(wǎng)絡(luò)拓?fù)鋱D展現(xiàn)出教學(xué)、智能、實踐、技術(shù)和人才培養(yǎng)等研究內(nèi)容都是圍繞教育、學(xué)生、教師和高校等研究對象展開的;經(jīng)過聚類分析得到,在教育領(lǐng)域,人才培養(yǎng)成為近些年來最受關(guān)注的方向;結(jié)合熱力圖對研究熱點領(lǐng)域的展示可以看出人工智能與教育之間的關(guān)系愈加緊密.

        新時代對人工智能的運(yùn)用,需要人工智能類專業(yè)人才來實現(xiàn),人才短缺成為當(dāng)前科技發(fā)展的瓶頸之一.面對這一突出問題,高校應(yīng)調(diào)整教育教學(xué)思維模式,建設(shè)多學(xué)科、復(fù)合型知識框架體系,培養(yǎng)學(xué)生的創(chuàng)新能力與實踐能力,引入前沿科技思想,開展交叉學(xué)科交流,拓展前沿領(lǐng)域的視野和眼界.人工智能是能夠引領(lǐng)教育發(fā)展方向的重要技術(shù),在人工智能時代背景下開展相關(guān)專業(yè)的人才培養(yǎng),高校要注重提升學(xué)生的學(xué)科視野,拓寬學(xué)科思維,豐富解決問題的方法,拓展解決問題的能力,夯實專業(yè)知識的認(rèn)知及應(yīng)用能力,為國家人工智能的發(fā)展奠定人才基礎(chǔ).

        3 結(jié) 論

        運(yùn)用文本挖掘和統(tǒng)計學(xué)的方法結(jié)合自然語言處理技術(shù)對文獻(xiàn)進(jìn)行信息抽取構(gòu)建主題詞庫,采用網(wǎng)絡(luò)爬蟲技術(shù)構(gòu)建樣本集,通過文本聚類和數(shù)據(jù)可視化展示文獻(xiàn)的研究熱點和發(fā)展趨勢.以教育論文為例,構(gòu)建后的主題詞庫,得到詞頻數(shù)最高的5個主題詞分別為人工智能(1157)、教育(674)、學(xué)習(xí)(476)、技術(shù)(186)和教學(xué)(173),其對應(yīng)的平均TF-IDF分別為0.58、0.4、0.48、0.3和0.43,可以看出學(xué)習(xí)和教學(xué)對于教育的重要性,在人工智能發(fā)展中專業(yè)技術(shù)人才的培養(yǎng)至關(guān)重要.通過網(wǎng)絡(luò)拓?fù)鋱D展示出研究對象、研究內(nèi)容和研究方法之間的關(guān)系,研究內(nèi)容是圍繞著研究對象展開的.通過聚類及數(shù)據(jù)可視化展示出:信息化、人才培養(yǎng)和智能正在逐漸成為研究的核心和熱點;人工智能與教師、學(xué)生和高校結(jié)合得越來越緊密,教育事業(yè)在人才培養(yǎng)、科技創(chuàng)新等方面為人工智能的發(fā)展奠定了良好的基礎(chǔ).

        猜你喜歡
        人工智能研究教育
        國外教育奇趣
        華人時刊(2022年13期)2022-10-27 08:55:52
        FMS與YBT相關(guān)性的實證研究
        題解教育『三問』
        遼代千人邑研究述論
        視錯覺在平面設(shè)計中的應(yīng)用與研究
        科技傳播(2019年22期)2020-01-14 03:06:54
        教育有道——關(guān)于閩派教育的一點思考
        EMA伺服控制系統(tǒng)研究
        2019:人工智能
        商界(2019年12期)2019-01-03 06:59:05
        人工智能與就業(yè)
        辦好人民滿意的首都教育
        久久精品一品道久久精品9| 亚洲中字幕日产av片在线| 永久中文字幕av在线免费| 成午夜福利人试看120秒| 中文字幕免费不卡二区| 国产性生交xxxxx免费| 亚洲av久久无码精品九九| 国产综合精品久久亚洲| 中文字幕有码高清| 日本久久精品国产精品| 国产黄片一区二区三区| 国产精品一区二区三久久不卡| 十八禁视频网站在线观看| 久久精品亚洲一区二区三区浴池| 国产亚洲精久久久久久无码| 在线亚洲综合| 精品视频专区| 国产在线a免费观看不卡| 亚洲av高清天堂网站在线观看| 成年av动漫网站18禁| 最新日本一道免费一区二区 | 精品福利一区| 亚洲综合一区二区三区久久| 久久久久九九精品影院| 人人妻人人狠人人爽天天综合网| 五十路熟女一区二区三区| 天天插视频| 日本少妇又色又紧又爽又刺激| 人妻丰满熟av无码区hd| 亚洲av无码一区二区乱子伦as| 亚洲av色香蕉一区二区蜜桃| 国产一区二区白浆在线观看| 久久亚洲精品情侣| 欧美综合自拍亚洲综合图片区| 亚洲精品乱码久久久久久按摩高清| 久久综合久中文字幕青草| 国语对白精品在线观看| 亚洲youwu永久无码精品| 日韩插啊免费视频在线观看| 亚洲欧美久久婷婷爱综合一区天堂| 粉嫩的18在线观看极品精品|