馮 欣,王 蘋(píng),馬占森,苗馮博*,辛瑞昊
(1.吉林化工學(xué)院 理學(xué)院,吉林 吉林 13200;2.吉林化工學(xué)院 信息與控制工程學(xué)院,吉林 吉林 133200)
習(xí)近平在2016年的全國(guó)高校思想政治工作中明確提出:“其他各門(mén)課都要守好一段渠、種好責(zé)任田,使各類課程與思想政治理論課同向同行,形成協(xié)同效應(yīng)”[1]。協(xié)同效應(yīng)是要求高校在育人的同時(shí),把思想政治教育與各類課程教學(xué)相融合,讓學(xué)生在實(shí)踐中接受思想政治教育[2]。課程思政的提出最早是2014年由上海教育委員會(huì)提出的,并在上海部分高校進(jìn)行了試驗(yàn),取得了較好的試驗(yàn)結(jié)果,習(xí)近平的講話為課程思政的進(jìn)一步發(fā)展指明了方向。
我國(guó)高等院校是引導(dǎo)大學(xué)生樹(shù)立正確的道德觀、人生觀和價(jià)值觀的主要陣地,理應(yīng)擔(dān)當(dāng)起新時(shí)代的新使命[3]。立德樹(shù)人成效是檢驗(yàn)高校工作的一切標(biāo)準(zhǔn)。近幾年來(lái),課程思政逐漸走進(jìn)大眾視野,也逐步走進(jìn)了各大高校的教學(xué)中,高校課程思政也成為學(xué)者研究的熱點(diǎn)之一[4]。
隨著時(shí)代的發(fā)展,人工智能、大數(shù)據(jù)等新興技術(shù)的崛起,計(jì)算機(jī)的計(jì)算性能得到了大幅度的提高以及構(gòu)建了各種大規(guī)模語(yǔ)料庫(kù),自然語(yǔ)言處理技術(shù)作為人工智能的一個(gè)分支,取得了快速發(fā)展,并且被廣泛應(yīng)用于多個(gè)領(lǐng)域,尤其是教育領(lǐng)域[5]。習(xí)近平在國(guó)際人工智能與教育大會(huì)致賀信中強(qiáng)調(diào),要高度重視人工智能在教育領(lǐng)域的應(yīng)用,積極推動(dòng)人工智能和教育深度結(jié)合,促進(jìn)教育變革創(chuàng)新,加快發(fā)展伴隨每個(gè)人一生的教育、平等面向每個(gè)人的教育、更加開(kāi)放靈活的教育[6]。
基于自然語(yǔ)言處理技術(shù)的文本挖掘是人工智能在教育領(lǐng)域的成果應(yīng)用之一。自然語(yǔ)言處理技術(shù)將數(shù)據(jù)挖掘、知識(shí)計(jì)量與聚類分析等方法結(jié)合,利用可視化分析直觀展示研究問(wèn)題的核心內(nèi)容、熱門(mén)方向和整體知識(shí)架構(gòu)等信息[7]。與傳統(tǒng)文獻(xiàn)研究法相比,自然語(yǔ)言處理技術(shù)通過(guò)大數(shù)據(jù)分析和可視化技術(shù)在海量文獻(xiàn)數(shù)據(jù)中獲取重要信息,分析和展示該領(lǐng)域的研究進(jìn)展和發(fā)展趨勢(shì),極大地提高了研究效率[8]。
本文基于自然語(yǔ)言處理技術(shù),對(duì)中國(guó)知網(wǎng)(CNKI)在2011—2021年期間所收錄的與高校課程思政相關(guān)的17 059篇文獻(xiàn)數(shù)據(jù)進(jìn)行了詳細(xì)處理。通過(guò)運(yùn)用知識(shí)圖譜,對(duì)已有的研究成果進(jìn)行綜合總結(jié)和可視化分析,旨在深入洞察課程思政領(lǐng)域的研究熱點(diǎn)及未來(lái)發(fā)展趨勢(shì),為研究課程思政的學(xué)者提供參考和數(shù)據(jù)支撐[9]。
本文用到的實(shí)驗(yàn)數(shù)據(jù)來(lái)源于中國(guó)知網(wǎng)(CNKI)數(shù)據(jù)庫(kù),采用中國(guó)知網(wǎng)的專業(yè)檢索,在搜索欄內(nèi)輸入“SU=‘高?!?‘思政’*‘課程’OR SU=‘大學(xué)生’*‘思想政治’*‘教育’OR SU=‘思政課’*‘改革’OR SU=‘思想政治’*‘建設(shè)’”,檢索時(shí)間選擇2011—2021年,共檢索到18 576篇相關(guān)文獻(xiàn)。獲取到的數(shù)據(jù)信息包括序號(hào)、文獻(xiàn)名字、作者、期刊名稱、發(fā)表時(shí)間、引用次數(shù)、下載次數(shù)、第一作者所在地、關(guān)鍵詞、頁(yè)數(shù)和摘要。剔除掉沒(méi)有關(guān)鍵詞的數(shù)據(jù),剩下17 059條文獻(xiàn)數(shù)據(jù)進(jìn)行分析和統(tǒng)計(jì)[10]。
本文分析了近十年中國(guó)知網(wǎng)中關(guān)于課程思政研究熱點(diǎn)相關(guān)問(wèn)題,由于數(shù)據(jù)量龐大,為了快速獲得準(zhǔn)確并且詳細(xì)的文獻(xiàn)信息,采用了網(wǎng)絡(luò)爬蟲(chóng)算法按照制定的規(guī)則爬取所需要的文獻(xiàn)數(shù)據(jù)信息。網(wǎng)絡(luò)爬蟲(chóng)的原名稱是web crawler,意思是在網(wǎng)頁(yè)上爬行搜索資料,所以網(wǎng)絡(luò)爬蟲(chóng)也叫網(wǎng)絡(luò)蜘蛛。它可以自動(dòng)瀏覽網(wǎng)頁(yè)中的信息,幫助人們自動(dòng)在網(wǎng)頁(yè)中進(jìn)行數(shù)據(jù)采集、下載和整理。隨著大數(shù)據(jù)時(shí)代的到來(lái),互聯(lián)網(wǎng)中的數(shù)據(jù)也越來(lái)越多,如果只靠人們手工去進(jìn)行數(shù)據(jù)收集和下載,則會(huì)大大降低收集數(shù)據(jù)的效率,所以近幾年來(lái)網(wǎng)絡(luò)爬蟲(chóng)的地位越來(lái)越重要[11]。目前網(wǎng)絡(luò)爬蟲(chóng)最常用的工具是python,python中有網(wǎng)絡(luò)爬蟲(chóng)最實(shí)用的三個(gè)框架,分別是BeautifulSoup、Selenium及Scrapy。三個(gè)框架都有各自的特色和優(yōu)點(diǎn),根據(jù)本文所需要的數(shù)據(jù),采用了“BeatifulSoup+Selenium”方法進(jìn)行了網(wǎng)絡(luò)爬蟲(chóng),該方法主要分為四個(gè)步驟,分別是抓取網(wǎng)頁(yè)、解析網(wǎng)頁(yè)信息、提取網(wǎng)頁(yè)信息數(shù)據(jù)和數(shù)據(jù)儲(chǔ)存。網(wǎng)絡(luò)爬蟲(chóng)的具體流程如圖1所示。在網(wǎng)絡(luò)爬蟲(chóng)過(guò)程中,遵循了網(wǎng)站的robots協(xié)議,保證了網(wǎng)絡(luò)爬蟲(chóng)的合法性[12]。
圖1 網(wǎng)絡(luò)爬蟲(chóng)具體流程
文本挖掘也叫文本數(shù)據(jù)挖掘,類似于文字分析,即文本處理中生成高質(zhì)量信息。自然語(yǔ)言處理(NLP)可以進(jìn)行文本挖掘,也是目前海量數(shù)據(jù)展現(xiàn)的一種常見(jiàn)的方法[13]。由于文獻(xiàn)數(shù)據(jù)有一定的復(fù)雜性與全面性,需要基于人工智能實(shí)線文獻(xiàn)數(shù)據(jù)文本挖掘,才可以充分了解課程思政的發(fā)展情況,并預(yù)測(cè)未來(lái)研究的熱點(diǎn)。本文基于自然語(yǔ)言處理技術(shù),采用TF-IDF算法提取文獻(xiàn)摘要中的主題詞,然后利用jieba分詞技術(shù)對(duì)文獻(xiàn)數(shù)據(jù)信息進(jìn)行切分,最后采用K-means聚類算法進(jìn)行分析,為學(xué)者提供相關(guān)數(shù)據(jù)進(jìn)行參考,便于針對(duì)性解決課程思政的一系列問(wèn)題?;谧匀徽Z(yǔ)言處理技術(shù)的課程思政文獻(xiàn)數(shù)據(jù)挖掘流程如圖2所示。
圖2 文獻(xiàn)數(shù)據(jù)挖掘流程圖
文獻(xiàn)摘要是對(duì)整篇文章進(jìn)行總結(jié)概括,簡(jiǎn)明扼要地說(shuō)明文章研究目的、研究方法和研究結(jié)論。本小節(jié)采用TF-IDF算法進(jìn)行文本挖掘,提取文獻(xiàn)摘要的主題詞。其中TF是詞頻表示一個(gè)給定的詞語(yǔ)t在這篇給定的文檔d中出現(xiàn)的頻率,TF越高,表示詞語(yǔ)t對(duì)文檔d來(lái)說(shuō)越重要,TF值低則相反。IDF是逆向文檔頻率,包含詞語(yǔ)t的文檔越少,則IDF越大,說(shuō)明詞語(yǔ)t對(duì)于文檔區(qū)分具有很好的能力。TF-IDF算法進(jìn)行文本挖掘流程如圖3所示。
圖3 TF-IDF算法流程圖
為了提升結(jié)果的準(zhǔn)確度,實(shí)現(xiàn)對(duì)課程思政相關(guān)文獻(xiàn)精準(zhǔn)分析,本小節(jié)將利用jieba分詞技術(shù)結(jié)合TF-IDF算法對(duì)文獻(xiàn)信息進(jìn)行切割,進(jìn)一步擴(kuò)充文獻(xiàn)主題詞。Jieba分詞技術(shù)是一個(gè)針對(duì)文本挖掘的分詞精度高、速度快的中文分詞模塊。Jieba分詞在語(yǔ)料庫(kù)的輔助下,通過(guò)規(guī)則與統(tǒng)計(jì)相結(jié)合的方法,利用前綴詞典實(shí)現(xiàn)文本掃描,生成不同的可能出現(xiàn)的詞組組合,通過(guò)尋找最大概率的組合找出詞頻最高的切分組合。Jieba分詞切割文獻(xiàn)信息流程如圖4所示。
圖4 jieba分詞流程圖
文本聚類是文本挖掘最關(guān)鍵的一步,文本聚類是把相似的對(duì)象分成不同組別或者不同的子集,讓同一個(gè)組別或者子集的成員對(duì)象有著相同的屬性。K-means聚類算法是比較常用的聚類算法,它把n個(gè)點(diǎn)劃分到k個(gè)聚類中,使每個(gè)點(diǎn)都屬于離他最近的均值即聚類中心對(duì)應(yīng)的聚類,來(lái)作為聚類的標(biāo)準(zhǔn)。K-means聚類算法提取文本主題詞流程圖如圖5所示。
圖5 K-means聚類算法流程圖
通過(guò)自然語(yǔ)言處理的TF-IDF算法、jieba分詞和K-means聚類得到了關(guān)于課程思政的3 789個(gè)主題詞。根據(jù)各主題詞出現(xiàn)的次數(shù)進(jìn)行排序,選取了出現(xiàn)次數(shù)最多的50個(gè)主題詞進(jìn)行統(tǒng)計(jì)分析,計(jì)算各主題詞的平均TF-IDF值和標(biāo)注各主題詞的研究類型,分別將主題詞標(biāo)注為研究對(duì)象O、研究?jī)?nèi)容T和研究方法M。標(biāo)注主題詞時(shí)剔除了7個(gè)有相同意義或研究類型模糊的主題詞,剩余43個(gè)主題詞進(jìn)行統(tǒng)計(jì)分析。主題詞分析結(jié)果見(jiàn)表1。
表1 主題詞分析結(jié)果
從表中可以看出課程思政、高校、大學(xué)生、思政課等等主題詞,不僅出現(xiàn)次數(shù)多,而且平均TF-IDF值也是比較高的,說(shuō)明這些主題詞是學(xué)者研究課程思政的熱點(diǎn)方向。
本文利用自然語(yǔ)言處理中的K-means聚類算法對(duì)研究?jī)?nèi)容主題詞進(jìn)行分析,將主題詞分為三個(gè)主要類別并得到了以研究?jī)?nèi)容為聚類中心的3個(gè)簇,聚類中心分別為課程(477)、思想(222)、大學(xué)生(36)。三個(gè)主題的文獻(xiàn)數(shù)量近十年的變化趨勢(shì)如圖6所示,圖中橫縱標(biāo)代表年份,縱坐標(biāo)代表該主題詞在文獻(xiàn)中出現(xiàn)的次數(shù)。
圖6 文獻(xiàn)主題詞年度分布圖
從課程思政研究?jī)?nèi)容來(lái)看,課程思政研究的主題詞可以劃分為三個(gè)主要類別:課程、思想和大學(xué)生。在過(guò)去十年中,這三個(gè)主題詞的研究文獻(xiàn)數(shù)量呈現(xiàn)持續(xù)增長(zhǎng)的趨勢(shì)。特別是在2020年至2021年期間,這三個(gè)主題的文獻(xiàn)發(fā)表數(shù)量有顯著增加。課程思政研究文獻(xiàn)的數(shù)量在2014年迅速提升,這可能與上海市教育委員會(huì)在該年正式推出課程思政試驗(yàn)有關(guān)。這一試驗(yàn)在上海一些高校中開(kāi)展并取得良好的成效,這使得課程思政成為研究的熱點(diǎn),促使相關(guān)文獻(xiàn)產(chǎn)出量快速增加。這表明課程思政已經(jīng)成為教育界的一個(gè)熱門(mén)研究領(lǐng)域,并且有望在未來(lái)繼續(xù)發(fā)展和探索。
本小節(jié)對(duì)文獻(xiàn)主題詞的研究對(duì)象進(jìn)行分析總結(jié),總結(jié)結(jié)果如圖7所示。
圖7 研究對(duì)象詞頻統(tǒng)計(jì)
圖7中橫坐標(biāo)文獻(xiàn)主題詞,縱坐標(biāo)代表每個(gè)主題詞在文獻(xiàn)中出現(xiàn)的次數(shù)。根據(jù)對(duì)文獻(xiàn)研究對(duì)象進(jìn)行分析可知,大學(xué)生是課程思政的主要研究對(duì)象,反映了我國(guó)對(duì)青年大學(xué)生思想政治教育的重視程度。課程思政正在逐漸滲透到各大高校,在傳授專業(yè)課程的同時(shí),也向大學(xué)生傳授思想政治教育。課程思政已成為大學(xué)教育中不可或缺的組成部分。
對(duì)文獻(xiàn)數(shù)據(jù)的核心機(jī)構(gòu)進(jìn)行整理和總結(jié),發(fā)表文獻(xiàn)數(shù)量排名前30的機(jī)構(gòu)見(jiàn)表2。
表2 發(fā)表文獻(xiàn)核心機(jī)構(gòu)
通過(guò)對(duì)文獻(xiàn)數(shù)據(jù)核心機(jī)構(gòu)的整理和總結(jié)可知,本科高校是課程思政研究的主要機(jī)構(gòu),擁有豐富的研究經(jīng)驗(yàn)和優(yōu)勢(shì)條件。相比之下,??坪图夹g(shù)院校在課程思政研究方面的貢獻(xiàn)相對(duì)較低,需要加強(qiáng)對(duì)課程思政教育研究與教學(xué)的關(guān)注和支持。
研究熱點(diǎn)是一段時(shí)間內(nèi)該研究領(lǐng)域的焦點(diǎn),學(xué)者共同探討的話題。分析研究熱點(diǎn)的方法有很多,目前比較常用的有科學(xué)計(jì)量方法Citespace軟件、共詞分析方法、聚類分析和多尺度分析。傳統(tǒng)的聚類分析,是使用關(guān)鍵詞進(jìn)行聚類,再根據(jù)聚類結(jié)果分析研究熱點(diǎn)領(lǐng)域,這樣分析的研究熱點(diǎn)是以標(biāo)簽為代表的聚類端點(diǎn),缺少研究?jī)?nèi)容和研究對(duì)象的相關(guān)分析。本文將對(duì)研究?jī)?nèi)容(T)和研究對(duì)象(O)進(jìn)行相關(guān)分析,熱力圖如圖8所示,從圖中可以看出,課程思政主要圍繞高校大學(xué)生開(kāi)展,研究熱點(diǎn)內(nèi)容是思想政治教育。課程思政是中國(guó)高校獨(dú)有的教育理念,是新時(shí)代思想政治教育發(fā)展的前進(jìn)方向。跟傳統(tǒng)的思想政治教育相比,課程思政全方位對(duì)高校大學(xué)生進(jìn)行教育,讓思想政治教育與專業(yè)課程同向同行。
圖8 研究對(duì)象(O)和研究?jī)?nèi)容(T)熱力圖
本文借助自然語(yǔ)言處理技術(shù)和數(shù)據(jù)可視化,對(duì)課程思政研究領(lǐng)域的文獻(xiàn)進(jìn)行總結(jié)和可視化分析,以課程思政2011—2021年17 059篇文獻(xiàn)數(shù)據(jù)作為樣本,從發(fā)表時(shí)間、核心機(jī)構(gòu)、主要研究對(duì)象和高頻主題詞進(jìn)行統(tǒng)計(jì)分析,探究課程思政的研究熱點(diǎn)和發(fā)展趨勢(shì)。通過(guò)對(duì)課程思政的定量分析,可以得知從2014年提出課程思政這一概念,就受到了學(xué)術(shù)界的高度關(guān)注。我國(guó)課程思政主要針對(duì)的研究對(duì)象是大學(xué)生,課程思政的研究也已經(jīng)從理論探討逐漸轉(zhuǎn)向?qū)I(yè)課程教學(xué)實(shí)踐,表明課程思政和各類專業(yè)課教學(xué)正在協(xié)同發(fā)展。從研究機(jī)構(gòu)分析來(lái)看,課程思政的研究機(jī)構(gòu)主要集中在本科高校,未來(lái)需要加強(qiáng)高職院校課程思政的研究與教學(xué)。綜上所述,課程思政作為一項(xiàng)重要的教育理念和實(shí)踐,受到了廣泛的關(guān)注,并在大學(xué)生思想政治教育和專業(yè)課程教學(xué)中發(fā)揮著積極的作用。未來(lái)的研究需要更多地關(guān)注高職院校的課程思政實(shí)踐,推動(dòng)思政教育全面發(fā)展。