摘要:基于大數(shù)據(jù)視角,運(yùn)用中文分詞技術(shù)對(duì)中國(guó)共產(chǎn)黨人的精神譜系的核心要義和價(jià)值意蘊(yùn)進(jìn)行分析,通過(guò)定義停用詞、需去除的標(biāo)點(diǎn)符號(hào)、編碼規(guī)則和新詞的方法構(gòu)建分析模型,進(jìn)行數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理和分詞與可視化分析,得出中國(guó)共產(chǎn)黨人的精神譜系高頻詞頻次表、詞云圖和各個(gè)歷史時(shí)期高頻詞頻次表、詞云圖,進(jìn)一步揭示了中國(guó)共產(chǎn)黨人的精神譜系具有內(nèi)在穩(wěn)定性、時(shí)代適用性的特征和育人價(jià)值。
關(guān)鍵詞:政治品格;建黨精神;精神譜系;大數(shù)據(jù);中文分詞
中圖分類號(hào):D64;D261文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):2095-6916(2023)06-0005-04
中國(guó)共產(chǎn)黨在矢志踐行初心使命、篳路藍(lán)縷奠基立業(yè)百年中,飽經(jīng)風(fēng)霜而風(fēng)華正茂,根本在于革命加拼命的強(qiáng)大精神力量。在慶祝中國(guó)共產(chǎn)黨成立100周年大會(huì)的講話中,習(xí)近平總書(shū)記指出:“一百年來(lái),中國(guó)共產(chǎn)黨弘揚(yáng)偉大建黨精神,在長(zhǎng)期奮斗中構(gòu)建起中國(guó)共產(chǎn)黨人的精神譜系,錘煉出鮮明的政治品格。歷史川流不息,精神代代相傳?!保?]雖然時(shí)代在變遷,但中國(guó)共產(chǎn)黨人的精神譜系的形成是有其內(nèi)在規(guī)律的。在中國(guó)共產(chǎn)黨百年歷史中,到底是哪些因素支撐著黨的精神塑造?其核心要義和精神內(nèi)涵有哪些?精神譜系的當(dāng)代價(jià)值是什么?本研究從大數(shù)據(jù)視角,通過(guò)中文分詞技術(shù)及WordCloud詞云工具探討分析百年共產(chǎn)黨人精神譜系中的內(nèi)涵價(jià)值,闡明中國(guó)共產(chǎn)黨人的精神譜系的歷史傳承,以更好地指導(dǎo)思政課程與課程思政教學(xué)實(shí)踐。
一、中國(guó)共產(chǎn)黨人的精神譜系的基本內(nèi)涵
習(xí)近平總書(shū)記在黨史學(xué)習(xí)教育動(dòng)員大會(huì)講話中指出:“在一百年的非凡奮斗歷程中,一代又一代中國(guó)共產(chǎn)黨人頑強(qiáng)拼搏、不懈奮斗,涌現(xiàn)了一大批視死如歸的革命烈士、一大批頑強(qiáng)奮斗的英雄人物、一大批忘我奉獻(xiàn)的先進(jìn)模范,……,構(gòu)筑起了中國(guó)共產(chǎn)黨人的精神譜系?!保?]中國(guó)共產(chǎn)黨的百年歷史是一部不斷鑄就崇高精神、弘揚(yáng)優(yōu)良傳統(tǒng)、賡續(xù)精神血脈的發(fā)展歷史。
中國(guó)共產(chǎn)黨人的精神譜系中蘊(yùn)含著深厚的中華傳統(tǒng)文化根源。經(jīng)過(guò)幾千年的文明發(fā)展,中華民族形成了一脈相承的精神追求和強(qiáng)大的精神支撐[3],體現(xiàn)在以愛(ài)國(guó)主義為核心的團(tuán)結(jié)友愛(ài)、崇尚和平、勤勞勇敢、堅(jiān)毅頑強(qiáng)的民族精神中,創(chuàng)造出燦爛輝煌的中華文化和中華文明[4]。精神譜系還有著對(duì)馬克思主義的堅(jiān)持與創(chuàng)新,是中國(guó)共產(chǎn)黨帶領(lǐng)全國(guó)人民在追求共產(chǎn)主義理想信念,探索中國(guó)革命、建設(shè)和改革中,勇敢面對(duì)各種風(fēng)險(xiǎn)挑戰(zhàn),在艱苦卓絕的斗爭(zhēng)中不斷形成的,體現(xiàn)著中國(guó)共產(chǎn)黨的理想信念、根本宗旨、工作作風(fēng),凝聚著中國(guó)共產(chǎn)黨人艱苦奮斗、開(kāi)拓進(jìn)取的偉大品格[5]。精神譜系中既有貫穿于各個(gè)歷史時(shí)期的成果,也有階段性和地域性成果,還有行業(yè)性、先進(jìn)個(gè)人的成果,成為一個(gè)內(nèi)涵豐富、內(nèi)容多元、形式多樣、層次分明的有機(jī)整體[6]。
黨領(lǐng)導(dǎo)全國(guó)人民邁進(jìn)第二個(gè)百年奮斗目標(biāo)新征程之時(shí),中國(guó)共產(chǎn)黨人的精神譜系更應(yīng)深度融入中國(guó)人的精神血脈,成為當(dāng)代人最為鮮明的精神氣質(zhì)和精神特色[6]。需要我們深入挖掘精神譜系的核心要素和精神內(nèi)涵,引導(dǎo)當(dāng)代中國(guó)人尤其是青年大學(xué)生不斷從精神譜系中汲取智慧和力量,傳承紅色基因,賡續(xù)精神血脈,為實(shí)現(xiàn)中華民族偉大復(fù)興而鼓足砥礪奮進(jìn)的精神動(dòng)力。目前關(guān)于研究精神譜系及其傳承和弘揚(yáng)的文獻(xiàn)較多,但從大數(shù)據(jù)思維和視角下研究中國(guó)共產(chǎn)黨人的精神譜系的文獻(xiàn)相對(duì)較少。
二、中文分詞技術(shù)的可行性
中文分詞是計(jì)算機(jī)中文自然語(yǔ)言處理的首要任務(wù)。中文語(yǔ)句是由字、詞構(gòu)成的序列,同一字詞在不同的語(yǔ)句或文本環(huán)境中語(yǔ)義會(huì)有所不同。文本分詞是按照一定的算法將詞從文本中切分出來(lái),得到詞列表,再基于分詞列表分析理解文本語(yǔ)義。分詞算法主要有基于統(tǒng)計(jì)、字符串匹配和理解三大類[7]。
影響中文分詞效果的因素主要有:詞與詞之間沒(méi)有明顯的分隔符,容易產(chǎn)生不同的分詞結(jié)果;不同文本環(huán)境中的字詞語(yǔ)義不同;詞的多種釋義容易產(chǎn)生歧義;實(shí)體名詞如機(jī)構(gòu)名、地名、人名、簡(jiǎn)稱,網(wǎng)絡(luò)中出現(xiàn)新詞、流行用語(yǔ),行業(yè)領(lǐng)域中的行業(yè)專業(yè)術(shù)語(yǔ)等難以識(shí)別;切分的字詞長(zhǎng)度不同等[8]。
Jieba是一個(gè)Python第三方中文分詞庫(kù),其分詞原理是在前綴詞典的基礎(chǔ)上進(jìn)行詞圖掃描,將待分詞內(nèi)容和中文詞庫(kù)進(jìn)行比對(duì),再以有向無(wú)環(huán)圖的形式生成所有可能成詞情況的圖表示,通過(guò)動(dòng)態(tài)規(guī)劃方法找到基于詞頻最大概率的切分組合。Jieba分詞中還可以自定義分詞字典[9]。
詞云是將文本中的高頻關(guān)鍵詞以形象的圖像可視化方式呈現(xiàn),WordCloud是Python的一個(gè)第三方庫(kù),廣泛應(yīng)用于詞云展示。
三、基于中文分詞的中國(guó)共產(chǎn)黨人的精神譜系分析模型構(gòu)建
(一)定義停用詞
文本中經(jīng)常被使用的如“的”“和”等頻繁詞和語(yǔ)氣助詞、副詞、介詞、連詞,以及針對(duì)具體內(nèi)容特點(diǎn),存在的對(duì)文本內(nèi)容無(wú)幫助或無(wú)意義的詞,在分詞檢索比對(duì)時(shí),容易對(duì)文本的有效信息造成噪音干擾。因此,在分詞前,需要對(duì)所檢索的文本進(jìn)行消除噪音處理,這些字或詞被定義為停用詞。分詞時(shí)會(huì)自動(dòng)忽略停用詞,提高分詞效率和準(zhǔn)確性。
(二)定義需去除的標(biāo)點(diǎn)符號(hào)
在中文語(yǔ)句中,使用“,”“?!钡葮?biāo)點(diǎn)符號(hào)表示句子前后的停頓、句調(diào)及詞語(yǔ)的性質(zhì)與作用,在分詞結(jié)果中,這些標(biāo)點(diǎn)符號(hào)沒(méi)有任何意義,還會(huì)在分詞檢索時(shí),對(duì)文本的有效信息造成噪音干擾,所以在分詞前要對(duì)所檢索文本的標(biāo)點(diǎn)符號(hào)進(jìn)行去除處理。
(三)定義編碼規(guī)則
首先需要把文本轉(zhuǎn)換為計(jì)算機(jī)能夠處理的二進(jìn)制數(shù),這個(gè)過(guò)程被稱為編碼。常見(jiàn)的字符編碼格式有ASCII、Unicode、GBK、UTF-8等,計(jì)算機(jī)內(nèi)存中統(tǒng)一使用Unicode編碼。文本處理時(shí),將文件內(nèi)容經(jīng)過(guò)編碼轉(zhuǎn)換為Unicode編碼讀入內(nèi)存,保存時(shí)再經(jīng)解碼把Unicode編碼轉(zhuǎn)換為文件編碼進(jìn)行保存。在分詞檢索前,需要確定被分詞文本、停用詞等文件的編碼規(guī)則,并進(jìn)行統(tǒng)一,否則會(huì)出現(xiàn)亂碼。
(四)定義新詞
實(shí)體名詞如人名、機(jī)構(gòu)名、簡(jiǎn)稱、省略語(yǔ),以及出現(xiàn)的新詞、網(wǎng)絡(luò)流行用語(yǔ)和行業(yè)專業(yè)術(shù)語(yǔ)等,在字典中沒(méi)有被提前收錄,運(yùn)算時(shí)難以識(shí)別,在分詞運(yùn)算前需要被定義。
四、基于中文分詞的中國(guó)共產(chǎn)黨人的精神譜系分析實(shí)例
(一)數(shù)據(jù)采集
數(shù)據(jù)主要來(lái)源于共產(chǎn)黨員網(wǎng)、學(xué)習(xí)強(qiáng)國(guó)等學(xué)習(xí)平臺(tái)以及文獻(xiàn)資料中,收集整理主要從時(shí)間、地域、特定歷史事件和特殊時(shí)期、革命烈士和勞模英模、特定領(lǐng)域五個(gè)維度進(jìn)行,組成了中國(guó)共產(chǎn)黨百年歷史實(shí)踐中形成的一系列偉大精神及其內(nèi)容,如紅船精神、長(zhǎng)征精神、右玉精神、改革開(kāi)放精神、深圳特區(qū)精神、科學(xué)家精神、載人航天精神、孔繁森精神和勞模精神等。
(二)數(shù)據(jù)預(yù)處理
從黨的系列精神中,隨機(jī)選取30種進(jìn)行預(yù)處理,補(bǔ)充完善定義的停用詞、需去除的標(biāo)點(diǎn)符號(hào)、編碼規(guī)則和新詞。例如,“的”“把”“同”等字在文本中出現(xiàn)的頻次較多,屬于高頻詞,但在分析結(jié)果中作用不大,成為影響分析結(jié)果的噪音,需去除;如“初心”,在分詞中被切分為“初”和“心”兩個(gè)字,需要作為新詞被定義;再如在文件讀入時(shí),文本開(kāi)始位置會(huì)出現(xiàn)“\ufeff”字符,通過(guò)改變編碼方式“UTF-8”為“UTF-8-sig”或者將“\ufeff”作為一個(gè)特殊符號(hào),添加到去除標(biāo)點(diǎn)符號(hào)中處理。還有,如“愛(ài)黨”“聽(tīng)黨”“信黨”都表示熱愛(ài)黨、對(duì)黨忠誠(chéng)的含義,需作為同義詞定義;“人民”“群眾”需定義為同義詞等。經(jīng)過(guò)預(yù)處理,生成了具有精神譜系特定環(huán)境的語(yǔ)義詞庫(kù),為對(duì)所有精神內(nèi)容的高效準(zhǔn)確分詞奠定基礎(chǔ)。
(三)分詞與可視化分析
對(duì)系列精神文本進(jìn)行新詞加載、同義詞加載、文本分詞、去除停用詞和標(biāo)點(diǎn)符號(hào),最后生成有效分詞,經(jīng)過(guò)詞頻統(tǒng)計(jì)及排序,得到使用頻次超過(guò)10%的詞,如表1所示。中國(guó)共產(chǎn)黨人的精神譜系各個(gè)歷史時(shí)期高頻詞頻次表,如表2所示。
研究使用Python第三方包WordCloud,經(jīng)過(guò)定義詞云對(duì)象、生成詞云和顯示輸出,對(duì)分詞進(jìn)行了圖像可視化顯示,精神譜系詞云圖如圖1所示,各個(gè)歷史時(shí)期的詞云圖如圖2所示。
五、結(jié)論
習(xí)近平總書(shū)記指出:“偉大建黨精神是中國(guó)共產(chǎn)黨的精神之源?!保?]建黨精神賡續(xù)始終,貫穿百年形成的精神譜系。能夠體現(xiàn)中國(guó)共產(chǎn)黨人的精神譜系價(jià)值意蘊(yùn)的高頻詞有艱苦奮斗、服務(wù)人民、團(tuán)結(jié)一心、熱愛(ài)祖國(guó)、堅(jiān)定信念、無(wú)私奉獻(xiàn)、自強(qiáng)不息、不怕?tīng)奚?、敢為人先、熱?ài)黨、實(shí)事求是、革命精神。這些核心要素已作為精神內(nèi)核融入共產(chǎn)黨人的血脈與靈魂,成為中國(guó)共產(chǎn)黨歷經(jīng)百年磨難而風(fēng)華正茂的生命源泉,它們統(tǒng)一于黨百年奮斗的“十個(gè)堅(jiān)持”寶貴歷史經(jīng)驗(yàn)[10],相互連貫成為有機(jī)整體。
中國(guó)共產(chǎn)黨人的精神譜系具有內(nèi)在穩(wěn)定性,艱苦奮斗、熱愛(ài)祖國(guó)、無(wú)私奉獻(xiàn)、服務(wù)人民、團(tuán)結(jié)一心貫穿于中國(guó)共產(chǎn)黨發(fā)展歷程的各個(gè)歷史時(shí)期,體現(xiàn)了共產(chǎn)黨以人民為中心的大愛(ài)精神、以民族復(fù)興為己任的擔(dān)當(dāng)品質(zhì)、不怕?tīng)奚墨I(xiàn)身精神以及英勇斗爭(zhēng)的堅(jiān)強(qiáng)意志。這與以愛(ài)國(guó)主義為核心的中華民族精神相統(tǒng)一;與歷久彌新的中華優(yōu)秀傳統(tǒng)文化相統(tǒng)一;與中國(guó)共產(chǎn)黨緊緊依靠人民、全心全意為人民服務(wù)的根本宗旨相統(tǒng)一;與中國(guó)共產(chǎn)黨大無(wú)畏的精神氣概相統(tǒng)一,形成了中華民族偉大復(fù)興的動(dòng)力之源。充分表明中國(guó)共產(chǎn)黨人的精神譜系不僅是對(duì)馬克思主義的堅(jiān)持,更是將馬克思主義與中華民族精神和中華優(yōu)秀傳統(tǒng)文化相結(jié)合,進(jìn)行了中國(guó)化創(chuàng)新發(fā)展。正如毛澤東指出的:“馬克思主義必須和我國(guó)的具體特點(diǎn)相結(jié)合并通過(guò)一定的民族形式才能實(shí)現(xiàn)?!保?1]
精神譜系還具有時(shí)代適用性,這與中國(guó)共產(chǎn)黨在各個(gè)歷史時(shí)期的時(shí)代使命、我國(guó)各時(shí)期的社會(huì)環(huán)境、經(jīng)濟(jì)條件等因素有關(guān)。例如,不怕?tīng)奚哂行旅裰髦髁x革命及社會(huì)主義革命和建設(shè)兩個(gè)時(shí)期的時(shí)代特征。這兩個(gè)時(shí)期是艱苦卓絕的革命歲月和新中國(guó)建設(shè)困難重重的年代,中國(guó)共產(chǎn)黨為實(shí)現(xiàn)救國(guó)救民并在一窮二白的廢墟上進(jìn)行社會(huì)主義革命和建設(shè),拋頭顱灑熱血、浴血奮戰(zhàn),排除萬(wàn)難、艱苦創(chuàng)業(yè),凝聚著“砍頭不要緊,只要主義真”的崇高信仰,體現(xiàn)了為民族獨(dú)立、國(guó)家自強(qiáng)、人民溫飽而勇于犧牲的忘我精神。再如,敢為人先具有改革開(kāi)放和社會(huì)主義現(xiàn)代化建設(shè)、新時(shí)代中國(guó)特色社會(huì)主義發(fā)展兩個(gè)時(shí)期的時(shí)代特征。這兩個(gè)時(shí)期是我國(guó)開(kāi)啟改革開(kāi)放、現(xiàn)代化征程的激情歲月、實(shí)現(xiàn)中華民族“兩個(gè)一百年”①奮斗目標(biāo)和中華民族偉大復(fù)興的新時(shí)代,中國(guó)共產(chǎn)黨自信自強(qiáng)、敢闖敢試,積極應(yīng)對(duì)風(fēng)險(xiǎn)挑戰(zhàn),體現(xiàn)了中國(guó)共產(chǎn)黨人的胸懷祖國(guó)、心系人民的愛(ài)國(guó)為民情懷,變局中開(kāi)新局、勇闖新路的奮斗精神和攻堅(jiān)克難的堅(jiān)韌品格。
中國(guó)共產(chǎn)黨人的精神譜系中所蘊(yùn)含的理想信念、根本宗旨、思想道德、工作作風(fēng)等精神內(nèi)涵是大學(xué)生個(gè)人品質(zhì)塑造、成長(zhǎng)成才的精神食糧,也是大學(xué)生增強(qiáng)做中國(guó)人的志氣、骨氣、底氣的紅色沃土[12]。精神內(nèi)涵的挖掘?yàn)榻處熯M(jìn)一步深入發(fā)掘思政教育內(nèi)容和素材,深化課程教育教學(xué)改革、創(chuàng)新第二課堂教育方式提供指導(dǎo),用中國(guó)共產(chǎn)黨堅(jiān)定的理想信念、艱苦奮斗的優(yōu)良作風(fēng)、勇于奉獻(xiàn)的為民情懷教育和滋養(yǎng)大學(xué)生的志氣、骨氣和底氣,引導(dǎo)他們胸懷祖國(guó)、眾志成城,為實(shí)現(xiàn)中華民族偉大復(fù)興貢獻(xiàn)自己的青春智慧和力量。
注釋:
①“兩個(gè)一百年”:即到中國(guó)共產(chǎn)黨成立100年時(shí)全面建成小康社會(huì),到新中國(guó)成立100年時(shí)建成富強(qiáng)民主文明和諧美麗的社會(huì)主義現(xiàn)代化強(qiáng)國(guó)。
參考文獻(xiàn):
[1]習(xí)近平.在慶祝中國(guó)共產(chǎn)黨成立100周年大會(huì)上的講話[J].求是,2021(14).
[2]習(xí)近平.在黨史學(xué)習(xí)教育動(dòng)員大會(huì)上的講話[J].求是,2021(7).
[3]黃正平.偉大建黨精神——建黨理論新開(kāi)拓? 黨建思想新境界[N].南通日?qǐng)?bào),2021-07-26(A06).
[4]王相坤.中國(guó)共產(chǎn)黨人精神譜系的構(gòu)建[N].北京日?qǐng)?bào),2021-07-26(009).
[5]周進(jìn).中國(guó)共產(chǎn)黨人的精神譜系的生成邏輯、精神內(nèi)涵與當(dāng)代價(jià)值[J].中國(guó)井岡山干部學(xué)院學(xué)報(bào),2021(4).
[6]佘雙好,王弢.中國(guó)共產(chǎn)黨精神譜系在青少年中的傳承與弘揚(yáng)[J].青年探索,2021(4).
[7]石鳳貴.中文文本分詞及其可視化技術(shù)研究[J].現(xiàn)代計(jì)算機(jī),2020(12).
[8]胡曉輝,朱志祥.基于深度學(xué)習(xí)的中文分詞方法研究[J].計(jì)算機(jī)與數(shù)字工程,2020(3).
[9]嵩天,禮欣,黃天羽.Python語(yǔ)言程序設(shè)計(jì)基礎(chǔ):第2版[M].北京:高等教育出版社,2018:169-177.
[10]中國(guó)共產(chǎn)黨第十九屆中央委員會(huì)第六次全體會(huì)議公報(bào)[N].人民日?qǐng)?bào),2021-11-12(01).
[11]毛澤東.毛澤東選集:第2卷[M].北京:人民出版社,1991:534.
[12]曹甜甜.中國(guó)共產(chǎn)黨人的精神譜系的內(nèi)涵、特征和價(jià)值探析[J].云南農(nóng)業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)),2021(6).
作者簡(jiǎn)介:王金虹(1973—),女,漢族,山西平遙人,山西中醫(yī)藥大學(xué)馬克思主義學(xué)院黨總支書(shū)記、副教授,研究方向?yàn)閿?shù)據(jù)挖掘。
(責(zé)任編輯:張震)