亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)據(jù)可視化之利用Python制作詞云圖

        2020-01-25 16:14:08羅晶
        中國科技教育 2020年9期
        關(guān)鍵詞:詞云分詞三國演義

        羅晶

        “十年樹木,百年樹人”,教育的根本目的在于增強(qiáng)學(xué)生的能力,使學(xué)生成為人才。為了提高學(xué)生的信息素養(yǎng),培養(yǎng)未來的創(chuàng)造性人才,學(xué)生不但要學(xué)習(xí)現(xiàn)代技術(shù),也要具備人文素養(yǎng),使各種復(fù)雜知識(shí)在人文精神的燭照下融會(huì)貫通。如何在教學(xué)中介入文化價(jià)值,并運(yùn)用現(xiàn)代教育技術(shù)提高學(xué)生的文化素質(zhì)呢?這里我們以《三國演義》小說為例,讓學(xué)生閱讀學(xué)習(xí),然后通過Python 編程進(jìn)行分析。

        《三國演義》是中國古典四大名著之一,亦是中國第一部長篇?dú)v史章回小說。它以人物為載體,形象地演繹了中國傳統(tǒng)文化的基本精神,即仁、義、禮、智、信、勇等中國傳統(tǒng)文化價(jià)值體系中的核心因素。那么,如何準(zhǔn)確快捷地將這部長篇?dú)v史章回小說中的信息提取出來,并以生動(dòng)的方式呈現(xiàn)給學(xué)生呢?這就需要用到詞云圖。

        認(rèn)識(shí)詞云圖

        詞云圖是文本可視化的一種方式,借助相應(yīng)的網(wǎng)站工具,對(duì)復(fù)雜的文本信息(如單詞表、例句、課文)進(jìn)行加工處理,詞匯出現(xiàn)頻率越高,字號(hào)越大,這樣的詞匯就是高頻實(shí)義詞,也是信息材料關(guān)注的焦點(diǎn),最后以圖形化的形式出現(xiàn)??傮w來說,詞云圖有如下功能。

        ·提煉:提煉呈現(xiàn)實(shí)義詞

        ·排序:按頻率高低決定詞匯顯示的大小,出現(xiàn)次數(shù)越多,默認(rèn)字號(hào)越大

        ·突顯:對(duì)高頻實(shí)義詞起到突顯的作用

        ·圖像化:對(duì)整體外觀形成特定的圖像

        Python 代碼和環(huán)境選擇

        Python 相對(duì)其他代碼,簡單、易學(xué)、好上手,對(duì)語法要求不高,便于學(xué)生進(jìn)行學(xué)習(xí)實(shí)踐。

        Python jieba 第三方庫選擇

        Python 對(duì)于文章分析有眾多庫, 其中中文庫包括yaha(啞哈)、jieba(結(jié)巴)、基于HMM 模型的中文分詞、genius 中文分詞等。通過使用,我們發(fā)現(xiàn),jieba 庫目前應(yīng)用比較廣,遇到問題容易找到解決方案,是優(yōu)秀中文分詞第三方庫,于是決定應(yīng)用jieba 庫。jieba 分詞有3 種模式,分別為精確模式、全模式和搜索引擎模式。

        ·精確模式:把文本精確切分開,不存在冗余單詞。

        ·全模式:把文本中所有可能的詞語都掃描出來,有冗余。

        ·搜索引擎模式:在精確模式基礎(chǔ)上,對(duì)長詞再次切分。

        Python wordcloud第三方庫選擇

        學(xué)生完成分析后需要進(jìn)行展示,然后由大家討論。為了展示更加美觀,我們選擇使用wordcloud。wordcloud庫是Python 詞云展示第三方庫,以詞語為基本單位,更加直觀和藝術(shù)地展示文本。它可以將文本中詞語出現(xiàn)的頻率作為一個(gè)參數(shù)繪制詞云,而詞云的大小、顏色、形狀等都是可以設(shè)定的。

        wordcloud 有3 個(gè)常見函數(shù):wordcloud.WordCloud()、wordcloud.ImageColorGenerator()和wo r d c l o u d . r a n d om_ c o l o r _ f u n c ( )。wo r d c l o u d .WordClud() 代表一個(gè)文本對(duì)應(yīng)詞云的對(duì)象,要區(qū)分大小寫,全小寫是庫,大寫+ 小寫是對(duì)象,可以根據(jù)文本中詞語出現(xiàn)的頻率等參數(shù)繪制詞云。詞云的形狀、字體、尺寸和顏色都可以設(shè)定,一個(gè)詞云就是一個(gè)wordcloud 對(duì)象。wordcloud.ImageColorGenerator() 可基于彩色圖像生成相應(yīng)彩色,而wordcloud.random_color_func() 則生成隨機(jī)顏色

        JupyterHub應(yīng)用環(huán)境

        Jupyter 是一款基于Python 的web notebook 服務(wù),目前大多Python 數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)愛好者都在使用這款服務(wù)。其特性其實(shí)與IPython Notebook 差不多。準(zhǔn)確說IPython Notebook 是一款提供增強(qiáng)型交互功能的shell,而Jupyter 除了IPython 的功能,還加入了普通編輯器的通用功能,是一款帶代碼交互的動(dòng)態(tài)文檔web 編輯器。

        由于Jupyter 只支持單用戶的使用場景,作為教師,我們需要看到學(xué)生的應(yīng)用實(shí)踐結(jié)果,需要多用戶場景,因此,只支持單用戶的Jupyter 可能不適用,于是有了JupyterHub。支持多用戶的Jupyter Notebook 服務(wù)器,用于創(chuàng)建、管理、代理多個(gè)Jupyter Notebook 實(shí)例,具有擴(kuò)展性和可定制性。

        課程設(shè)計(jì)流程

        第一步:課堂導(dǎo)引

        提前1 周讓學(xué)生閱讀《三國演義》,然后在課堂上讓學(xué)生各抒己見,分析自己對(duì)《三國演義》的看法。也許有的學(xué)生喜歡曹操,有的學(xué)生喜歡諸葛亮,還有的學(xué)生喜歡對(duì)某個(gè)事件進(jìn)行分析,對(duì)此,我們都需要鼓勵(lì)。

        第二步:講解與實(shí)踐

        在實(shí)踐之前,我們需要向?qū)W生介紹Python 中jieba 庫及其分詞原理,以及wordcloud 應(yīng)用方法,包括如何控制底色,如何把文字載入,如何生成指定圖片類型等。在制作時(shí),首先要引用jieba 庫,把《三國演義》小說導(dǎo)入變量,然后將導(dǎo)入的變量應(yīng)用jieba 進(jìn)行分詞(圖1)。

        接著,應(yīng)用wordcloud 將已經(jīng)匯總的詞進(jìn)行分析排序,把排序結(jié)果應(yīng)用圖片進(jìn)行展示(圖2)。

        學(xué)生制作完成后,我們可以收集學(xué)生的作品,以此檢驗(yàn)學(xué)生是否完成《三國演義》分詞及分析,是否掌握了相關(guān)的Python 知識(shí)。

        第三步:擴(kuò)展思考

        很多學(xué)生在分析的時(shí)候,主要是針對(duì)人物進(jìn)行的。我們可以把我們認(rèn)為重要的人物進(jìn)行一次統(tǒng)計(jì)。

        首先,用jieba 把詞進(jìn)行分割(圖3)。

        分割完成之后,把指定人物用循環(huán)進(jìn)行統(tǒng)計(jì),然后改變數(shù)據(jù)類型,變?yōu)榱斜恚▓D4)。

        將列表進(jìn)行排序,最后用print統(tǒng)一輸出,便可得出人物的相關(guān)數(shù)據(jù)(圖5)

        我們還可以讓學(xué)生擴(kuò)展思考:如何完成《三國演義》出場圖?如何完成《三國演義》關(guān)系圖?

        總結(jié)

        作為主要的人工智能語言,掌握Python 對(duì)于學(xué)生今后的發(fā)展非常重要。在教學(xué)實(shí)踐中利用Python 制作詞云圖,既可以呈現(xiàn)文本的關(guān)鍵信息和主要內(nèi)容,還可以將現(xiàn)代技術(shù)與人文素養(yǎng)相結(jié)合,提高學(xué)生的綜合素質(zhì)和能力。需要注意的是,利用Python 制作詞云圖,要求學(xué)生有一定的英語基礎(chǔ),并且熟悉鍵盤操作。

        猜你喜歡
        詞云分詞三國演義
        詞云和情感分析在新媒體環(huán)境下社會(huì)科學(xué)普及的應(yīng)用研究
        基于PyQt5界面的詞云制作軟件設(shè)計(jì)
        《三國演義》騙了你多少年
        結(jié)巴分詞在詞云中的應(yīng)用
        基于SCI文獻(xiàn)分析的呼吸病學(xué)發(fā)展態(tài)勢(shì)研究
        值得重視的分詞的特殊用法
        三國演義
        中國漫畫(2016年3期)2016-06-20 06:32:48
        三國演義
        三國演義
        圖學(xué)學(xué)報(bào)(2014年2期)2014-03-06 05:42:52
        欧美亚洲日韩国产人成在线播放| 91熟女av一区二区在线| 亚洲乱码中文字幕在线| 亚洲一区二区三区四区五区六| 少妇厨房愉情理伦片免费| 狼友AV在线| 亚洲老女人区一区二视频| 少妇高潮久久蜜柚av| 粗大的内捧猛烈进出少妇| 国外精品视频在线观看免费| 无码国产精品第100页| 五月天久久国产你懂的| a级福利毛片| 成人偷拍自拍在线视频| 日韩免费精品在线观看| 国产免费爽爽视频在线观看| 无码少妇精品一区二区免费动态| 亚洲中文字幕无码永久在线 | 国产精品一区二区久久精品| 久久综合网天天 | 欧美性福利| 日本一区二区三区看片| 亚洲啪啪色婷婷一区二区| 成年免费a级毛片免费看| 欧美大肥婆大肥bbbbb| 久久免费网国产AⅤ| 国产视频不卡在线| 一区二区中文字幕在线观看污污| av中文字幕潮喷人妻系列| 亚洲AV无码一区二区三区日日强| 日本一区二区三区的免费视频观看| 少妇激情一区二区三区99| 亚洲欧美激情在线一区| 久久免费国产精品| 亚洲高清在线视频网站| 国产乱人伦av在线麻豆a| 大肉大捧一进一出视频| 精品囯产成人国产在线观看| 人妻1024手机看片你懂的| 人禽杂交18禁网站免费| 亚洲国色天香卡2卡3卡4|