亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        用Python對常用字進行多維度特征分析

        2020-04-01 15:08:07溫且姆·薩迪克布合力齊姑麗·瓦斯力熱依漢古麗·薩迪克木合塔爾·沙地克
        教育教學論壇 2020年10期

        溫且姆·薩迪克 布合力齊姑麗·瓦斯力 熱依漢古麗·薩迪克 木合塔爾·沙地克

        摘要:文章用Python實現(xiàn)對常用字的詞性、拼音、韻母與聲調之間的多維度特征分析,從開發(fā)環(huán)境搭建開始詳細介紹了每個步驟和代碼。

        關鍵詞:Python;Jieba;python-docx-master;python-pinyin-master

        中圖分類號:G642.0? ? ?文獻標志碼:A? ? ?文章編號:1674-9324(2020)10-0120-02

        一、環(huán)境的搭建

        用Python對漢字進行分析不僅要安裝Python開發(fā)環(huán)境,還需要安裝Python中文分詞組件jieba,Python Word文本處理組件python-docx-master,Python處理漢字轉拼音組件python-pinyin-master。本文用Anaconda Spyder作為開發(fā)環(huán)境,從相關網(wǎng)站下載以上各組件壓縮包,解壓到工作目錄,在命令行分別進入各組件解壓目錄,執(zhí)行python setup.py install即可完成環(huán)境的準備。

        二、主要代碼解釋

        (一)引入相關組件,并以gb18030編碼格式打開常用字txt文件

        (引入相關組件代碼略)

        #打開常用字txt文件

        text=open('sys_Char2500.txt',encoding='gb18030').read()

        #從text中篩選字符部分

        char_changyong=[char for char in text if char.isalpha()]

        (二)定義一個函數(shù),獲取漢字的詞性,把詞性英文簡稱轉換中文名稱

        def get_peg(arg):

        #獲取arg的詞性

        pegc=peg.cut(arg)

        flag2=''

        #把詞性英文簡稱轉換漢字名稱

        for peg1,flag1 in pegc:

        if 'n' == flag1[0]:

        flag2='名詞'

        elif 't' == flag1[0]:

        flag2='時間詞'

        else:

        flag2=flag1

        return flag2

        (三)獲取漢字的詞性、拼音和韻母特征,把他們存儲在一個詞典里,并進行排序統(tǒng)計

        for char in char_changyong:

        #獲取漢字帶聲調的拼音

        yin3=''.join(lazy_pinyin(char,style=Style.TONE3))

        #獲取漢字不帶聲調的拼音

        pyin=''.join(lazy_pinyin(char))

        #獲取漢字的韻母

        yunm=''.join(lazy_pinyin(char,style=Style.FINALS))

        #把以上獲取的特征存放在詞典和列表里

        char_flag_dict[char]=(tone,pegc,pyin,yunm)

        (四)對漢字的詞性與聲調進行統(tǒng)計分析,將統(tǒng)計結果存入Document對象的表格中

        #游歷所有詞性統(tǒng)計列表

        for pegc,count in pegc_all_count:

        #游歷存放漢字特征的詞典

        for char,val in char_flag_dict.items():

        if pegc == val[1]:

        tones = tones + str(val[0])

        chars = chars + str(char)

        pegc_tones[pegc]=tones

        #定義Document對象

        doc_new = Document()

        doc_new.add_heading('一、詞性統(tǒng)計:',0)

        #定義表格

        table = doc_new.add_table(rows=1,cols=8)

        hdr_cells = table.rows[0].cells

        #創(chuàng)建表格列名

        hdr_cells[0].text = '序號'

        #對漢字的詞性與聲調進行統(tǒng)計

        #將統(tǒng)計結果存入表格中

        for key,val in pegc_tones.items():

        len_tones=len(pegc_tones[key])

        count=Counter(pegc_tones[key])

        row_cells = table.add_row().cells

        row_cells[0].text = str(i)

        (五)對漢字的拼音與聲調進行統(tǒng)計分析,將統(tǒng)計結果存入Document對象的表格中

        #游歷所有拼音統(tǒng)計列表

        for pyin,count in pyin_all_count:

        #游歷存放漢字特征的詞典

        for char,val in char_flag_dict.items():

        if pyin == val[2]:

        tones = tones + str(val[0])

        chars = chars + str(char)

        pyin_tones[pyin]=tones

        #添加標題

        doc_new.add_heading('二、拼音統(tǒng)計:',0)

        #定義表格

        table = doc_new.add_table(rows=1,cols=8)

        hdr_cells = table.rows[0].cells

        hdr_cells[0].text = '序號'

        #對漢字的拼音與聲調進行統(tǒng)計

        #將統(tǒng)計結果存入表格中

        for key,val in pyin_tones.items():

        len_tones=len(pyin_tones[key])

        count=Counter(pyin_tones[key])

        row_cells = table.add_row().cells

        row_cells[0].text = str(i)

        row_cells[7].text = str(count6)

        (六)對漢字的韻母與聲調進行統(tǒng)計分析,將統(tǒng)計結果存入Document對象中

        #游歷所有韻母統(tǒng)計列表

        for yunm,count in yunm_all_count:

        #游歷存放漢字特征的詞典

        for char,val in char_flag_dict.items():

        if yunm == val[3]:

        tones = tones + str(val[0])

        chars = chars + str(char)

        yunm_tones[yunm]=tones

        #添加標題

        doc_new.add_heading('三、韻母統(tǒng)計:',0)

        #創(chuàng)建表格

        table = doc_new.add_table(rows=1,cols=8)

        hdr_cells = table.rows[0].cells

        hdr_cells[0].text = '序號'

        #對漢字的韻母與聲調進行統(tǒng)計

        #將統(tǒng)計結果存入表格中

        for key,val in yunm_tones.items():

        count=Counter(yunm_tones[key])

        len_tones=len(yunm_tones[key])

        row_cells = table.add_row().cells

        row_cells[0].text = str(i)

        row_cells[7].text = str(count6)

        (七)把統(tǒng)計結果存入Word文檔中,用于下一步分析

        doc_new.save('漢字統(tǒng)計分析.docx')

        Multi-dimensional Feature Analysis of Common Words with Python

        Wynchem Sadiq1,Buzhiguri Vasley2,Hayhanguri Sadiq3,Muhtar Shadick4

        (1.Kashgar Shule County Secondary Vocational and Technical School,Kashgar,Xinjiang 844200,China;

        2.College of Mathematics and Science,Xinjiang Institute of Education,Urumqi,Xinjiang 830043,China;

        3.Hanan Like Town Middle School,Kashgar Shule County,Kashgar,Xinjiang 844207,China;4.Education Management Information Center of Xinjiang Uygur Autonomous Region,Urumqi,Xinjiang 830049,China)

        Abstract:In this paper,Python is used to analyze the multi-dimensional features of common characters,such as part of speech,pinyin,vowel and tone.Start with the development environment building and introduce each step and code in detail.

        Key words:Python;Jieba;python-docx-master;python-pinyin-master

        欧美黑人又粗又大久久久 | 日韩中文字幕中文有码| 人妻少妇看A偷人无码电影| 国产在线视频一区二区三区不卡| 麻豆国产一区二区三区四区| 日本老熟妇乱| 五月天综合网站| 少妇一区二区三区乱码| 精品视频在线观看日韩| 亚洲av日韩精品久久久久久久| 久久精品岛国av一区二区无码| 日本啪啪一区二区三区| 日本一本一道久久香蕉男人的天堂| 亚洲综合免费在线视频| 久久av粉嫩一区二区| 狠狠色综合7777久夜色撩人ⅰ| 日韩激情小视频| 亚洲av精品一区二区三| 日本亚洲视频一区二区三区| 日韩精品久久久肉伦网站| 欧美在线观看一区二区| 少妇激情一区二区三区| 亚洲av福利天堂一区二区三| 欧洲极品少妇| 国产精品成人av电影不卡| 日本不卡视频一区二区三区| 亚洲av成人片在线观看| 狠狠久久亚洲欧美专区| 手机免费日韩中文字幕| 国产夫妻自拍视频在线播放| 日本在线看片免费人成视频1000| 国产精品久久久久久久久免费观看| 最全精品自拍视频在线| 中文字幕亚洲综合久久| 乱子伦视频在线看| 亚洲AV无码日韩一区二区乱| 少妇人妻字幕精品毛片专区| 成人无码α片在线观看不卡| 人妻久久999精品1024| 最好的99精品色视频大全在线| 免费无码不卡视频在线观看|