亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        用Python快速分析Excel表

        2020-12-02 07:52:23陳新龍
        電腦報(bào) 2020年42期
        關(guān)鍵詞:利用

        陳新龍

        我們可以在一些面向白領(lǐng)的編程培訓(xùn)廣告中看到,僅用幾節(jié)課學(xué)會(huì)Python之后,五分鐘就可以把領(lǐng)導(dǎo)分派的幾百?gòu)圗xcel表格處理完畢,這就是利用了Python的數(shù)據(jù)分析功能……

        一、 數(shù)據(jù)分析簡(jiǎn)介

        數(shù)據(jù)分析是指用適當(dāng)?shù)慕y(tǒng)計(jì)分析方法對(duì)收集來(lái)的大量數(shù)據(jù)進(jìn)行分析,將它們加以匯總和理解并消化,以求最大化地開(kāi)發(fā)數(shù)據(jù)的功能,發(fā)揮數(shù)據(jù)的作用。數(shù)據(jù)分析是為了提取有用信息和形成結(jié)論而對(duì)數(shù)據(jù)加以詳細(xì)研究和概括總結(jié)的過(guò)程。

        而Python能成為受歡迎的編程語(yǔ)言最主要的原因是它的簡(jiǎn)單易學(xué)。與其他語(yǔ)言相比,Python的語(yǔ)法很簡(jiǎn)單,幾天就可以掌握它的基礎(chǔ)知識(shí)。即使在學(xué)習(xí)其他語(yǔ)言(例如C++、Java)之后,開(kāi)發(fā)者通常還是更喜歡使用Python。因?yàn)镻ython庫(kù)幾乎可以滿足所有開(kāi)發(fā)需求。所以,庫(kù)和簡(jiǎn)單的語(yǔ)法讓使用Python進(jìn)行開(kāi)發(fā)既簡(jiǎn)單又高效,也讓其成為適合初學(xué)者的語(yǔ)言。

        我們也要跟隨著知識(shí)潮流的腳步,電腦報(bào)也會(huì)逐步和大家分享一些數(shù)據(jù)分析的技巧,在基本掌握Python后將其應(yīng)用到實(shí)際工作中解放自己的生產(chǎn)力。

        在學(xué)好Python的基礎(chǔ)知識(shí)后,初學(xué)數(shù)據(jù)分析可以使用兩款開(kāi)發(fā)工具Pycharm或Jupyter Notebook。大致上從數(shù)據(jù)類(lèi)型開(kāi)始學(xué)習(xí),深入到數(shù)據(jù)處理分析,再到圖形輸出。每一部分都有很多知識(shí)點(diǎn),希望能在未來(lái)的日子里和大家一起學(xué)習(xí)進(jìn)步。

        今天就通過(guò)實(shí)例體會(huì)一下數(shù)據(jù)分析的簡(jiǎn)單過(guò)程吧。下面我們根據(jù)班級(jí)學(xué)生基本情況表來(lái)分析班級(jí)中的男女生比例,并畫(huà)出餅圖來(lái)。雖然例子只處理了一張簡(jiǎn)單的表格,但是當(dāng)我們使用Python作為數(shù)據(jù)分析工具時(shí),就可以快速處理大量的表格和數(shù)據(jù)(圖1)。

        二、 開(kāi)發(fā)工具簡(jiǎn)介

        Pycharm和Jupyter Notebook是我們用來(lái)編寫(xiě)數(shù)據(jù)分析程序的常用開(kāi)發(fā)工具,兩者各有優(yōu)勢(shì)。

        Pycharm是一款功能強(qiáng)大的Python開(kāi)發(fā)環(huán)境,有大量的庫(kù)為數(shù)據(jù)分析和處理提供了完整的工具集,但在使用過(guò)程中,需要手動(dòng)安裝需要的庫(kù)。在用于數(shù)據(jù)分析時(shí)Pycharm更全能,采用了更具創(chuàng)新性的實(shí)現(xiàn)算法,還能和其他語(yǔ)言對(duì)接,例如與C語(yǔ)言對(duì)接彌補(bǔ)Python運(yùn)行效率不高的問(wèn)題。

        Jupyter Notebook是基于網(wǎng)頁(yè)的用于交互計(jì)算的應(yīng)用程序,它是一個(gè)性能強(qiáng)大的終端可以在網(wǎng)頁(yè)中直接編寫(xiě)和運(yùn)行代碼(可以寫(xiě)一行代碼,執(zhí)行一行,運(yùn)行結(jié)果直接在代碼塊下顯示)。這個(gè)集文本、代碼、圖像、公式展現(xiàn)于一體的超級(jí)Python Web界面,可以幫助我們學(xué)習(xí)和調(diào)試代碼。而且已經(jīng)集成了大量的庫(kù),用起來(lái)非常方便。

        三、 數(shù)據(jù)分析處理

        1. 環(huán)境安裝

        本例我們?cè)贘upyter Notebook上實(shí)操。

        Jupyter Notebook的安裝網(wǎng)上已有不少教程,不再贅述,附上安裝教程鏈接:

        https://blog.csdn.net/yu1014745867/article/

        details/84191485

        2. 導(dǎo)入庫(kù)

        在數(shù)據(jù)分析中,我們需要不同庫(kù)的幫助。選擇數(shù)據(jù)路徑,對(duì)數(shù)據(jù)預(yù)處理、清洗、分析,最后繪制圖表……本次Python實(shí)例中需要用到以下函數(shù)庫(kù)。

        Numpy庫(kù):用來(lái)實(shí)現(xiàn)科學(xué)計(jì)算,包括計(jì)算數(shù)組、一些隨機(jī)的函數(shù)……對(duì)文件中的數(shù)據(jù)進(jìn)行處理。

        Pandas庫(kù):提供大量能使我們快速便捷地處理數(shù)據(jù)的函數(shù)與方法,比如導(dǎo)入文件、提取文件……

        OS庫(kù):提供了豐富的方法用來(lái)處理文件和目錄,包括一些修改文件的目錄……

        由于我們已經(jīng)安裝好了Jupyter Notebook,這些需要函數(shù)庫(kù)直接導(dǎo)入就可以使用了(如圖2)。在Jupyter Notebook分段輸入部分代碼就可以直接運(yùn)行查看效果,特別適合我們學(xué)習(xí)。

        3. 導(dǎo)入數(shù)據(jù)表

        導(dǎo)入成功后便可以利用os函數(shù)定位到文件所指定的位置“F:\\數(shù)據(jù)分析表”,數(shù)據(jù)表格放在這個(gè)目錄下(如圖3)。

        隨后我們用pandas將所需的數(shù)據(jù)從表格文件中調(diào)取出來(lái),我們采用的數(shù)據(jù)是一張班級(jí)成員信息表(表格中個(gè)人隱私有打碼)(如圖4)。

        由于數(shù)據(jù)量較大,我們只需要使用“data1[:5]”提取前面五行的內(nèi)容便于觀察數(shù)據(jù)格式和內(nèi)容。

        4. 數(shù)據(jù)清洗

        觀察數(shù)據(jù)后發(fā)現(xiàn)并沒(méi)有性別這一項(xiàng)內(nèi)容,但是數(shù)據(jù)中存在著身份證號(hào)一項(xiàng),可以利用數(shù)據(jù)清洗整理提取身份證倒數(shù)第二位數(shù)字的奇偶性來(lái)判斷性別。首先增加一個(gè)列表用來(lái)存放性別,其次定義male和female兩個(gè)變量分別代表男和女, 利用循環(huán)提取出所有的身份證號(hào),然后再去尋找出倒數(shù)第二位的數(shù)字(注意Python是左開(kāi)右閉的這個(gè)知識(shí)點(diǎn))然后利用判斷語(yǔ)句判斷倒數(shù)第二個(gè)數(shù)和2的余數(shù)是否等于0,如果余數(shù)等于0代表女,否則代表男(如圖5)。

        將男女的性別添加到列表中。之后再使用“data1[:5]”,我們可以看到已經(jīng)多出了性別這一列(如圖6)。

        數(shù)據(jù)清洗簡(jiǎn)單說(shuō)就是把數(shù)據(jù)中的污染“洗掉”,指發(fā)現(xiàn)并糾正數(shù)據(jù)文件中可識(shí)別的錯(cuò)誤,包括檢查數(shù)據(jù)一致性、處理無(wú)效值和缺失值等。這是數(shù)據(jù)分析的難點(diǎn),需要針對(duì)具體情況提出相應(yīng)的解決方案。

        5. 繪制圖表

        根據(jù)已經(jīng)處理過(guò)的數(shù)據(jù)就可以統(tǒng)計(jì)male和female的人數(shù),根據(jù)這兩個(gè)數(shù)值就可以算出對(duì)應(yīng)的比例。然后用餅圖的方式繪制出來(lái)(圖7)。

        Python繪制圖形需要用到Python Matplotlib.pyplot庫(kù)。Matplotlib庫(kù)是一個(gè)面向?qū)ο蟮睦L圖庫(kù)。繪圖界面由pyplot模塊提供。該模塊提供了許多繪圖函數(shù),男女比例可以用餅圖來(lái)直觀顯示,餅圖利用plt.pie的方法,設(shè)置繪制所需要的參數(shù),包括數(shù)據(jù)值、區(qū)間的內(nèi)容、顯示字符的距離、區(qū)間顯示的顏色、百分比……都需要一一設(shè)置好。由于圖形的參數(shù)設(shè)置繁雜,這里就不一一詳述了,你可以根據(jù)參數(shù)表自行查看使用(圖8)。

        掌握數(shù)據(jù)分析是一項(xiàng)非常實(shí)用的技能,要想學(xué)好還需要提前打好一定的數(shù)學(xué)和編程基礎(chǔ),本實(shí)例只是拋磚引玉告訴你Python可以幫你快速處理數(shù)據(jù),今后我們也會(huì)繼續(xù)介紹一些均值、方差的計(jì)算實(shí)例,希望能夠?qū)δ兴鶐椭?/p>

        猜你喜歡
        利用
        利用min{a,b}的積分表示解決一類(lèi)絕對(duì)值不等式
        利用倒推破難點(diǎn)
        如何利用基本不等式比較大小
        利用一半進(jìn)行移多補(bǔ)少
        利用口訣算除法
        利用數(shù)的分解來(lái)思考
        Roommate is necessary when far away from home
        利用
        回收木再利用——Piet Hein Eek
        低丘緩坡未利用地的開(kāi)發(fā)利用探討
        河北遙感(2015年4期)2015-07-18 11:05:06
        在线视频99| 综合偷自拍亚洲乱中文字幕 | 天天躁日日躁狠狠躁欧美老妇| 国产成人激情视频在线观看| 男生自撸视频在线观看| 激情综合网缴情五月天| 午夜理论片日本中文在线| 领导边摸边吃奶边做爽在线观看| 欧美成人一区二区三区| 国产精品久久中文字幕第一页| 开心五月激动心情五月| 亚洲av综合av一区二区三区| 无码精品人妻一区二区三区人妻斩| 高清无码精品一区二区三区| 国产av午夜精品一区二区入口 | 红杏亚洲影院一区二区三区| 亚洲大尺度动作在线观看一区 | 超短裙老师在线观看一区| 国内久久婷婷六月综合欲色啪| 亚洲女初尝黑人巨高清| 99精品一区二区三区免费视频| 亚洲综合精品一区二区三区| 伊人久久这里只有精品| 日本牲交大片免费观看| 亚洲最新版无码AV| 久久夜色精品国产亚洲av老牛 | 日本一区二区在线免费视频 | 老熟妇乱子交视频一区| 国产精品久久久| 日韩av中出在线免费播放网站| 韩国三级黄色一区二区| 婷婷射精av这里只有精品| 伊人久久成人成综合网222| 午夜日本精品一区二区| 日本一区二区三区高清在线视频| 人妻精品动漫h无码网站| 亚洲一区区| 网站在线观看视频一区二区 | 亚洲亚色中文字幕剧情| 欧美艳星nikki激情办公室| 在线亚洲AV成人无码一区小说|