亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        Python語言在WOS論文清洗中的應(yīng)用初探

        2021-02-12 09:05:34曾詠梅黃映國
        時代人物 2021年33期
        關(guān)鍵詞:字符串代碼排序

        曾詠梅 彭 麗 楊 華 黃映國 宋 穎

        (四川農(nóng)業(yè)大學(xué)圖書館 四川成都 611130)

        對圖書館的學(xué)科分析人員而言,論文清洗工作是一個費時、費力的大工程。論文少了還能逐條整理,如果論文數(shù)量較多,逐條整理方法容易造成視覺疲勞,極易出錯,而糾錯也需較大工作量。經(jīng)費充裕的圖書館可以通過購買數(shù)據(jù)來滿足數(shù)據(jù)清洗的要求,但是學(xué)科分析是靈活多變的,可能隨時更改分析角度和緯度,而購買的數(shù)據(jù)無法實時達到所需要求。Python語言具有“優(yōu)雅、明確、簡單”等特點,適合作為編程小白的學(xué)科分析人員們學(xué)習(xí)和掌握,利用Python強大的語言功能,論文的清洗工作只需要打幾行代碼便可以輕松完成,可以使學(xué)科分析人員從繁瑣的數(shù)據(jù)清洗工作中解脫出來,讓其有更多的精力與時間從事其他更多具有創(chuàng)造性的工作。

        Python編程語言簡介

        Python語言是1989年由荷蘭人Guido van Rossum發(fā)明,1991年發(fā)行第一個公開版本。該語言是目前最接近自然語言的通用編程語言[1]。這種語言像C語言那樣,能夠全面調(diào)用計算機的功能接口,又可以像shell那樣,輕松的編程[2]。

        Python語言具有以下特點:可拓展性。程序員可以在高層直接編寫.py拓展模塊,也可以在底層直接引用C語言的庫。對象與過程均支持。Python語言在面向?qū)ο髸r進行模塊化處理,也可以在自己編寫的函數(shù)中引入固定化的模塊。語法簡潔清晰,代碼可讀性強。即使沒有編程基礎(chǔ)也可以逐漸掌握。具有功能齊全的標(biāo)準(zhǔn)庫和豐富的第三方模塊[3]。隨著Python的第三方庫與Excel表格進行結(jié)合以后,很多Excel工作可以利用Python來處理。應(yīng)用范圍廣。被越來越多獨立、大型的項目用于軟件開發(fā)[4]。基于以上特點,Python語言適合沒有編程基礎(chǔ)的學(xué)科分析館員學(xué)習(xí)、掌握及運用。

        Python語言在WOS論文清洗中的實際應(yīng)用

        學(xué)科分析中常用的WOS論文分析指標(biāo)有:發(fā)表年份、被引頻次、作者排位、是否通訊、二級機構(gòu)、合作單位等等。對于可以直接獲取利用的指標(biāo)數(shù)據(jù),不作表述;而對于涉及到論文作者的相關(guān)信息,數(shù)據(jù)庫提供的數(shù)據(jù)通常無法直接利用,必須根據(jù)本校的實際情況,對相關(guān)信息進行分類和提取。針對WOS論文清洗所涉及信息提取問題,對于編程語言來說,就是字符串的匹配、提取、索引、排序等問題。其自帶的字符串操作方法可以輕松的完成很多復(fù)雜的工作。以2篇四川農(nóng)業(yè)大學(xué)發(fā)表的WOS論文為例來說明Python語言的應(yīng)用過程。

        Python語言對字符串的操作方法

        Python語言中有很多字符串的操作方法,比如字符串索引,分片,大小寫互換等方法都比較實用。針對WOS論文數(shù)據(jù)清洗中作者排序問題,Python語言可以利用按照固定字符串進行數(shù)據(jù)分割的方法split(),本實例是按照“;”進行分割;再根據(jù)分割量,統(tǒng)計個數(shù)獲得作者排序;最后根據(jù)最終設(shè)想的結(jié)果形式,制定格式化輸出模式,以format()方法進行直觀體現(xiàn)。以表1中的第一篇論文的AF列作者信息為例。代碼如下:

        1.5.1 有效性指標(biāo)及觀測時點 ①SBM頻次及應(yīng)答率;②中醫(yī)證候療效;③單項主要癥狀有效率。排便次數(shù)每天記錄,其他均基線、用藥滿(7±1)d記錄并評估。以SBM應(yīng)答率為主要觀察指標(biāo)。

        表1 2篇四川農(nóng)業(yè)大學(xué)發(fā)表的WOS論文作者相關(guān)信息表

        Python語言對作者機構(gòu)篩選的應(yīng)用

        一篇WOS論文作者通常較多,那到底有多少個本機構(gòu)的作者,他們的排序又將怎樣?這是每個學(xué)科分析人員在論文清洗過程中都會遇到的問題。這個問題在Python中可以很好的解決。以表1中第一篇論文的C1列作者地址信息為例。實現(xiàn)目標(biāo)為:獲取C1列作者地址信息中有“Sichuan Agr Univ”的作者排序信息。代碼如下:

        這個結(jié)果與第二篇論文的AF列作者排序不一致。原因是第一作者“Zhang,Qing”有兩個地址,第二個地址才是“Sichuan Agr Univ”,而程序仍然是按照作者順序來排序的,第一個地址5個作者排完后,再按照順序排第二個地址,所以為第6作者。對于無法實現(xiàn)目標(biāo)的代碼,需要進行修改和調(diào)整。針對這個問題,原代碼修改為:

        經(jīng)驗證該結(jié)果與作者實際排序一致,達到預(yù)期效果。

        只要代碼能夠?qū)崿F(xiàn)一個單元格的預(yù)期目標(biāo),后續(xù)對于整個Excel表格處理來說就是實施模塊化程序,而且不會出錯。如果發(fā)現(xiàn)有具體的細(xì)節(jié)處理不完全,可以通過調(diào)整代碼來完善整個程序。最后實現(xiàn)批量處理。

        對于C1列信息,我們還需要提取作者二級機構(gòu)的信息,這個因為涉及到不同高校的二級機構(gòu)庫不同,同RP列通訊作者列信息一樣,在此不做進一步展示。但均可以用Python語言中的字符串查找find()及字符串替換replace()等方法,直接將相應(yīng)信息進行提取和保存。

        無論是何種類型的高校圖書館,在學(xué)科分析時,都需要對論文相關(guān)信息進行提取歸類,對于涉及到論文作者的相關(guān)信息,數(shù)據(jù)庫提供的數(shù)據(jù)通常無法直接利用,必須根據(jù)本校的實際情況,對相關(guān)信息進行分類和提取,而這類工作很多高校圖書館都是通過人工篩選來完成,工作量既大又易出錯。Python語言是最接近自然語言的編程語言,是結(jié)合解釋性、編譯性、互動性和面向?qū)ο蟮哪_本語言,其語法簡潔清晰,代碼可讀性強,適合圖書館編程小白的學(xué)科分析人員掌握與運用。本文展示了Python語言在WOS論文清洗中的一個小板塊,依據(jù)Python豐富的語言功能以及強大的第三方模塊庫,完全可以實現(xiàn)WOS數(shù)據(jù)清理中的各個部分,最終實現(xiàn)數(shù)據(jù)清洗目標(biāo),本課題組也將在后續(xù)研究與實踐中進一步探索與呈現(xiàn)。本文只是初步探索,以期為圖書館同仁們提供一個新的數(shù)據(jù)處理方法或思想,供學(xué)科分析人員參考。

        猜你喜歡
        字符串代碼排序
        排序不等式
        恐怖排序
        節(jié)日排序
        創(chuàng)世代碼
        動漫星空(2018年11期)2018-10-26 02:24:02
        創(chuàng)世代碼
        動漫星空(2018年2期)2018-10-26 02:11:00
        創(chuàng)世代碼
        動漫星空(2018年9期)2018-10-26 01:16:48
        創(chuàng)世代碼
        動漫星空(2018年5期)2018-10-26 01:15:02
        刻舟求劍
        兒童繪本(2018年5期)2018-04-12 16:45:32
        一種新的基于對稱性的字符串相似性處理算法
        依據(jù)字符串匹配的中文分詞模型研究
        日本在线视频www色| 久久熟女乱一区二区三区四区| 亚洲伊人av综合福利| 亚洲中文字幕乱码一二三区| 日本高清一区二区在线观看| 少妇被按摩出高潮了一区二区| 人妻少妇久久久久久97人妻| 一本大道东京热无码| 亚洲网站免费看| 久久精品国产亚洲av豆腐| 无码日韩精品一区二区免费暖暖 | 亚洲欧美日韩国产精品一区二区| 国产精品多人P群无码| 国产高清丝袜美腿视频在线观看| 熟女人妻在线中文字幕| 国产熟女内射oooo| 国际无码精品| 男人的av天堂狠狠操| 色婷婷精品久久二区二区蜜臀av | 国产 无码 日韩| 女同一区二区三区在线观看| 99久久精品午夜一区二区| 亚洲精品免费专区| 99久久免费精品色老| 天堂一区二区三区在线观看视频| 成av免费大片黄在线观看| 最新国产女主播福利在线观看| av日本一区不卡亚洲午夜| 国产自拍偷拍视频免费在线观看| 夜夜添夜夜添夜夜摸夜夜摸| 亚洲欧美日韩综合久久久| 久久久99精品视频| 日本人妻系列中文字幕| 内射欧美老妇wbb| 少妇AV射精精品蜜桃专区| 少妇隔壁人妻中文字幕| 久久99精品久久久大学生| 国产女女做受ⅹxx高潮| 中文字幕乱偷乱码亚洲| 人妻少妇偷人精品一区二区三区 | 亚洲第一av导航av尤物|