亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于顛覆性指數(shù)優(yōu)化的細分領(lǐng)域優(yōu)秀科技人才發(fā)現(xiàn)研究*

        2022-05-12 13:05:18宋培彥馮超慧龍晨翔楊治安宋雨奇
        情報雜志 2022年5期
        關(guān)鍵詞:評價

        宋培彥 馮超慧 龍晨翔 楊治安 宋雨奇

        (1.天津師范大學管理學院 天津 300382;2 .科技部科技評估中心 北京 100081)

        0 引 言

        《國家中長期人才發(fā)展規(guī)劃綱要(2010-2020年)》指出,“人才是指具有一定的專業(yè)知識或?qū)iT技能,進行創(chuàng)造性勞動并對社會作出貢獻的人,是人力資源中能力和素質(zhì)較高的勞動者”。2021年9月28日,中央人才工作會議強調(diào)要完善人才評價體系,加快建立以創(chuàng)新價值、能力、貢獻為導向的人才評價體系,形成并實施有利于科技人才潛心研究和創(chuàng)新的評價體系,為新時代開展人才評價指明了方向。優(yōu)秀科技人才是具備更高素質(zhì)與能力、做出更大貢獻與成果、具有較強影響力與創(chuàng)新力的佼佼者,其在科學研究、項目評審、成果轉(zhuǎn)化、決策咨詢等方面發(fā)揮著舉足輕重的作用。因此,準確、快速發(fā)現(xiàn)優(yōu)秀科技人才成為科學技術(shù)發(fā)展的關(guān)鍵,事關(guān)科技創(chuàng)新全局,意義重大。

        在實踐中,科技人才創(chuàng)新能力評價方法主要分為三類,一是基于文獻計量學理論,采用h指數(shù)[1]、g指數(shù)[2]、p指數(shù)[3]、NIF指數(shù)[4]等評價模型,從論文引用角度對人才學術(shù)影響力進行總體性評價;二是基于同行評議和層次分析[5],由評估者設(shè)置評價指標體系、權(quán)重和基線(baseline),進行定性與定量相結(jié)合的標準化評價;三是采用社會網(wǎng)絡理論[6],對限定領(lǐng)域的科技人才學術(shù)關(guān)系及其影響力進行網(wǎng)絡關(guān)系分析,適于人才專題化評價。上述方法特點鮮明、各有所長,同時,由于大多依賴論文和嚴格的評價指標體系,評價程序剛性有余而彈性不足,導致評價結(jié)果的客觀性、準確性和適用性難免時有爭議。基于此,本文圍繞“反五唯”背景下“科學設(shè)立人才評價指標,突出品德、能力、業(yè)績導向”這一關(guān)鍵問題,以“顛覆性創(chuàng)新”為突破口,形成數(shù)據(jù)驅(qū)動和可量化計算的優(yōu)秀科技人才創(chuàng)新能力發(fā)現(xiàn)方法。

        1 相關(guān)研究

        2 研究方法設(shè)計

        準確判斷科技人才的研究領(lǐng)域,有利于識別細分領(lǐng)域科技人才的研究專長,為進行精細化發(fā)現(xiàn)奠定基礎(chǔ)。通過對科技人才發(fā)表的論文關(guān)鍵詞聚類,可以發(fā)現(xiàn)其研究領(lǐng)域和專長。因此,首先基于科技人才的論文數(shù)據(jù)采用LDA主題模型進行文本主題發(fā)現(xiàn),識別科技人才研究領(lǐng)域及專長。然后,采用顛覆性創(chuàng)新理論,改進并優(yōu)化顛覆性指數(shù),計算人才的創(chuàng)新能力,最后,將反映科技人才創(chuàng)新能力的顛覆性指數(shù)與傳統(tǒng)指標進行對比,檢驗顛覆性指數(shù)在科技人才創(chuàng)新能力發(fā)現(xiàn)方法中的適用性。如圖1所示。

        圖1 總體研究思路

        2.1LDA模型識別“小同行”潛在狄利克雷分布(Latent Dirichlet Allocation,LDA)模型是由Blei于2003年提出的,該模型以潛在語義分析為基礎(chǔ),是一種基于概率分布的聚類算法,能深入語義層面對文檔進行挖掘分析,可用于文本挖掘、文檔相似度計算、文本聚類等場景[14]。LDA是三層貝葉斯模型,包括文檔、主題和詞項3層結(jié)構(gòu),其核心思想是:假設(shè)文檔中詞與詞之間是沒有順序和先后關(guān)系的,每一個文檔都是以一定概率選中某個主題,而每一個主題又是以一定概率選擇特定的詞項。本文將使用LDA主題模型對科技人才的成果數(shù)據(jù)進行挖掘聚類,具體過程如下[15]:

        a.對科技人才的每一篇文檔,從主題分布中抽取一個主題; b.每個主題會分別對應若干單詞分布,從中抽取一個單詞;c.對以上過程進行迭代,直到文檔中每個單詞都被遍歷。

        通過以上步驟,能夠從標題、摘要等信息中以更細的顆粒度挖掘出科技人才的研究方向,為實現(xiàn)“小同行”精準發(fā)現(xiàn)奠定基礎(chǔ)。

        2.2顛覆性指數(shù)改進與優(yōu)化顛覆性指數(shù)核心思想是:當一篇引用給定文章的論文也引用了該文章的大部分參考文獻時,那么這篇被引文章可以被視為鞏固了原有的研究,相反,如果隨后論文只引用了給定文章而對被引文章的參考文獻未進行引用,即未采納或認可其他人的研究,那么這篇被引文章就可以視為對其研究領(lǐng)域進行了顛覆式創(chuàng)新。其計算方法如公式1所示:

        (1)

        該方法是以文獻所形成的引文網(wǎng)絡為基礎(chǔ),研究焦點文獻(被引用或評價的論文)發(fā)表后的采納接受狀態(tài)。采納狀態(tài)分為三種情況:第一種是只引用焦點文獻,將其記為F類;第二種是既引用了焦點文獻又引用了焦點文獻的參考文獻,將其記為B類;第三種是只引用了焦點文獻的參考文獻而未引用焦點文獻,將此類記為R類。統(tǒng)計以上三種狀態(tài)的數(shù)量,并對F類和B 類相減然后進行占比計算。計算結(jié)果的取值范圍為[-1,1],若數(shù)值趨近于1,說明創(chuàng)新性比較強;相反,若數(shù)值趨近于-1則代表創(chuàng)新性較弱。

        對于傳統(tǒng)顛覆性指數(shù)的單調(diào)性不一致,數(shù)值為負、對人才創(chuàng)新能力區(qū)分度不高等問題,相關(guān)學者已進行研究并提出改進方案,但該指數(shù)在人才評價方面仍需改進。因為,公式1主要計算只引用焦點文獻的文獻數(shù)量與同時引用焦點文獻和前溯文獻的文獻數(shù)量的差(NF-NB)占所有引用量的比例,這就導致只要該比例相同,高被引文獻和低被引文獻的D值就會趨同,從而與事實可能產(chǎn)生偏離;其次,未充分考慮引用焦點文獻的數(shù)據(jù)集的引用動機、引用質(zhì)量等因素,從而可能產(chǎn)生聚集效應,如單純根據(jù)文獻的引用量進行衡量,焦點文獻引用量越多,將會有更多人去進行引用,從而弱化了文章被引用的真實情況。

        由此,針對人才創(chuàng)新能力發(fā)現(xiàn)的特點,本文進行改進,重點考慮了引用焦點文獻的文獻數(shù)量和質(zhì)量這兩個要素,并提出如下改進公式:

        (2)

        公式2的含義是:首先,基于質(zhì)量考慮,本文在現(xiàn)有基礎(chǔ)上乘以文獻被引用的權(quán)值,其中文獻i表示引用焦點文獻的數(shù)據(jù)集,citei表示該數(shù)據(jù)集的后續(xù)被引用量,通過該方式來減小文獻質(zhì)量所帶來的一些誤差;在引用焦點文獻的文獻數(shù)量方面,本文將每次引用的質(zhì)量指標之和作為衡量標準,同時為進一步減小或消除文獻引用中的聚集效應,式中對兩層引用均做了對數(shù)化處理(ln)。另外,考慮到citei可能出現(xiàn)值為非正數(shù)的情況,為便于計算,該式在citei的基礎(chǔ)上加了基礎(chǔ)質(zhì)量權(quán)值2,避免了零或負值的出現(xiàn),由此計算出的評價結(jié)果更合乎事實,計算結(jié)果也更便于理解和使用。

        3 實驗分析與檢驗

        3.1數(shù)據(jù)采集與處理本文以干細胞領(lǐng)域的“杰青““優(yōu)青”人才為例開展實證研究。干細胞是當前生物醫(yī)學領(lǐng)域新興熱點,也是我國科技研究的前沿領(lǐng)域和優(yōu)勢領(lǐng)域,因此,本文以干細胞領(lǐng)域為例,收集2010年到2019年近十年內(nèi)的杰青、優(yōu)青稱號的科技人才名單,并在Web of Science數(shù)據(jù)庫中檢索其發(fā)表的英文論文數(shù)據(jù),進行作者與論文數(shù)據(jù)的關(guān)聯(lián)。為了解決科技人才姓名縮寫及表示形式不一、重名等問題,在數(shù)據(jù)關(guān)聯(lián)前進行了姓名消歧處理,通過Wos數(shù)據(jù)庫Web of Science ID 或ORCID ID來識別科技人才,輔助通過人才的工作單位、合作者以及網(wǎng)站信息進行進一步的篩選,最終確定人才的論文數(shù)據(jù)集。最終形成的數(shù)據(jù)集包括引用焦點文獻的數(shù)據(jù)集和引用焦點文獻中參考文獻的數(shù)據(jù)集。由于論文發(fā)表后一般需經(jīng)歷一段周期才會有一定引用量,因此為了避免誤差,本次實驗采集科技人才數(shù)據(jù)排除了近三年發(fā)表的文獻(2019年-2021年)。本文以5位科技人才為例,共采集焦點論文有效數(shù)據(jù)193篇,其發(fā)表年限主要集中在2006年到2018年間,引用焦點文獻的數(shù)據(jù)集8 465篇,引用焦點文獻中參考文獻的數(shù)據(jù)集3 012 930篇,以提高實驗效率。

        3.2基于LDA的研究專長識別本文采用LDA主題模型進行文檔挖掘與聚類,并通過設(shè)定困惑度來選取主題數(shù)目,以保證模型預測結(jié)果的精確性和主題間相似性的最小化。經(jīng)LDA模型運行后,共獲得5個主題數(shù)目,每個主題下都有以一定概率表示的詞,考慮到有的詞過于泛化,如“cell”等詞匯,同時為確保能夠準確地表達主題內(nèi)容,本文將人工與機器相結(jié)合,并邀請醫(yī)學專業(yè)的人員輔助進行主題的確定。接著,根據(jù)主題關(guān)聯(lián)度(1/主題數(shù),本文關(guān)聯(lián)度為0.2),利用模型輸出的結(jié)果對每篇文檔進行歸類,若出現(xiàn)某文檔屬于兩個或多個主題類時,則將其歸入概率最高的那一類中。歸類成功后,統(tǒng)計各個主題的文檔數(shù)量,選取數(shù)量最多的作為科技人才的研究專長領(lǐng)域。如鄭**研究專長是造血干細胞,與之相關(guān)聯(lián)的詞以一定概率分布,其中l(wèi)eukemia、hscs、stem、hematopoietic、igfbp2等詞語權(quán)重較大,能一定程度表達主題內(nèi)涵,反映科技人才的研究專長。如表1所示。

        表1 部分人員研究專長

        3.3D值結(jié)果與分析

        3.3.1 D值檢驗 獲得公式1中的NF、NR、NB的數(shù)據(jù),基于3.2節(jié)提出的計算公式2,利用顛覆性指數(shù)進行計算,計算結(jié)果部分如表2所示,為保證顛覆性指數(shù)可以更準確、更全面的評價科技人才總體的創(chuàng)新能力,本文選取了顛覆性指數(shù)的總和、均值、最大值及最小值來進行衡量。其中,根據(jù)Sum_D計算結(jié)果可以發(fā)現(xiàn)杰青人才楊**、鄭**、項*的各項數(shù)值總體大于優(yōu)青程*、劉*,說明前三個人才相對于后兩個科技人才創(chuàng)新能力較強,可以初步判斷顛覆性指數(shù)能對優(yōu)秀科技人才創(chuàng)新能力進行發(fā)現(xiàn),如表2所示。

        表2 科技人才顛覆性指數(shù)

        為了進一步檢驗顛覆性指數(shù)是否能準確衡量科技人才的創(chuàng)新能力,本文從論文引用量、合作網(wǎng)絡、h指數(shù)三個傳統(tǒng)維度進行驗證。

        a.引用維度:總被引量是指某一科技人才發(fā)表的所有文章的被引用量,該指標能夠一定程度上反映科技人才的影響力,篇均被引量則反映科技人才的平均水平。

        b.合作網(wǎng)絡維度:點度中心度是社會網(wǎng)絡分析中的衡量指標,其指與某個點相連的其它點的個數(shù),點度中心度越大,該點在網(wǎng)絡中的位置越重要,代表科技人才的影響力也越大。間度中心度反映點與點之間的最短距離是否都經(jīng)過某一個點,表明某一點在網(wǎng)絡中的控制能力及重要性,若權(quán)值大,則代表該點在網(wǎng)絡中處于核心地位,影響力較大。

        c.h指數(shù):h指數(shù)是指至多有h篇文獻被引用了至少h次,指數(shù)值越高,一定程度上科技人才的學術(shù)水平也就越高。

        計算各個指標,并進行對比驗證。其中論文引用量與h指數(shù)兩個維度指標通過Web of Science數(shù)據(jù)庫獲取,合作網(wǎng)絡維度中點度中心度和間度中心度通過Gephi軟件進行計算得出。驗證結(jié)果如表3所示,以項*和劉*為例,項*的Sum_D值和Avg_D值分別為2.9618、0.0337,其值均高于劉*,初步判定項*要比劉*在該領(lǐng)域的創(chuàng)新影響力更大。以傳統(tǒng)指標進行進一步驗證,發(fā)現(xiàn)項*的點度中心度為135,高于劉*的79,說明在學術(shù)共同體構(gòu)成的網(wǎng)絡中,與項*所連接的人員更多,項*在中心位置所發(fā)揮的影響力更大;同時,項*的h值、文章總被引量、篇均被引量等也較高。這可能也與科技人才本身所發(fā)表的研究成果數(shù)量有關(guān)聯(lián),其中,項*在Wos數(shù)據(jù)庫中的有效論文數(shù)據(jù)達88篇,而劉*僅22篇。另一方面,杰青獲得者往往比優(yōu)青獲得者對創(chuàng)新能力的要求更高。經(jīng)上述總被引量、篇均被引量、h指數(shù)、中介中心度等指標的驗證,總體可以較好反映顛覆性指數(shù)的基本態(tài)勢,作為參考基準是基本合適的,但因為時效性和精準性有所欠缺,因此可以考慮增加引用速度、社會反響等外部特征驗證趨勢的一致性,以彌補論文引用時間滯后性和分析精度偏差,增強顛覆性指數(shù)的解釋力。

        表3 D指數(shù)與傳統(tǒng)指標對比

        3.3.2 細分領(lǐng)域優(yōu)秀科技人才創(chuàng)新力識別 從細分領(lǐng)域出發(fā),有助于按照“小同行”更加精準識別科技人才。通過LDA主題模型聚類,并將所屬文檔進行歸類,從而確定科技人才的研究領(lǐng)域,進一步識別該領(lǐng)域內(nèi)的科技人才的比較優(yōu)勢。根據(jù)3.2小節(jié)中所確定的科技人才研究領(lǐng)域,發(fā)現(xiàn)程*和鄭**屬于同一個細分領(lǐng)域(造血干細胞研究),楊**和劉*屬于神經(jīng)細胞領(lǐng)域?qū)<摇?/p>

        在此基礎(chǔ)上,以“造血干細胞”及“神經(jīng)細胞”兩個細分領(lǐng)域為例,計算相關(guān)人員的顛覆性指數(shù)。鄭**的顛覆性指數(shù)高于程*,說明在造血干細胞領(lǐng)域,鄭**的研究成果更具創(chuàng)新性,其研究成果被后面追隨者認可接受的程度比較高。在神經(jīng)細胞領(lǐng)域,優(yōu)青人才劉*的顛覆性指數(shù)高于杰青楊**,可以看出雖然楊**的總體D值大于劉*,但在細分領(lǐng)域神經(jīng)細胞研究中,后者更具創(chuàng)新影響力。由此可見,進行細分領(lǐng)域科技人才識別有助于打破常規(guī),挖掘到“小同行”領(lǐng)域的創(chuàng)新人才,為創(chuàng)新科技人才的發(fā)現(xiàn)提供了新的研究視角。如圖2所示。

        圖2 細分領(lǐng)域人才發(fā)現(xiàn)指數(shù)

        4 結(jié)論與展望

        在科技人才評價改革背景下,從細分領(lǐng)域出發(fā),以優(yōu)化后的顛覆性指數(shù)為依據(jù),通過實驗初步驗證了顛覆性指數(shù)能較好應用于人才發(fā)現(xiàn)與識別中,對細分領(lǐng)域優(yōu)秀科技人才精準發(fā)現(xiàn)、評價與推薦等具有一定的參考價值。研究還發(fā)現(xiàn),應用顛覆性指數(shù)進行人才識別方法具有以下特點:a.顛覆性指數(shù)通過焦點文獻替代參考文獻的程度來識別創(chuàng)新性,綜合考慮了焦點文獻與參考文獻,用該方法所識別出的創(chuàng)新性人才更具權(quán)威性與全面性。b.通過LDA主題模型聚類,識別細分領(lǐng)域的科技人才,有助于發(fā)現(xiàn)細分領(lǐng)域的“單項冠軍”,更好滿足抽取“小同行”專家進行同行評議等需求。同時,顛覆性指數(shù)在實際應用過程中也存在著零被引論文、引用時間窗過長等問題,可能會對計算精度造成影響,今后可以通過引入科研項目、專利等多源信息,并通過與現(xiàn)有人才評價方法適度融合進行改進。

        猜你喜歡
        評價
        SBR改性瀝青的穩(wěn)定性評價
        石油瀝青(2021年4期)2021-10-14 08:50:44
        中藥治療室性早搏系統(tǒng)評價再評價
        自制C肽質(zhì)控品及其性能評價
        寫作交流與評價:詞的欣賞
        中學語文(2015年21期)2015-03-01 03:52:11
        基于Moodle的學習評價
        關(guān)于項目后評價中“專項”后評價的探討
        HBV-DNA提取液I的配制和應用評價
        有效評價讓每朵花兒都綻放
        模糊數(shù)學評價法在水質(zhì)評價中的應用
        治淮(2013年1期)2013-03-11 20:05:18
        保加利亞轉(zhuǎn)軌20年評價
        五月天综合社区| 成人亚洲精品777777| 精品亚洲在线一区二区| 国精产品一区一区三区有限在线| 极品av麻豆国产在线观看| 成人午夜毛片| 日本成人免费一区二区三区| 人妖一区二区三区在线| 麻豆精品国产精华液好用吗| 99久久久无码国产精品9| 中文字幕色视频在线播放| 精品久久综合日本久久综合网| 欧美狠狠入鲁的视频777色| 国产免费一区二区三区在线观看| 欧美日韩性视频| 久久久国产精品五月天伊人| 国产免费人成视频在线观看| 免费无码不卡视频在线观看| 性欧美大战久久久久久久久| 亚洲色欲色欲大片WWW无码| 久久精品免费视频亚洲| 蜜臀av无码人妻精品| 欧美一片二片午夜福利在线快 | 中文字幕精品一区二区三区| 精品无码久久久久久国产| 人妻在线中文字幕| 亚洲一区亚洲二区中文字幕| 国产精品熟女视频一区二区三区| 国产精品久久久久免费观看| 熟女俱乐部五十路二区av| av黄片免费在线观看| 国产亚洲av看码精品永久| 国产麻豆md传媒视频| 在线观看日本一区二区| 女优视频一区二区三区在线观看| 亚洲视频高清一区二区| 无码av免费精品一区二区三区| 日本一区二区三区中文字幕最新| 亚洲精品在线一区二区| 成人免费xxxxx在线观看| 精品视频999|