張玲 惲誠濤 尹思力等
關(guān)鍵詞: 科研誠信政策; 主題熱點; LDA; TF-IDF; 主題演化
DOI:10.3969 / j.issn.1008-0821.2023.06.011
〔中圖分類號〕G322 〔文獻標識碼〕A 〔文章編號〕1008-0821 (2023) 06-0108-13
我國的科研誠信事件時有發(fā)生, 表現(xiàn)較為突出的是2015 年BioMed Central、Springer、SAGE 3 個出版集團對中國學者論文的大規(guī)模撤稿, 這在國際上產(chǎn)生了惡劣的影響, 嚴重損害了我國在科研領(lǐng)域的形象和地位。同年, 科學技術(shù)部發(fā)布了《科學技術(shù)活動違規(guī)行為處理暫行規(guī)定》。隨著科技發(fā)展, 又出現(xiàn)了“黃金大米” “換頭術(shù)” “基因編輯嬰兒” 等多起違背科技倫理的事件。2022 年, 中共中央辦公廳、國務院辦公廳印發(fā)了《關(guān)于加強科技倫理治理的意見》, 目前已有20 余個國家部門參與制定科研誠信的相關(guān)政策。
由于科研誠信的責任主體主要是從事科研活動的各類高校院所、企事業(yè)單位和社會組織等, 因此科研誠信問題也激起了學術(shù)界的廣泛關(guān)注。1993—2000 年, 關(guān)注點主要集中在學術(shù)道德建設上, 但是針對性的治理制度和措施并未出臺; 2001—2012年, 研究的關(guān)鍵詞主要有“科研腐敗” “學術(shù)規(guī)范”“科學研究” “學術(shù)造假” 等, 學者們以案例的形式從反面對問題進行剖析并從正面號召規(guī)范的發(fā)布與實施; 2013—2020 年, 國家發(fā)布一系列加強科研誠信建設的文件, 科研誠信的研究論文也大幅度增加, 特別是在2018 年中共中央辦公廳、國務院辦公廳印發(fā)了《關(guān)于進一步加強科研誠信建設的若干意見》之后, 有關(guān)科研誠信政策的特征、變遷、演化等綜合性學術(shù)研究激增。
由此可見, 失信事件的發(fā)生推動了政策的發(fā)布,而相關(guān)政策的出臺又進一步引發(fā)了以科研誠信為主題的文獻發(fā)表, 科研誠信政策與科研誠信研究之間體現(xiàn)出相輔相成、互相促進的耦合關(guān)系, 因此, 探究二者的關(guān)聯(lián)關(guān)系, 有助于厘清科研誠信政策與文獻研究的趨勢特點, 彌合政策發(fā)布與科研誠信問題解決之間的斷層, 推進學術(shù)生態(tài)的良性發(fā)展。鑒于此, 本文旨在通過LDA 主題建模與TF-IDF 相似度計算相結(jié)合的方法, 從縱向上分階段剖析政策的導向以及論文的研究熱點和趨勢, 從橫向上發(fā)掘科研誠信政策與學術(shù)研究之間的演化關(guān)系; 理論上提供量化分析政策與文獻互動關(guān)系的研究方法, 補充和完善不同類型文本間演化的理論框架; 實踐上, 對比我國科研誠信的政策與研究現(xiàn)狀之間的相關(guān)性和發(fā)展趨勢, 為今后的科研誠信的研究方向以及政策的發(fā)布和實施提供建議。
1文獻回顧
1.1科研誠信的相關(guān)研究
有關(guān)科研誠信的研究始于20 世紀80 年代, 主要分為學術(shù)層面和科研層面, 涵蓋了學術(shù)道德、學術(shù)不端、學術(shù)誠信、學術(shù)腐敗、科學道德、科研倫理、科技倫理、科研誠信、科研不端等相關(guān)研究領(lǐng)域。早在1982 年, 文獻中就開始關(guān)注了“學術(shù)道德” 和“科學道德” 方面的問題[1] , 這兩個領(lǐng)域的研究成熟度和關(guān)注度均較高; 2000 年開始則圍繞“科研誠信” 和“科研不端” 主題展開了相應研究[2] ; 2002 年《倫理學研究》的創(chuàng)刊將科學的研究與應用進行了區(qū)分, 指出“科技倫理” 主要存在于科學應用層面, 這部分研究的關(guān)注度高但是成熟度欠缺, 將會成為近幾年研究的熱點和趨勢。
對于科研誠信相關(guān)政策的研究主要集中在2017—2022 年, 王聰?shù)龋郏常?系統(tǒng)梳理了政策文本中出現(xiàn)的科研誠信相關(guān)概念、特點與問題, 并提出了政策建議。靳彤等[4] 于2018 年運用政策文本計量法和內(nèi)容分析法, 從時序發(fā)展、機構(gòu)關(guān)系、文本依據(jù)、具體內(nèi)容方面進行了量化分析, 指出我國科研誠信建設的問題以及未來的發(fā)展方向。2020 年關(guān)于科研政策的研究比較集中, 在橫向上有關(guān)于中外科技倫理法規(guī)政策的比較研究[5] 、國內(nèi)科研政策熱點的分析[6] , 在縱向上有近20 年的科研政策量化分析[7] 、科研誠信政策的變遷[8] 及演化[9] 等研究。由以上科研誠信的相關(guān)研究可知, 在政策方面的研究逐漸由橫切面轉(zhuǎn)向縱向演化分析, 科研誠信領(lǐng)域的研究主題也隨著政策的出臺而不斷發(fā)生變化, 但是政策與文獻主題之間互動演化的研究較為欠缺。
1.2主題演化的相關(guān)研究
目前已有學者在其他領(lǐng)域開展了政策與文獻的主題演化研究, 方俊智等[10] 運用共詞分析和社會網(wǎng)絡分析法構(gòu)建了政策與文獻互動的普適性計量研究框架, 分析了我國PPP 模式政策與文獻的互動演化規(guī)律。劉璐等[11] 使用Word2Vec 和余弦相似度構(gòu)建了政策與文獻文本的語義匹配度模型, 分析了京津冀協(xié)同發(fā)展政策與文獻的匹配度和熱點主題。劉紀達等[12] 基于589 份政策文獻的量化分析構(gòu)建了國防科技工業(yè)政策的共詞網(wǎng)絡, 研究了國防科技工業(yè)政策的變遷路徑和演進機制。王芳等[13] 使用Word2Vec 和人工擴展詞典構(gòu)建了政策態(tài)度自動識別模型和社會組織政策演化動因模型, 探討了我國社會政策主題與政策態(tài)度的演化研究。總體而言,主題演化在政策與文獻演化分析中的運用為本文研究奠定了基礎(chǔ), 但在科研誠信領(lǐng)域的研究中要么從政策角度分析政策演化與變遷, 要么從文獻角度探討學術(shù)熱點, 為了彌補上述不足, 本文采用主題演化分析法構(gòu)建了科研誠信政策與文獻主題互動演化的研究框架。
根據(jù)國內(nèi)外現(xiàn)有研究成果, 關(guān)于主題演化分析的方法主要可分為3 類: 基于主題模型的主題演化分析、基于社會網(wǎng)絡的主題演化分析和基于詞頻統(tǒng)計的主題演化分析[14] , 其中最常用的方法是以主題模型為基礎(chǔ)的潛在狄利克雷分布(Latent DirichletAllocation, LDA)模型[15] 和基于社會網(wǎng)絡的共詞分析法[16] ?;谏鐣W(wǎng)絡的共詞分析法在建立共詞關(guān)聯(lián)矩陣的基礎(chǔ)上, 采用節(jié)點簇的方式形成主題識別[17] , 然而共詞分析法在篩選共詞時存在選擇的主觀性、高頻詞孤立以及共詞“同量不同質(zhì)” 等問題[10] 。LDA 模型作為一種“語言的統(tǒng)計模型”和非監(jiān)督機器學習的文本挖掘方法則有效避免了上述問題, 采用貝葉斯概率模型來揭示文本中的潛在結(jié)構(gòu)[18] , 能夠識別人類無法識別的重要主題, 允許一詞多義即主題可以重疊或聚焦且不必對數(shù)據(jù)強加解釋[19] , 因此在大量文檔中挖掘與識別相對集中的潛在主題時效果更佳。此外, 在主題演化研究中首要考慮的問題是時間維度, LDA 主題模型通過融入時間因素建立主題演化模型, 以此來分析主題時序的內(nèi)容變化、強度變化和主題間的相互作用與影響[20] 。綜上, 由于本研究并不是基于單一類型文本的演化研究, 而是針對政策、文獻兩種不同類型的文本之間的互動演化關(guān)系開展研究, 為了減少選擇主觀性、高頻詞孤立等問題, 本文基于LDA模型, 結(jié)合相似度計算等方法來構(gòu)建不同時序間的主題關(guān)聯(lián), 并以?;鶊D來直觀呈現(xiàn)科研誠信政策與文獻主題間的互動演化關(guān)系。
2研究設計
首先, 本文基于中國政府網(wǎng)、工信部官網(wǎng)、CNKI 科研誠信管理系統(tǒng)以及CNKI 數(shù)據(jù)庫分別對政策文件和研究文獻進行文本搜集, 最大范圍地選擇符合要求的文本內(nèi)容進行數(shù)據(jù)采集。然后進行分析的第一階段, 即利用LDA 主題建模完成文本的主題提取。LDA 主題模型主要用于揭示文本數(shù)據(jù)中基于現(xiàn)象的結(jié)構(gòu)和扎根的概念關(guān)系, 通過對輸入的文獻標題、摘要或者全文等時序文本進行語義層次的分析計算, 獲取隱含的主題及其分布特征, 把握主題發(fā)展態(tài)勢[21] 。最后進行分析的第二階段,即熱點演化與匹配度分析。TF-IDF 模型是常見的文本相似度計算模型, 通過計算文本中每個詞項的TF-IDF 值獲得每個文本的向量模型, 對于各文本向量利用余弦相似度來確定文本之間的相似性, 進而判斷不同文本的關(guān)聯(lián)度[22] 。因此, 本文基于LDA 模型的主題聚類和TF-IDF 模型的相似度計算, 對我國近年來科研誠信的政策文件和學術(shù)論文的主題熱點及演進進行分析, 并進一步探究二者的互動演化過程。本研究整體框架如圖1 所示。
第一階段是對搜集到的文本進行階段劃分和主題提取。首先將收集到的科研誠信政策按照政策發(fā)布時間的先后和發(fā)布頻率的高低綜合性地進行劃分,分為3 個特征鮮明的發(fā)展時期, 分別是發(fā)布時間較早、發(fā)布頻率較低的萌芽期(1981—2011), 發(fā)布時間較近、發(fā)布頻率適中的發(fā)展期(2012—2019), 發(fā)布時間最新、發(fā)布頻率較高的快速發(fā)展期(2020—2022), 同時將文獻也按照同樣的時期進行劃分。完成階段劃分后, 利用Python 中Gensim 庫LdaModel函數(shù)進行主題建模, 提取熱點主題, 即首先將政策與文獻數(shù)據(jù)分時期進行分詞, 然后使用LDA 主題模型對科研誠信政策的全文內(nèi)容以及科研誠信論文的摘要內(nèi)容進行主題挖掘, 再利用Log_Perplexity 方法計算不同主題對應的困惑度數(shù)值, 最終確定困惑度最小值, 即最優(yōu)主題數(shù)[14] , 實現(xiàn)主題的提取, 同時得到各個主題對應的主題詞, 最后依據(jù)主題詞, 人工對不同的主題進行描述, 實現(xiàn)主題熱點的提取。
第二階段是對科研誠信的政策文件和學術(shù)論文進行相似度計算和主題分析。首先利用Python 中TF-IDF 模型對不同維度主題相似度進行計算, 即先計算政策文件和學術(shù)論文文本中各詞項的TFIDF值獲得文本向量, 然后對于各文本向量計算余弦相似度判斷文本間的相似性。完成相似度計算后, 進而進行主題分析, 即首先基于相似度計算結(jié)果人工歸納政策文件和學術(shù)論文的各自演化路徑,并通過相似度的高低判斷同一時期政策文件和學術(shù)論文不同主題之間的匹配程度, 然后利用?;鶊D進行可視化表達, 從而對政策與文獻主題的匹配程度和相關(guān)性進行直觀觀察, 最后對于科研誠信的政策文件與學術(shù)論文各時期主題的互動演化進行分析。
3科研誠信政策與學術(shù)文獻主題分析
3.1科研誠信政策主題分析
本文采用俞立平等[23] 的政策搜集辦法, 主要通過CNKI 科研誠信管理系統(tǒng)、中國政府網(wǎng)和工信部平臺等官方網(wǎng)站查找相關(guān)政策, 并通過科學技術(shù)部科研誠信建設辦公室組織編寫的《科研誠信建設相關(guān)法律法規(guī)和文件匯編》來進行查漏補缺,力求做到1981—2022 年科研誠信政策的全覆蓋。為了提高文章研究的可信度, 本文剔除了弱相關(guān)性政策, 最終篩選出如表1 所示具有研究價值的科研誠信政策文件83 篇。
根據(jù)政策發(fā)布的時間, 采用EXCEL 進行統(tǒng)計,得到圖2, 并根據(jù)圖中政策發(fā)布數(shù)量的多少對科研誠信政策的發(fā)展進行階段性劃分。1981—2011 年政策發(fā)布數(shù)量較為稀疏, 大部分年份政策發(fā)布數(shù)量為1 篇或2 篇, 國家對此認識程度不夠, 此30 年間關(guān)于科研誠信的政策發(fā)布非常少。2012—2019年政策發(fā)布數(shù)量呈上升趨勢, 相較于前一個階段,政策發(fā)布數(shù)量逐漸增多, 國家開始意識到科研誠信治理的緊迫性。2020—2022 年政策發(fā)布數(shù)量呈現(xiàn)急速上升的趨勢, 在2020 年達到頂峰。近幾年科研不端事件頻發(fā), 引起相關(guān)部門的高度重視, 截至2022 年4 月13 日就已發(fā)布3 篇政策。因此, 對政策的發(fā)展階段可劃分為萌芽期(1981—2011), 發(fā)展期(2012—2019)和快速發(fā)展期(2020—2022)。
3.1.1萌芽期主題
萌芽期共有政策22篇, 根據(jù)困惑度確定最佳主題數(shù)為4, 如表2 所示。通過對相似主題整合后, 關(guān)注到主題熱點: 不端行為處理機制、科技評估辦法、科技責任、科技不端。此時期的政策主要是通過對科學研究進行評估, 明確科技責任, 進而處理科研中存在的不端行為。
3.1.2發(fā)展期主題
發(fā)展期共有相關(guān)政策34 篇, 根據(jù)困惑度確定主題數(shù)為10, 如表3 所示。通過對相似主題整合后, 關(guān)注到主題熱點: 科技政策改革、部門監(jiān)管、大學教育、信用監(jiān)管、論文審查、科研項目管理、科研機構(gòu)改革、學科指導與培訓、部門調(diào)查和高??蒲谢顒印T诖穗A段, 政策從多個方面入手, 通過教育、監(jiān)管、調(diào)查和改革等多方面, 對科研失信行為進行防治與管控。
3.1.3快速發(fā)展期主題
快速發(fā)展期共有相關(guān)政策27 篇, 根據(jù)困惑度確定主題數(shù)為6, 如表4 所示。通過對相似主題整合后, 關(guān)注到主題熱點: 科研人員規(guī)范、違規(guī)查處、高校教育改革、企業(yè)科技能力、科技成果考核和科技成果價值。除了科研人員的規(guī)范、高校改革和違規(guī)處理等方面, 政策制定關(guān)注到了“企業(yè)”這個科研主體, 通過對科技能力和科技成果進行考核, 規(guī)范科研主體的行為。
3.1.4政策主題演化分析
對不同階段科研誠信政策主題進行相似度計算可以揭示其相似性, 相似度大于閾值則判定具有演化關(guān)系[24] 。為避免數(shù)據(jù)過于稀疏, 設定相似度閾值為0.3, 如兩階段主題相似度大于0.3, 則確定為主題間具有演化關(guān)系, 且屬于同一主題演化路徑。本文采用?;鶊D實現(xiàn)科研誠信政策主題演進的可視化呈現(xiàn), 如圖3所示。
通過對相似度進行計算, 將相似度大于0.3 的路徑進行歸納總結(jié), 得出5 條主要演化路徑。
1) 論文審查違規(guī)處理政策的演化路徑
“萌芽期主題1、2、3、4—發(fā)展期主題5—快速發(fā)展期主題2” 這條路徑體現(xiàn)了對科研審查的持續(xù)關(guān)注。萌芽期時的4 個政策主題在發(fā)展期匯聚成了論文審查這個主題, 實現(xiàn)了關(guān)注點的聚焦, 并且在快速發(fā)展期持續(xù)關(guān)注違規(guī)查處問題。在快速發(fā)展期, 有關(guān)違規(guī)查處的政策有8 篇之多, 針對從事學術(shù)論文買賣、代寫代投, 以及偽造、虛構(gòu)、篡改研究數(shù)據(jù)問題, 對科學技術(shù)活動違規(guī)行為和學術(shù)論著署名問題中的負面行為等進行多方治理, 從各角度提供違規(guī)處理辦法, 為違規(guī)行為的查處提供政策依據(jù)。
2) 科研人員行為規(guī)范政策的演化路徑
“發(fā)展期主題1、8、10—快速發(fā)展期主題1”這條路徑顯示了對科研人員行為規(guī)范關(guān)注的延續(xù)性。在發(fā)展期, 政策的關(guān)注點體現(xiàn)在科技政策改革、學科指導與培訓以及高??蒲谢顒?, 在快速發(fā)展期, 聚合為科研人員規(guī)范這個主題??焖侔l(fā)展,中共中央辦公廳和國務院辦公廳印發(fā)《關(guān)于加強科技倫理治理的意見》, 強調(diào)壓實創(chuàng)新主體科技倫理管理主體責任, 發(fā)揮科技類社會團體的作用, 引導科技人員自覺遵守科技倫理要求, 在科研人員的行為規(guī)范上提出了更加明確的要求。
3) 高校科研誠信教育政策的演化路徑
“發(fā)展期主題3、7、8—快速發(fā)展期主題3”這條路徑展示出了對高校的科研誠信行為的重視。在發(fā)展期, 政策的主題體現(xiàn)為大學教育、科研機構(gòu)改革和學科培訓與指導。在此期間, 教育部等部門印發(fā)了《關(guān)于加強和改進新時代師德師風建設的意見》《關(guān)于加強新時代教育科學研究工作的意見》《關(guān)于全面落實研究生導師立德樹人職責的意見》等指導意見, 從學校這個主要的科研主體出發(fā), 提出了關(guān)于高校應達到的教育責任, 從源頭上切斷科研失信行為的產(chǎn)生, 提高學生的誠信意識??焖侔l(fā)展期, 政策主題實現(xiàn)了延續(xù), 關(guān)注熱點為高校教育改革。多部門聯(lián)合印發(fā)《關(guān)于加快新時代研究生教育改革發(fā)展的意見》《關(guān)于深化新時代教育督導體制機制改革的意見》《普通高等學校本科教育教學審核評估實施方案》等政策, 通過教育改革的方式, 強化對大學生科研行為的監(jiān)督管理。
4) 企業(yè)科研誠信管理政策的演化路徑
“發(fā)展期主題1、4、9—快速發(fā)展期主題4” 體現(xiàn)了對企業(yè)這個科研主體的重點關(guān)注。發(fā)展期的3個主題為科技政策改革、信用監(jiān)管和部門調(diào)查。到了快速發(fā)展期演化為企業(yè)科技能力這個主題, 實現(xiàn)了對于企業(yè)這個科技主體的關(guān)注。在《關(guān)于進一步壓實國家科技計劃(專項、基金等)任務承擔單位科研作風學風和科研誠信主體責任的通知》中提到“從事科研活動的各類科研院所、高校、企業(yè)、社會組織等是科研作風學風和科研誠信建設第一責任主體”。這說明在政策角度上, 將企業(yè)作為一個重要的科研主體, 所以對企業(yè)的科研誠信行為進行監(jiān)管是特別必要的, 要確??蒲凶黠L學風和科研誠信建設各項要求落實到位。
5) 科研誠信管理部門監(jiān)管政策的演化路徑
“發(fā)展期主題9—快速發(fā)展期主題2” 顯現(xiàn)了對違規(guī)行為調(diào)查部門的重點關(guān)注。在發(fā)展期和快速發(fā)展期出現(xiàn)了許多的科研失信的大事件。2011 年2月10 日, 科技部通報因嚴重學術(shù)不端撤銷李連生2005 年獲得的國家科學技術(shù)進步獎二等獎, 這是我國第一例因科研不端而撤銷國家科技獎勵的案例。2013 年, 自然科學基金委對科研不端典型案例查處結(jié)果進行了首次公布, 次年頒布了《國家自然科學基金項目科研不端行為處理辦法(試行)》。2018 年兩辦聯(lián)合印發(fā)《關(guān)于進一步加強科研誠信建設的若干意見》, 完成了我國科研誠信治理體系的頂層設計。發(fā)展期的主題體現(xiàn)為部門調(diào)查, 快速發(fā)展期的主題體現(xiàn)為違規(guī)查處, 這體現(xiàn)了我國對科研違規(guī)行為處理的堅定決心。
通過對科研誠信相關(guān)政策進行分析可以發(fā)現(xiàn),在萌芽期的視角還比較局限, 主要聚焦在對科技不端行為的處理以及學風建設的方面, 目的是應對日益嚴峻的學術(shù)不端問題。但是相關(guān)管理人員并未意識到對不同主體進行責任界定的重要性及通過科研活動監(jiān)督加強科研誠信管理的必要性。發(fā)展期, 視角廣泛發(fā)散, 相關(guān)政策更加精細化, 從政策改革、部門監(jiān)管、論文審查和高校教育等多個方面入手,多角度全方位地對科研失信行為進行管控并進行制止, 并且注重科研項目管理和信用管理。到了快速發(fā)展期, 針對科技研究的主體和成果, 法律規(guī)制開始落地, 各項政策開始落實??蒲姓\信相關(guān)政策傾向于從源頭及全方面加強科研誠信管理。針對科研人員的科研行為, 政策的關(guān)注重點從最開始的“事后處理” 逐漸走向了“事前預防”, 通過加強思想上的教育, 使得有科研失信傾向的科研人員從“不敢做” 到“不會做”, 提高思想上的自覺性, 實現(xiàn)自我規(guī)范。
3.2科研誠信學術(shù)文獻主題分析
本文以CNKI 數(shù)據(jù)庫為數(shù)據(jù)源, 選取哲學與人文科學、社會科學Ⅰ輯、社會科學Ⅱ輯以及經(jīng)濟與管理科學這4 部分與本研究相關(guān)的文獻分類目錄,檢索時間設定為1981—2022 年。采用“主題” 或者“篇關(guān)摘” 的檢索方式檢索關(guān)鍵詞, 基于陳雨等[25] 的做法和對文獻研究的前期梳理, 選取如下19 個關(guān)鍵詞: 科研誠信、學術(shù)誠信、科研不端、學術(shù)不端、科研失范、學術(shù)失范、科研失信、學術(shù)失信、科研腐敗、學術(shù)腐敗、科研造假、學術(shù)造假、學術(shù)抄襲、學術(shù)剽竊、科研道德、學術(shù)道德、科研倫理、科技倫理、學術(shù)倫理, 以期望盡可能全面、系統(tǒng)地了解到我國對科研誠信以及相關(guān)研究的現(xiàn)狀。
截至2022 年4 月13 日, 經(jīng)過剔除書評、會談紀要和綜述、征稿通知、講話筆談、新聞動態(tài)、通訊報道等文獻, 并對專家學者的相關(guān)文獻進行人工補充, 共獲得3 611篇有效文獻。
根據(jù)政策的發(fā)展階段同樣對文獻的發(fā)展階段進行劃分, 劃分為萌芽期(1981—2011), 發(fā)展期(2012—2019)和快速發(fā)展期(2020—2022)。
3.2.1萌芽期主題
萌芽期共有論文1 487篇, 根據(jù)困惑度確定最佳主題數(shù)為4, 如表5 所示。通過對相似主題整合后得到主題熱點: 科研不端法律、高校學術(shù)腐敗與規(guī)范、研究生誠信教育、科技發(fā)展問題。
3.2.2發(fā)展期主題
發(fā)展期共有文獻1 604篇, 根據(jù)困惑度確定主題數(shù)為5, 如表6 所示。通過對相似主題整合后得到主題熱點: 論文不端、學術(shù)腐敗問題、高校大學生誠信建設、研究生教育、科研誠信體系建設。
3.2.4學術(shù)文獻主題演化分析
采用與3.1. 4相同的相似度計算方法計算科研誠信文獻相鄰時期的主題相似度, 利用?;鶊D實現(xiàn)科研誠信文獻主題演進的可視化呈現(xiàn), 如圖4 所示。
通過相鄰時期的不同主題進行相似度計算, 將相似度大于0 3 的路徑進行歸納總結(jié), 得出4 條主要演化路徑。
1) 科技倫理問題及治理研究的演化路徑
“萌芽期主題2、4—發(fā)展期主題2—快速發(fā)展期主題1” 體現(xiàn)了對科技發(fā)展過程中的問題的重視。萌芽期的研究主題體現(xiàn)為高校學術(shù)腐敗與學術(shù)道德和科技發(fā)展中的倫理問題, 發(fā)展期持續(xù)關(guān)注學術(shù)腐敗, 探討遏制學術(shù)腐敗的措施與治理辦法, 到了快速發(fā)展期則深化為科技發(fā)展評價。對于科技發(fā)展過程中的問題的關(guān)注, 由一開始對腐敗問題的研究, 上升為對科技發(fā)展的評價, 通過對科技倫理問題進行反思, 深入分析各種科研失信行為的背后成因與邏輯, 為今后構(gòu)建正確的科技倫理治理體系提供借鑒。
2) 高校誠信教育與建設研究的演化路徑
“萌芽期主題2、3—發(fā)展期主題3、4—快速發(fā)展期主題3、4、5” 這條路徑體現(xiàn)了對高校誠信的重點研究。萌芽期的研究主題體現(xiàn)為高校學術(shù)腐敗與規(guī)范和研究生誠信教育, 發(fā)展期聚焦為高校大學生誠信建設, 而到了快速發(fā)展期, 則演化為高校研究生教育, 通過對研究生的誠信意識和學術(shù)能力進行培養(yǎng)和教育, 減少不端行為的發(fā)生。高校誠信教育與建設一直是研究的重點, 高校是科研誠信建設的第一責任主體, 也是宣傳教育的重要主體, 對于高校的誠信教育與建設進行持續(xù)研究具有十分重要的現(xiàn)實意義??蒲姓\信治理不僅需要教育部門發(fā)力, 更應聯(lián)合多方職能部門通力治理。
3) 科研誠信體系建設研究的演化路徑
“萌芽期主題1—發(fā)展期主題5—快速發(fā)展期主題5” 體現(xiàn)了對科研誠信體系建設的持續(xù)研究。萌芽期的關(guān)注重點主題是科研不端的相關(guān)法律規(guī)制與道德要求, 發(fā)展期演變?yōu)榭蒲姓\信體系建設, 到了快速發(fā)展期, 將目光聚集在高校誠信體系建設, 對高??蒲姓\信與學風建設路徑進行深入探討, 研究失信行為的成因與防治機制。科研誠信問題是一個國家邁向科技強國所必須面對的問題, 良好的科研誠信體系可以營造良好的科研環(huán)境, 構(gòu)建科研誠信治理的新局面。
4) 論文不端行為研究的演化路徑
“發(fā)展期主題1—快速發(fā)展期主題2” 體現(xiàn)了對論文不端行為的持續(xù)思考與重點關(guān)注。發(fā)展期與快速發(fā)展期的主題均體現(xiàn)為論文不端, 這體現(xiàn)了論文不端問題的嚴重性。2016 年, “韓春雨撤稿事件” 使得科研誠信問題迎來了一個關(guān)注熱潮;2017 年, 《腫瘤生物學》期刊集中撤銷107 篇中國學者論文, 在學術(shù)界引起了不小的震動; 2019 年“翟天臨學術(shù)門” 引發(fā)了社會各界的廣泛討論。論文不端問題一直是學術(shù)界的研究熱點, 對于學術(shù)論文的政策規(guī)范也在不斷出臺。然而, 學術(shù)論文并不是科研成果的唯一體現(xiàn), 科研成果包括論文和專著、自主研發(fā)的新產(chǎn)品原型、自主開發(fā)的新技術(shù)、發(fā)明專利、實用新型專利和外觀設計專利等多種形式, 學術(shù)研究還可以對上述多種科研成果的科研誠信問題進行研究, 彌補研究上的空白, 而不僅僅局限在論文這一種形式上。
總體來看, 文獻的研究主題主要聚焦在高??蒲姓\信教育、科研誠信體系建設和科技倫理治理等方面上, 對于科研誠信的主題主要聚焦在高校, 對于科研成果則聚焦在論文上, 視角相對單一, 研究具有一定的局限性。隨著時代的發(fā)展, 在快速發(fā)展期出現(xiàn)了科技發(fā)展評價這一主題, 相比其他主題來說, 科技發(fā)展評價更加適應現(xiàn)實發(fā)展的需要, 應當加強對這方面的學術(shù)研究。
4政策與文獻的互動演化分析
對同一階段科研誠信政策主題與文獻主題進行相似度計算, 揭示其相關(guān)性, 采用與3.1. 4 相同的方法, 沿用0.3 的相似度閾值, 如同一階段的階段主題相似度大于0.3, 則確定為主題間具有匹配關(guān)系, 采用桑基圖實現(xiàn)科研誠信政策主題與文獻主題的可視化呈現(xiàn)。
4.1萌芽期主題
萌芽期政策的4 個政策主題只有一個政策主題有對應的文獻主題與之匹配, 即“政策主題3—文獻主題4”。此對應關(guān)系體現(xiàn)為科技責任與社會科技發(fā)展。文獻的研究主題對于政策的匹配度較低,具有很強的滯后性, 沒有能夠?qū)φ咚P(guān)注的科技不端行為、科技評估辦法等主題進行深入探討與研究, 而是更多將目光放在了高??蒲姓\信教育與建設的相關(guān)問題上。
4.2發(fā)展期主題
發(fā)展期的10 個政策主題中有4 個政策主題存在對應文獻主題與之匹配。即“政策主題3—文獻主題3” “政策主題5—文獻主題1” “政策主題6—文獻主題5” “政策主題9—文獻主題1”。政策的大學教育、論文審查、科研項目管理、部門調(diào)查4 個主題能夠被文獻的論文不端、高校大學生誠信建設和科研誠信體系建設較好地對應。文獻研究在此期間依然集中在高校科研誠信教育與建設和論文不端行為上, 對于科技監(jiān)管和改革等缺乏深入研究, 相對于政策仍然具有一定的滯后性。相比于萌芽期, 文獻主題在發(fā)展期出現(xiàn)了新的研究熱點, 即科研誠信體系建設, 這將是未來的重點研究主題,更加適應現(xiàn)實的發(fā)展要求。
4.3快速發(fā)展期主題
快速發(fā)展期的6 個政策主題中有5 個有文獻主題與之匹配, 即“政策主題1—文獻主題4” “政策主題2—文獻主題4” “政策主題3—文獻主題3”“政策主題5—文獻主題1” “政策主題6—文獻主題1”??焖侔l(fā)展期政策主題中的科研人員調(diào)查、違規(guī)調(diào)查、高校教育改革、科技成果考核和科研成果價值能夠被文獻主題中的研究生不端行為、高校研究生教育和科技發(fā)展評價實現(xiàn)較好對應。在快速發(fā)展期, 文獻研究能夠更加適應政策的發(fā)展, 滯后性相比前兩個時期在不斷減小。
文獻研究仍然具有一定的局限性, 快速發(fā)展期所分析的520 篇論文中, 僅有64 篇歸類于科技發(fā)展評價主題, 其余456 篇文獻均與高校或者論文等主題有關(guān), 研究的重點仍舊集中在高校與論文上,然而文獻研究主題中的論文不端和高校誠信體系建設并沒有相關(guān)政策對應, 主要原因在于科研人員主要來自高校, 相關(guān)數(shù)據(jù)與資料易于獲取, 同時高校也是科研失信的重災區(qū)。文獻中有關(guān)企業(yè)科技能力的相關(guān)研究處于缺失狀態(tài), 而此時期有關(guān)企業(yè)科技能力的政策有6 篇之多, 可見政策上已經(jīng)認識到了對企業(yè)科技行為進行管控的重要性, 而相關(guān)研究卻沒有跟上政策的發(fā)展, 關(guān)于企業(yè)這個科技主體及其科技能力的研究應是未來的研究重點。
5結(jié)論與展望
科研誠信是科技創(chuàng)新的基石, 是科研工作者的基本準則和生命線, 是關(guān)系到科學事業(yè)存在與發(fā)展的根基。近年來的一系列嚴重違背科研誠信的行為已經(jīng)引起了社會的廣泛關(guān)注, 甚至已經(jīng)引發(fā)嚴重的科研誠信危機。遏制科研不端行為并倡導科研誠信行為, 已經(jīng)成為我國教育界與科學界的共識。本文通過收集1981—2022年的科研誠信相關(guān)政策與研究論文, 利用LDA 主題建模的方式, 對政策與相關(guān)論文的熱點主題和主題演化進行分析, 通過相似度計算, 利用?;鶊D呈現(xiàn)不同時期論文研究與政策主題的匹配程度。
本研究發(fā)現(xiàn), 科研誠信政策的制定處于從“事后處理” 走向“事前預防” 的過程, 通過加強思想上的教育, 提高科研人員思想上的自覺性, 實現(xiàn)自我規(guī)范。在目前的科研誠信文獻研究中, 由于資料易于獲取和科研不端事件頻發(fā)等原因, 科研人員的主要研究對象為高校和論文, 有關(guān)企業(yè)的科研誠信研究處于貧乏狀態(tài)。科研人員在未來應當加強對企業(yè)方面的研究, 適應政策要求的同時, 也為政策的發(fā)布奠定理論基礎(chǔ), 提高社會各界的科研誠信意識,為科技發(fā)展營造良好的環(huán)境??蒲姓\信相關(guān)論文的發(fā)展對于科研誠信政策的發(fā)展具有明顯的滯后性,但隨著時代的發(fā)展與研究的進步, 滯后性在不斷減弱。
本研究通過LDA 主題建模的方法挖掘了科研誠信政策與文獻主題的研究熱點, 一方面為政策制定提供依據(jù), 另一方面為論文研究方向提供參考。本文的“主題建?!嗨贫扔嬎恪;鶊D呈現(xiàn)”研究方法還可以應用于其他領(lǐng)域, 為研究兩類文本之間的主題匹配程度提供了思路與方法。本研究尚存在許多不足: 一是由于早期科研誠信政策發(fā)布數(shù)量較少, 收集也不盡完善, 對相關(guān)政策文本的檢索存在疏漏, 在主題識別中會存在覆蓋范圍較窄、不能充分反映演化規(guī)律的問題。二是本研究所選取的文獻來源為知網(wǎng), 僅僅考慮到了中文期刊文獻, 未考慮到外文文獻, 存在文本來源單一的問題, 一定的局限性。在未來的研究中, 團隊會廣泛拓展文本來源, 在科研誠信領(lǐng)域進行更為細致的研究, 實現(xiàn)研究領(lǐng)域的充分覆蓋, 并實現(xiàn)未來新主題的預測。