楊克虎(蘭州大學循證社會科學研究中心)
2020 年10 月,黨的十九屆五中全會審議通過的《中共中央關于制定國民經濟和社會發(fā)展第十四個五年規(guī)劃和二〇三五年遠景目標的建議》明確提出了“構建國家科研論文和科技信息高端交流平臺”(以下簡稱“高端交流平臺”)的戰(zhàn)略部署,顯示了黨和國家站在“百年未有之大變局”關口對我國國家科技創(chuàng)新體系基礎設施建設的重視和支持,這一國家戰(zhàn)略也迅速吸引了整個科學界特別是科研管理、信息管理等領域工作者的關注和討論,可以預見在“十四五”乃至更長一段時間內都將成為一個學界持續(xù)關注與討論的科學問題。
筆者認為,如將以證據為核心,在過去近30 年間迅猛發(fā)展,已從醫(yī)學領域應用到社會科學及實踐決策領域且廣受好評的循證理念和方法,引入到高端交流平臺構建這一國家戰(zhàn)略的學術討論與實踐實施之中,推動國家高端交流平臺從信息平臺走向循證平臺,無疑將會是一個全新的視野。循證平臺顧名思義就是以證據為核心的技術平臺,而證據就是經過系統(tǒng)評價、接近事實真相的信息。通俗來說就是經過研究后得出的結論信息。循證平臺與信息平臺的主要區(qū)別就是信息組織與證據組織的區(qū)別,將國家高端交流平臺建設為循證平臺,既是一次信息平臺資源組織架構的升級重構,又是一個創(chuàng)新的平臺知識服務模式的打造,是外在發(fā)展需求及內在科學使命驅動共同的結果。
首先,將國家高端交流平臺打造為循證平臺有著需求驅動。據Web of Science 數據庫統(tǒng)計,從2012 年至2021 年(截至2021 年5 月)近10 年間僅中國科研人員發(fā)表SCI 論文的總數已累計達到339.7 萬篇??蒲姓撐牡脑黾釉跒榭茖W工作者提供了可供選擇的豐富文獻的同時,也對文獻進行有效獲取和科學組織提出了考驗,如何提高文獻信息的檢索效率一直是圖書館、數據庫商及相關從業(yè)者苦思冥想卻又難以完全滿足用戶訴求的問題。不可否認,云計算信息存儲、語義化知識組織,以及核心期刊遴選等極大地提高了用戶的信息獲取體驗, 但當前大數據時代困擾用戶的信息數量龐大、 篩選困難等信息不對稱問題依然存在,如果在國家高端交流平臺的構建中不能從整個信息資源的組織模式上進行革新,信息不對稱問題將一直存在,也就難以企及“高端”所對應的定位。從信息資源知識化、將知識證據化無疑就是一個可供選擇的信息組織革新思路。
其次,將國家高端交流平臺打造為循證平臺有著理論支持。目前,學界對國家高端交流平臺的理解較為多樣,但無論如何定義“高端”的廣度和深度,“高端信息交流平臺”都始終是一個信息平臺,其建設也脫離不了必須考慮信息資源的相關性和用戶服務的可及性這兩大績效考量指標。正如Slawson DC等所言,任何信息源的效用都取決于它的相關性,并隨著準確性提升而倍增,且隨著信息獲取工作量的增加而倍減。因此,國家高端交流平臺構建的目標就是高相關性、高準確度和(用戶的)低工作量。運用證據質量分級理論推動信息資源向證據資源、從低級別證據向高級別證據的轉化無疑就能提高平臺的資源相關性以及服務可及性。
在循證科學中,以證據分級思想為基礎的證據金字塔(見圖1)是用戶(包括決策者或研究者)根據解決問題的需要,對相關信息進行匯總分析、研究后所獲得的嚴謹度不同的知識體系。在實踐中用戶可根據證據的級別高低分級,將可獲得的最高級別的證據作為最佳證據;如果最高級別證據缺失,則采用次之的證據。由證據金字塔可見,層級越高的證據越是應用嚴格的方法進行理性分析的成果。 如采用隨機對照試驗(Randomized Controlled Trial,RCT)所取得的結論定義為高質量證據,而對結論進行系統(tǒng)評價(Systematic Review,SR)所得證據則為最高質量證據。 然而,由于現實中各種條件的限制,科研論文和科技信息平臺不可能保證其所提供的信息均為高質量證據,大量的原始文獻即低級別證據是證據體系的最重要組成部分,從低質量證據向高質量證據的轉化存在著巨大的發(fā)展空間。
圖1 證據金字塔[3]
再次,將國家高端交流平臺打造為循證平臺有著實行方法及技術保障。從已有的方法來看,實現從低質量證據到高質量證據轉化并不困難,如對作為低質量證據的原始文獻依據嚴格的程序進行文獻摘錄、整理匯編以及系統(tǒng)評價等均可轉化成為高級證據,如循證醫(yī)學領域的知識服務系統(tǒng)Clinical Evidence(CE)除提供基本的知識服務和醫(yī)療知識,以及發(fā)表超出傳統(tǒng)期刊范疇、經過同行評議的系統(tǒng)綜述外,也通過全面的文獻證據搜索與科學評價對最新的預防及治療知識進行匯總進而形成系統(tǒng)綜述和總結報告,及時對各種預防、治療和干預手段的利弊進行權威性論述,運用科學方法在實現低級別證據向高級別證據轉化的同時也向用戶提供了科學決策知識服務。
當然,海量的原始文獻為國家高端交流循證平臺的構建提出了挑戰(zhàn),但現代信息技術特別是自然語言處理(Nature Language Processing,NLP)技術的發(fā)展和自動文摘等應用場景的出現為這一難題提供了解決方案。如有研究顯示,發(fā)表一篇系統(tǒng)評價平均需花費研究者67.3 周的時間,而Clark通過使用10 余個自然語言處理工具則在兩周內完成了液體攝入對尿路感染影響的系統(tǒng)評價,大大縮短了時間周期。 自動文摘處理更是技術成熟,目前已在Web 搜索、智能問答、輿情監(jiān)督等領域得到廣泛應用,面向原始研究文獻的自動文摘更是在技術迭代、關鍵技術研發(fā)方面發(fā)展較快。
最后,將國家高端交流平臺打造為循證平臺可以創(chuàng)新平臺知識服務模式。 Haynes RB于2001 年提出了一種循證服務平臺的“4S”模型,其從低到高包含原始研究(Original Studies)、對證據的系統(tǒng)綜述(Syntheses)、對研究和綜述的摘要(Synopses)以及循證信息系統(tǒng)(Systems)等4 個層次,用戶可以按從高到底的順序進行信息檢索。 2006 年,Haynes RB在“4S”模型的基礎上構建了“5S”模型(見圖2),自底向上分別為研究(Studies,原始性研究)、綜述(Syntheses,如Cochrane 系統(tǒng)評價)、摘要(Synopses,單個研究或系統(tǒng)評價的簡短描述)、總結(Summaries,特定主題的證據總結)與系統(tǒng)(Systems,個體信息與相關最佳證據相結合的決策支持系統(tǒng))。 不管是4S 模型還是5S 模型,其均有別于當前主要科研論文和科技信息平臺所拘泥于主題、篇名等檢索層面,為用戶的信息獲取提供了一個從高到低的優(yōu)先分級選項。
圖2 循證知識服務模型[9]
綜上可見,將國家高端交流平臺打造為循證平臺有著從需求驅動、理論支持及方法技術保障等有利因素,也能夠創(chuàng)新傳統(tǒng)文獻數據庫或知識庫的知識服務模式。本文僅僅從有利因素、服務模式等方面提及了一些設想,在頂層設計、制度保障、協(xié)同機制等宏觀層面,以及證據轉化方法、技術實現等微觀層面還有著諸多研究空間,亟待科學共同體給予更多研究及探索。