肖婷 陳慧
四川大學(xué)華西第二醫(yī)院/出生缺陷與相關(guān)婦兒疾病教育部重點(diǎn)實(shí)驗(yàn)室 四川 成都 610041
研究數(shù)據(jù)是指“通常被科學(xué)社會(huì)所接受的,用于驗(yàn)證研究發(fā)現(xiàn)的被記錄的必要的事實(shí)材料”[1]。該定義包括了分析數(shù)據(jù)和用于描述這些數(shù)據(jù)是如何產(chǎn)生的元數(shù)據(jù)。在大數(shù)據(jù)時(shí)代背景下,快速興起的數(shù)據(jù)密集型科學(xué)研究[2],表明巨量科學(xué)數(shù)據(jù)的聚合、分析和探索,已然成為科學(xué)研究的新基礎(chǔ),將加速推動(dòng)新科學(xué)方法的發(fā)現(xiàn)。
高校實(shí)驗(yàn)室作為科研活動(dòng)的重要陣地,是研究數(shù)據(jù)產(chǎn)生的主要來(lái)源,目前大多實(shí)驗(yàn)室仍沿用傳統(tǒng)紙質(zhì)載體對(duì)研究數(shù)據(jù)進(jìn)行管理,由于科研參與人員在實(shí)驗(yàn)記錄方面的科學(xué)素養(yǎng)主觀差異性較大,從而導(dǎo)致研究項(xiàng)目中的知識(shí)傳遞極易出現(xiàn)斷層和偏差,數(shù)據(jù)監(jiān)管也暴露出較大疏漏,嚴(yán)重影響了科研成果的有效延續(xù)和應(yīng)用。
本文將基于科學(xué)素養(yǎng)的視角,探討如何在實(shí)現(xiàn)研究數(shù)據(jù)全周期質(zhì)量管理的同時(shí),提升研究人員的科學(xué)素養(yǎng),促進(jìn)科技創(chuàng)新的高速發(fā)展。
由于實(shí)驗(yàn)室研究參與人員科學(xué)素養(yǎng)的個(gè)體化差異,在科研創(chuàng)新大環(huán)境下,傳統(tǒng)紙質(zhì)載體的研究數(shù)據(jù)管理模式,使得科研團(tuán)隊(duì)不易協(xié)作性愈加突出,其劣勢(shì)日漸凸顯。
傳統(tǒng)的紙質(zhì)記錄,偏重于對(duì)記錄完成的檢查,而對(duì)研究人員過(guò)程記錄的細(xì)節(jié)規(guī)范約束性不足。尤其是部分高校實(shí)驗(yàn)室忽視對(duì)研究相關(guān)工作的要求和管理,當(dāng)有些研究人員離開(kāi)實(shí)驗(yàn)室后,其研究成果需要進(jìn)行深入探究時(shí),其他研究人員無(wú)法看懂和理解該實(shí)驗(yàn)記錄,無(wú)法重復(fù)原來(lái)的實(shí)驗(yàn)條件和實(shí)驗(yàn)步驟來(lái)得出相同的實(shí)驗(yàn)數(shù)據(jù),當(dāng)已發(fā)表的研究成果遭到質(zhì)疑時(shí),無(wú)法提供有效的原始記錄[3]。因研究數(shù)據(jù)缺乏有效的管理手段,使產(chǎn)生研究數(shù)據(jù)的記錄的細(xì)節(jié)規(guī)范缺乏約束性,導(dǎo)致研究過(guò)程中得出的研究數(shù)據(jù)存在多種隱患。
對(duì)研究數(shù)據(jù)的實(shí)驗(yàn)記錄規(guī)范培養(yǎng)不足,同時(shí),重研究結(jié)果輕培養(yǎng)過(guò)程的普遍現(xiàn)象使研究人員更關(guān)注實(shí)驗(yàn)進(jìn)度和部分陽(yáng)性結(jié)果,從而導(dǎo)致記錄較為隨意,時(shí)間不詳細(xì),沒(méi)有條理,書寫混亂或表述不專業(yè),實(shí)驗(yàn)過(guò)程和數(shù)據(jù)記錄不及時(shí),后期憑記憶補(bǔ)記,造成許多細(xì)節(jié)被遺漏;僅有過(guò)程描述,無(wú)實(shí)驗(yàn)現(xiàn)象和實(shí)驗(yàn)結(jié)果的描述等。以上行為都可能導(dǎo)致無(wú)法還原最初的實(shí)驗(yàn)條件和實(shí)驗(yàn)步驟,無(wú)法重復(fù)實(shí)驗(yàn)結(jié)果,使得已產(chǎn)生的實(shí)驗(yàn)數(shù)據(jù)失去其科學(xué)價(jià)值。
目前,多數(shù)高校實(shí)驗(yàn)室的研究人員是自主管理實(shí)驗(yàn)安排和記錄數(shù)據(jù),傳統(tǒng)的紙質(zhì)記錄產(chǎn)生的研究數(shù)據(jù),由于負(fù)責(zé)人的工作日程安排不固定,難以實(shí)現(xiàn)及時(shí)有效的進(jìn)度交流和核對(duì)檢查。同時(shí),傳統(tǒng)模式下,紙質(zhì)記錄具有時(shí)間和空間的滯后性,不利于監(jiān)管,不利于共享和深入開(kāi)展研究工作,并且導(dǎo)致研究人員往往只關(guān)注對(duì)自己實(shí)驗(yàn)結(jié)果有利的部分?jǐn)?shù)據(jù),缺乏對(duì)實(shí)驗(yàn)數(shù)據(jù)的深層次挖掘,一定程度上造成實(shí)驗(yàn)研究的不全面,降低了研究效率,對(duì)于科學(xué)研究的投入是極大的浪費(fèi)。
近年來(lái),在科研活動(dòng)中,違背科研誠(chéng)信要求的事件頻發(fā),科研誠(chéng)信失信行為常見(jiàn)于各類媒體,以國(guó)家自然科學(xué)基金委員會(huì)為例,近年來(lái)就查處了多起不端行為案例[4-5]。因傳統(tǒng)管理模式對(duì)研究數(shù)據(jù)缺乏有效監(jiān)管,使研究人員有機(jī)會(huì)對(duì)研究數(shù)據(jù)編造,篡改科研活動(dòng)中產(chǎn)生的元數(shù)據(jù),使數(shù)據(jù)更理想化,以支持所研究的觀點(diǎn),從而易出現(xiàn)科研誠(chéng)信問(wèn)題。
高校的研究項(xiàng)目一般持續(xù)時(shí)間較長(zhǎng),而實(shí)驗(yàn)室研究人員流動(dòng)性較大,傳統(tǒng)紙質(zhì)為主的研究數(shù)據(jù)的記錄容易造成研究項(xiàng)目的斷層[6],記錄零碎分散,不易保存和不便檢索的弊端不利于實(shí)驗(yàn)室傳承和存儲(chǔ)共享,難以實(shí)現(xiàn)知識(shí)共享和有效利用。
調(diào)查發(fā)現(xiàn)[7],個(gè)人電腦、光盤、移動(dòng)硬盤、機(jī)構(gòu)電腦等是科研人員保存數(shù)據(jù)最主要的方式,此外,也有部分科研人員選擇保存在紙質(zhì)載體和網(wǎng)絡(luò)硬盤上。我國(guó)研究數(shù)據(jù)的保管主要以個(gè)人為主(超過(guò)80%)[8],這給數(shù)據(jù)的共享與安全帶來(lái)不利影響:一是數(shù)據(jù)分散在個(gè)人手中,導(dǎo)致研究數(shù)據(jù)管理混亂,零碎分散,不僅規(guī)范性差、不易保存,不也無(wú)法快速檢索、查看,使數(shù)據(jù)不會(huì)被公開(kāi)或者共享給其他研究人員作為研究依據(jù),這對(duì)于科研經(jīng)費(fèi)的投入是極大的浪費(fèi)。二是分散保管容易造成數(shù)據(jù)的丟失和損毀,缺乏手段進(jìn)行數(shù)據(jù)記錄的規(guī)范化管理,數(shù)據(jù)的安全面臨風(fēng)險(xiǎn)。
高校作為科研活動(dòng)的重要陣地,擁有巨量的研究數(shù)據(jù),同時(shí),高校研究數(shù)據(jù)的管理也是國(guó)家研究數(shù)據(jù)管理的重要一環(huán)。國(guó)家對(duì)研究數(shù)據(jù)管理高度重視,為加強(qiáng)我國(guó)科研數(shù)據(jù)管理的規(guī)范性,2018年4月國(guó)務(wù)院辦公廳印發(fā)《科學(xué)數(shù)據(jù)管理辦法》[9],規(guī)定科學(xué)數(shù)據(jù)管理工作實(shí)行國(guó)家統(tǒng)籌、各部門與各地區(qū)分工負(fù)責(zé)的體制,并明確規(guī)定高等院校是科學(xué)數(shù)據(jù)管理的責(zé)任主體,應(yīng)該建立健全本單位科學(xué)數(shù)據(jù)相關(guān)管理制度,同時(shí)對(duì)我國(guó)科學(xué)數(shù)據(jù)管理的數(shù)據(jù)的采集、記錄、保存與匯交、共享與應(yīng)用等方面都進(jìn)行了規(guī)范。對(duì)推動(dòng)科研數(shù)據(jù)管理與共享實(shí)踐和促進(jìn)科技創(chuàng)新具有重要的意義。
近年來(lái),隨著信息技術(shù)的快速發(fā)展與應(yīng)用,以及互聯(lián)網(wǎng)+時(shí)代的到來(lái),信息化建設(shè)不斷加強(qiáng),實(shí)現(xiàn)研究數(shù)據(jù)信息化管理成為必備的工作需求。利用研究數(shù)據(jù)的信息化管理,可以更加有效地引導(dǎo)研究參與人員完成研究數(shù)據(jù)的標(biāo)準(zhǔn)化收集、規(guī)范性記錄、系統(tǒng)分析、完整保存和無(wú)偏差的共享。同時(shí),在確認(rèn)科學(xué)問(wèn)題、使用證據(jù)、深入思考、做出科學(xué)結(jié)論的反復(fù)訓(xùn)練過(guò)程中,強(qiáng)化知識(shí)的理解,訓(xùn)練科學(xué)思維以及應(yīng)用科學(xué)知識(shí)解決科學(xué)問(wèn)題的能力。
大數(shù)據(jù)時(shí)代,對(duì)于科研數(shù)據(jù)的應(yīng)用和轉(zhuǎn)化,如果沒(méi)有更加有效的管理手段和途徑,科研創(chuàng)新的進(jìn)度將被嚴(yán)重阻礙和滯后。因此,如何行之有效地進(jìn)行研究數(shù)據(jù)管理,在社會(huì)發(fā)展需求背景下,具有重要的現(xiàn)實(shí)意義。
研究數(shù)據(jù)產(chǎn)生于科學(xué)工作流,擁有自己的生命周期。英國(guó)DCC將研究數(shù)據(jù)生命周期分成6個(gè)階段,包括創(chuàng)建、處理、分析、保存、獲取、重用,而數(shù)據(jù)管理是為了以一種有效的方式管理數(shù)據(jù)生命周期的需要,是一系列架構(gòu)、政策、實(shí)踐和程序的開(kāi)發(fā)和執(zhí)行活動(dòng)[10]。
研究數(shù)據(jù)信息化管理系統(tǒng)主要用于實(shí)驗(yàn)記錄、分析方法庫(kù)的建立和實(shí)驗(yàn)數(shù)據(jù)的規(guī)范管理,確保所有的研究數(shù)據(jù)都能被適當(dāng)?shù)赜涗浵聛?lái),并在必要時(shí)得以使用。實(shí)驗(yàn)記錄中保存的研究數(shù)據(jù),須設(shè)計(jì)含有多個(gè)功能模塊的實(shí)驗(yàn)記錄模板,模板中可容納被允許的記錄要求和研究數(shù)據(jù)保存形式,包含實(shí)驗(yàn)基本信息、記錄正文、元數(shù)據(jù)保存提交等內(nèi)容。
良好的數(shù)據(jù)管理是研究過(guò)程各階段的基礎(chǔ),為了有效推動(dòng)科研發(fā)展,應(yīng)在實(shí)驗(yàn)室研究工作的開(kāi)始就著手建立。以實(shí)驗(yàn)記錄為管理基線,規(guī)范研究數(shù)據(jù)記錄流程,提高研究數(shù)據(jù)利用效率,全面整合資源,以期實(shí)現(xiàn)對(duì)實(shí)驗(yàn)過(guò)程中的記錄、結(jié)果分析、儲(chǔ)存、數(shù)據(jù)監(jiān)管和應(yīng)用在一定范圍內(nèi)共享的研究數(shù)據(jù)信息化管理,實(shí)現(xiàn)數(shù)據(jù)生命周期內(nèi)“記錄-保存-監(jiān)管-應(yīng)用”的完整鏈條,為科研人員提供一個(gè)優(yōu)質(zhì)、高效和規(guī)范的創(chuàng)新環(huán)境,構(gòu)建規(guī)范、高效和適用的研究數(shù)據(jù)管理系統(tǒng)。
通過(guò)對(duì)研究數(shù)據(jù)生命周期管理,將數(shù)據(jù)采集、數(shù)據(jù)記錄、數(shù)據(jù)保存、數(shù)據(jù)分析與挖掘等過(guò)程痕跡化,一方面,在后續(xù)實(shí)驗(yàn)過(guò)程中重新分析結(jié)果時(shí)有了更加可靠的數(shù)據(jù)支持,另一方面,通過(guò)研究數(shù)據(jù)監(jiān)管信息化,實(shí)驗(yàn)記錄可實(shí)現(xiàn)動(dòng)態(tài)管理,隨時(shí)檢查,便于負(fù)責(zé)人員或管理人員及時(shí)發(fā)現(xiàn)和糾正實(shí)驗(yàn)過(guò)程中發(fā)生的錯(cuò)誤或疏漏,在存在異議時(shí)給予及時(shí)指出,使實(shí)驗(yàn)結(jié)果真實(shí)、可信,避免學(xué)術(shù)造假等學(xué)術(shù)不端行為。
研究數(shù)據(jù)記錄是研究項(xiàng)目成功的關(guān)鍵因素之一,強(qiáng)調(diào)對(duì)數(shù)據(jù)過(guò)程和結(jié)果記錄要及時(shí)、真實(shí)、清晰、完整和規(guī)范,以保證研究數(shù)據(jù)的真實(shí)性和規(guī)范性。在研究數(shù)據(jù)保存方面,強(qiáng)調(diào)上傳保存所有的原始數(shù)據(jù),使后續(xù)研究重新分析研究結(jié)果時(shí)有數(shù)據(jù)支撐,也杜絕了學(xué)術(shù)不端的可能。除上傳原始數(shù)據(jù)外,還要求研究人員對(duì)上傳的數(shù)據(jù)進(jìn)行分析說(shuō)明或歸納總結(jié)的詳細(xì)而準(zhǔn)確的解釋性文檔,以便他人查閱和理解其研究結(jié)果,同時(shí)也是對(duì)研究人員進(jìn)行科研素質(zhì)訓(xùn)練。在數(shù)據(jù)監(jiān)管方面,強(qiáng)調(diào)研究負(fù)責(zé)人及時(shí)審閱研究人員的研究數(shù)據(jù)記錄,同時(shí)通過(guò)信息化管理系統(tǒng)與研究人員進(jìn)行有效互動(dòng),共同分析實(shí)驗(yàn)結(jié)果,評(píng)價(jià)研究項(xiàng)目進(jìn)展,及時(shí)擬定下一步工作計(jì)劃,該系統(tǒng)使研究數(shù)據(jù)在細(xì)節(jié)方面的管理提供了多樣化的呈現(xiàn),對(duì)科學(xué)素養(yǎng)形成進(jìn)行了強(qiáng)化。
信息化的研究數(shù)據(jù)管理體系有利于固定化培養(yǎng)研究人員的規(guī)范操作、規(guī)范記錄、規(guī)范分析與研究探討,在研究數(shù)據(jù)產(chǎn)生、管理和重用的全生命周期各環(huán)節(jié),設(shè)置質(zhì)量管理要求,在整理數(shù)據(jù)、分析數(shù)據(jù)、得出科學(xué)結(jié)論的循環(huán)中,不斷強(qiáng)化數(shù)據(jù)意識(shí),提升研究人員歸納、分析、總結(jié)、探究的科學(xué)思維能力,進(jìn)而促進(jìn)科學(xué)素養(yǎng)的形成。
信息化手段在研究數(shù)據(jù)管理過(guò)程中的應(yīng)用,可以更好地實(shí)現(xiàn)研究數(shù)據(jù)的規(guī)范化、精細(xì)化、動(dòng)態(tài)化、高效化管理。研究數(shù)據(jù)應(yīng)該包括所有可以用來(lái)驗(yàn)證結(jié)果的,支持研究問(wèn)題的證據(jù)。為了使研究數(shù)據(jù)在其生命周期中易于發(fā)現(xiàn)、使用和管理,研究人員必須確保創(chuàng)建和維護(hù)足夠的文檔或元數(shù)據(jù),保存更為完整的數(shù)據(jù)、描述和觀察,通過(guò)更為客觀的信息,進(jìn)而獲得科學(xué)規(guī)律。
實(shí)驗(yàn)記錄模板的設(shè)計(jì)應(yīng)突出以人為本的理念,通過(guò)便捷的撰寫錄入,在記錄和保存的過(guò)程中逐步落實(shí)研究數(shù)據(jù)的規(guī)范化要求,可以有效解決傳統(tǒng)的實(shí)驗(yàn)記錄或紙質(zhì)書寫錄入報(bào)告時(shí)可能出現(xiàn)的數(shù)據(jù)不清楚、格式不規(guī)范、難以溯源等問(wèn)題,避免因科研人員流動(dòng)、基層管理疏漏及儀器設(shè)備更新問(wèn)題,造成實(shí)驗(yàn)記錄和數(shù)據(jù)的流失和損壞。
在線化的研究數(shù)據(jù)管理系統(tǒng)能夠?qū)崿F(xiàn)快速檢索和回顧查看以往各階段的實(shí)驗(yàn)設(shè)計(jì)和過(guò)程細(xì)節(jié),有助于研究者保持清醒的實(shí)驗(yàn)思路,把握實(shí)驗(yàn)執(zhí)行進(jìn)度,提高科研效率,抓住關(guān)鍵的實(shí)驗(yàn)現(xiàn)象,準(zhǔn)確回顧和分析科研實(shí)踐中的成敗得失,得出更加可靠的實(shí)驗(yàn)結(jié)論。
同時(shí),實(shí)驗(yàn)室研究數(shù)據(jù)信息結(jié)構(gòu)化,實(shí)現(xiàn)了即時(shí)互通和交流共享,同時(shí),負(fù)責(zé)人可通過(guò)系統(tǒng)對(duì)研究數(shù)據(jù)進(jìn)行限時(shí)的審核歸檔,使研究數(shù)據(jù)得到有效監(jiān)管和及時(shí)保存。
信息化管理模式的應(yīng)用可以高效地提高各種格式的研究數(shù)據(jù)創(chuàng)建、組織、存儲(chǔ)和分發(fā),有利于研究數(shù)據(jù)的訪問(wèn)、整合、發(fā)現(xiàn)、共享、長(zhǎng)期保存和重用,使研究數(shù)據(jù)更加具有可讀性和可交流性,提高了知識(shí)傳遞的效率,讓研究數(shù)據(jù)的提取更加直觀和便捷,降低科學(xué)研究成本,也切實(shí)保障了科學(xué)研究過(guò)程的可回溯性和驗(yàn)證。
數(shù)據(jù)處于研究的核心位置,由研究項(xiàng)目過(guò)程創(chuàng)建,擁有比研究項(xiàng)目更長(zhǎng)的壽命[11]。有效的研究數(shù)據(jù)是孕育科研成果的源泉。在科技創(chuàng)新背景下,加強(qiáng)高校實(shí)驗(yàn)室研究數(shù)據(jù)的信息化建設(shè)是必然發(fā)展趨勢(shì),也是促進(jìn)科學(xué)素養(yǎng)教育的重要手段。研究數(shù)據(jù)管理必須貫穿于整個(gè)研究數(shù)據(jù)生命周期,高校實(shí)驗(yàn)室的研究人員應(yīng)轉(zhuǎn)變心態(tài),接受和適應(yīng)信息化轉(zhuǎn)型,加快科技創(chuàng)新進(jìn)程,提高研究數(shù)據(jù)管理能力,規(guī)范科學(xué)素養(yǎng)的培養(yǎng)過(guò)程,孵化更多的研究成果。