夏義堃 管茜 周艷
摘? ?要:生命科學(xué)數(shù)據(jù)管理是推進(jìn)生物技術(shù)創(chuàng)新和醫(yī)療健康水平提升的重要基礎(chǔ)與關(guān)鍵要素,從責(zé)任主體驅(qū)動(dòng)機(jī)制與數(shù)據(jù)行為角度展開(kāi)分析能夠?yàn)橥晟粕茖W(xué)數(shù)據(jù)管理提供實(shí)踐指導(dǎo)和理論啟發(fā)?;诶嫦嚓P(guān)者理論和科學(xué)數(shù)據(jù)管理框架,運(yùn)用文獻(xiàn)調(diào)研法和網(wǎng)絡(luò)調(diào)查法、案例分析法,歸納和分析不同責(zé)任主體的生命科學(xué)數(shù)據(jù)管理行為。生命科學(xué)數(shù)據(jù)管理的責(zé)任體系多元復(fù)雜、價(jià)值訴求與數(shù)據(jù)管理方式多樣,只有激發(fā)研究人員、資助方、期刊出版方、數(shù)據(jù)倉(cāng)儲(chǔ)/平臺(tái)、學(xué)術(shù)共同體多主體數(shù)據(jù)管理參與熱情,形成協(xié)同管理模式才能夠營(yíng)造高效的生命科學(xué)數(shù)據(jù)管理生態(tài)體系。
關(guān)鍵詞:生命科學(xué)數(shù)據(jù);科學(xué)數(shù)據(jù)管理;數(shù)據(jù)共享;利益相關(guān)者;數(shù)據(jù)管理責(zé)任
Abstract Life science data management is the key foundation and factor at the promotion of biotechnology innovation and medical level. It will provide practical guidance and theoretical inspiration for the improvement of life science data management by the perspective of responsibility-driven mechanism and data behavior analysis. Based on stakeholder theory and science data management framework, the author sorted out life science data management behaviors of different responsible entities by the methods of using literature research, network investigation and case analysis. There are multiple entities, value needs and various management methods in the complicated process of life science data management, and the efficient ecosystem of life science data management should be built through stimulating the enthusiasm of multi-entities' participation and forming a collaborative management model.
Key words life science data; science data management; data sharing; stakeholders; data management responsibility
在數(shù)字化時(shí)代,各類(lèi)生物、醫(yī)學(xué)實(shí)驗(yàn)所產(chǎn)生的大量原始實(shí)驗(yàn)數(shù)據(jù),不論是用于流行病學(xué)、藥物遺傳學(xué)還是干細(xì)胞研究、癌癥研究以及精準(zhǔn)醫(yī)學(xué)研究,都具有舉足輕重的地位。有關(guān)生命科學(xué)數(shù)據(jù)的收集、存儲(chǔ)、加工等數(shù)據(jù)管理活動(dòng)被視為“生物價(jià)值”生產(chǎn)的關(guān)鍵要素,對(duì)于生命科學(xué)研究的創(chuàng)新以及生物醫(yī)藥產(chǎn)業(yè)效益提升具有不可替代的重要影響。因此,推進(jìn)生命科學(xué)數(shù)據(jù)管理能力和效率的提高刻不容緩,本文基于國(guó)內(nèi)外生命科學(xué)數(shù)據(jù)管理相關(guān)研究成果,對(duì)生命科學(xué)數(shù)據(jù)管理理論的發(fā)展脈絡(luò)、主要政策及其內(nèi)容要素進(jìn)行梳理,并將利益相關(guān)者理論融入生命科學(xué)數(shù)據(jù)管理生態(tài)體系中,從多元責(zé)任主體的角度分析各方數(shù)據(jù)管理利益訴求,并提出建立生命科學(xué)數(shù)據(jù)管理的多元協(xié)同模式。
1? ?研究回顧與問(wèn)題的提出
1.1? ? 生命科學(xué)數(shù)據(jù)管理研究綜述
生命科學(xué)數(shù)據(jù)管理是科學(xué)數(shù)據(jù)管理的重要組成部分,其數(shù)據(jù)管理實(shí)踐早于其他學(xué)科,可溯源到20世紀(jì)60年代美國(guó)學(xué)者的蛋白質(zhì)序列數(shù)據(jù)共享行為,即《蛋白質(zhì)序列和結(jié)構(gòu)圖集Atlas》的發(fā)布[1]。而其他學(xué)科的數(shù)據(jù)共享可追溯到1985年美國(guó)國(guó)家統(tǒng)計(jì)委員會(huì)發(fā)表的“共享研究數(shù)據(jù)”報(bào)告[2]。數(shù)據(jù)管理與生命科學(xué)研究之間有著緊密的內(nèi)在聯(lián)系,在生物學(xué)領(lǐng)域,支持?jǐn)?shù)據(jù)共享的學(xué)者往往會(huì)強(qiáng)調(diào)各類(lèi)材料和數(shù)據(jù)交換的學(xué)術(shù)傳統(tǒng)[3],有學(xué)者甚至直接指出生命科學(xué)和精密醫(yī)學(xué)領(lǐng)域的“更大思維”就是數(shù)據(jù)驅(qū)動(dòng)的研究[4]。國(guó)內(nèi)外有關(guān)生命科學(xué)數(shù)據(jù)管理的研究主要集中在以下方面:
(1)生命科學(xué)數(shù)據(jù)管理重要性研究。很多學(xué)者論證了基因組數(shù)據(jù)收集與共享、基因數(shù)據(jù)挖掘與比對(duì)、基因序列分析等在基因組學(xué)、系統(tǒng)生物學(xué)、結(jié)構(gòu)生物學(xué)等新興學(xué)科孵化以及基因診斷等實(shí)踐應(yīng)用中的重要作用[5-6];隨著大數(shù)據(jù)的發(fā)展,一些學(xué)者從生物醫(yī)學(xué)樣本的數(shù)字化轉(zhuǎn)換過(guò)程及其與多源數(shù)據(jù)的關(guān)聯(lián)融合角度,探討生命科學(xué)知識(shí)生產(chǎn)加工的數(shù)據(jù)化過(guò)程和學(xué)科交叉融合的深刻意義[7-8],如促進(jìn)信息共享,理解癌癥就是理解有關(guān)癌癥的信息等[9],“使廣泛的數(shù)據(jù)利用和分析用于疾病診斷,尋找新的治療方法以及對(duì)人類(lèi)生物學(xué)的更好理解”[10]。
(2)生命科學(xué)數(shù)據(jù)管理規(guī)范與特點(diǎn)研究。許多學(xué)者從科學(xué)數(shù)據(jù)管理視角探討生命科學(xué)數(shù)據(jù)管理的制度標(biāo)準(zhǔn),指出在生物、醫(yī)學(xué)等領(lǐng)域,應(yīng)創(chuàng)建復(fù)雜的、內(nèi)部一致的、可擴(kuò)展的數(shù)據(jù)管理體系,并為收集,存儲(chǔ),保存、訪問(wèn)和引用科學(xué)數(shù)據(jù)而開(kāi)發(fā)標(biāo)準(zhǔn)和準(zhǔn)則[11-12],也有學(xué)者研究生命科學(xué)數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)空間建構(gòu)標(biāo)準(zhǔn)與FAIR原則等實(shí)踐[13-14]。同時(shí),可復(fù)制性、可驗(yàn)證性等質(zhì)量要求也是生命科學(xué)數(shù)據(jù)管理研究的熱點(diǎn),對(duì)數(shù)據(jù)質(zhì)量要素內(nèi)涵的探討始終在持續(xù)進(jìn)行中[15-16]。同時(shí),生命科學(xué)自身復(fù)雜性帶來(lái)的數(shù)據(jù)標(biāo)準(zhǔn)以及元數(shù)據(jù)制定等各種挑戰(zhàn)及其解決辦法也是研究的重要內(nèi)容[17]。
(3)生命科學(xué)數(shù)據(jù)開(kāi)發(fā)利用研究。如Gardner[18]、Bhattacharya[19]等從開(kāi)放數(shù)據(jù)集、提取數(shù)據(jù)中的生物學(xué)信號(hào)、建立元分析、進(jìn)行科學(xué)發(fā)現(xiàn)與研究驗(yàn)證等角度分析了研究人員生命科學(xué)數(shù)據(jù)再利用行為與過(guò)程;也有學(xué)者從數(shù)據(jù)再利用實(shí)踐角度展開(kāi)分析,如TFrisby和Contreras[20]分析2018年美國(guó)癌癥登月項(xiàng)目獲批者的數(shù)據(jù)存取與共享政策執(zhí)行情況,調(diào)查研究人員數(shù)據(jù)共享動(dòng)機(jī)等[16],指出生命科學(xué)管理與共享政策的執(zhí)行仍面臨政策推介不足、執(zhí)行指導(dǎo)以及研究人員技能培訓(xùn)薄弱等一系列現(xiàn)實(shí)困難,生命科學(xué)本科生或研究生培養(yǎng)體系中有關(guān)數(shù)據(jù)共享和再利用教育并未得到重視和明確[21]。同時(shí),也有學(xué)者從文化傳統(tǒng)角度指出要真正實(shí)現(xiàn)生命科學(xué)數(shù)據(jù)的再利用,還需要實(shí)現(xiàn)文化氛圍的改變[8]。
(4)生命科學(xué)數(shù)據(jù)利用中的安全與倫理研究。生命科學(xué)數(shù)據(jù)利用的倫理與安全問(wèn)題一直受到各方重視,相關(guān)研究主要集中在隱私保護(hù)和知情同意履行以及數(shù)據(jù)權(quán)益歸屬、分配公平等方面,對(duì)保密性的恐懼和隱私保護(hù)要求等倫理挑戰(zhàn)問(wèn)題貫穿數(shù)據(jù)產(chǎn)生及其應(yīng)用[22-23],“涉及研究?jī)?nèi)容、研究過(guò)程、研究結(jié)果、成果及其轉(zhuǎn)化的整個(gè)過(guò)程[24]”。許多學(xué)者提出應(yīng)建構(gòu)保障性制度框架,在數(shù)據(jù)質(zhì)量、數(shù)據(jù)訪問(wèn)與存儲(chǔ)等基礎(chǔ)上,應(yīng)增加參與者隱私、風(fēng)險(xiǎn)和利益以及倫理原則等內(nèi)容[25],“需平衡開(kāi)放數(shù)據(jù)源的安全和隱私挑戰(zhàn)與開(kāi)放數(shù)據(jù)對(duì)改進(jìn)研究和醫(yī)療服務(wù)的潛在效益”[26]。也有學(xué)者提出應(yīng)對(duì)生命科學(xué)數(shù)據(jù)生產(chǎn)者、研究人員與使用人員的數(shù)據(jù)供給與利用義務(wù)進(jìn)行責(zé)任限定[27]。
1.2? ? 生命科學(xué)數(shù)據(jù)管理責(zé)任與利益相關(guān)者理論
20世紀(jì)90年代以來(lái),包括生命科學(xué)數(shù)據(jù)在內(nèi)的科學(xué)數(shù)據(jù)開(kāi)放存取與共享等管理問(wèn)題受到普遍重視,伴隨數(shù)據(jù)驅(qū)動(dòng)研究范式的出現(xiàn)和開(kāi)放數(shù)據(jù)運(yùn)動(dòng)的推進(jìn),有關(guān)科學(xué)數(shù)據(jù)管理的制度體系在英美發(fā)達(dá)國(guó)家不斷完善。2010年,美國(guó)國(guó)家科學(xué)基金會(huì)頒布《數(shù)據(jù)管理指南》,明確要求所有提交的項(xiàng)目申請(qǐng)書(shū)都必須包含“數(shù)據(jù)管理計(jì)劃”,并要求指明責(zé)任主體。如國(guó)家科學(xué)基金會(huì)下屬的生物科學(xué)理事會(huì)要求在數(shù)據(jù)管理計(jì)劃中應(yīng)說(shuō)明各方在管理和保留研究數(shù)據(jù)(包括關(guān)鍵人員離開(kāi)項(xiàng)目的應(yīng)急計(jì)劃)方面的職責(zé)義務(wù)[28]。同時(shí),美國(guó)國(guó)立衛(wèi)生研究院進(jìn)一步規(guī)定,數(shù)據(jù)收集與管理的職責(zé)分別由學(xué)術(shù)帶頭人和數(shù)據(jù)管理/數(shù)據(jù)管理中心負(fù)責(zé),此外,學(xué)術(shù)帶頭人及臨床診所還應(yīng)該負(fù)責(zé)決定數(shù)據(jù)的加工利用是否需要遵守聯(lián)邦隱私保護(hù)條文[29]。參照美國(guó)國(guó)立衛(wèi)生研究院有關(guān)數(shù)據(jù)管理責(zé)任范疇的界定,可將生命科學(xué)數(shù)據(jù)管理責(zé)任細(xì)分為如下內(nèi)容:
(1)制定數(shù)據(jù)管理計(jì)劃,包括但不限于: 數(shù)據(jù)標(biāo)準(zhǔn)、操作流程、數(shù)據(jù)源的描述、數(shù)據(jù)收集和處理程序、數(shù)據(jù)傳輸格式和程序、數(shù)據(jù)管理質(zhì)量控制程序以及數(shù)據(jù)安全措施等。
(2)相關(guān)人員數(shù)據(jù)倫理與數(shù)據(jù)素養(yǎng)教育、培訓(xùn)。
(3)數(shù)據(jù)管理計(jì)劃的有序執(zhí)行,包括數(shù)據(jù)采集與創(chuàng)建、數(shù)據(jù)組織與存儲(chǔ)加工、數(shù)據(jù)傳播與共享等流程的質(zhì)量控制,如及時(shí)記錄數(shù)據(jù)、修正數(shù)據(jù)等。
(4)數(shù)據(jù)平臺(tái)或數(shù)據(jù)倉(cāng)儲(chǔ),包括數(shù)據(jù)許可、數(shù)據(jù)審核、數(shù)據(jù)服務(wù)工具開(kāi)發(fā)、數(shù)據(jù)獲取請(qǐng)求的迅速查詢(xún)與回應(yīng)等。
(5)對(duì)于臨床以及人類(lèi)樣品等相關(guān)內(nèi)容,數(shù)據(jù)管理人員與研究人員合作制定數(shù)據(jù)分析/統(tǒng)計(jì)計(jì)劃,明確數(shù)據(jù)分析的目標(biāo)、底線要求與統(tǒng)計(jì)方法、程序等。
(6)數(shù)據(jù)庫(kù)文檔驗(yàn)證或確認(rèn)使用經(jīng)商業(yè)驗(yàn)證的數(shù)據(jù)收集程序,包括合規(guī)驗(yàn)證與質(zhì)量驗(yàn)證;根據(jù)請(qǐng)求轉(zhuǎn)移數(shù)據(jù)庫(kù)和文件,相應(yīng)分析結(jié)果需要重新驗(yàn)證與分發(fā)。
(7)按照要求進(jìn)行數(shù)據(jù)管理執(zhí)行情況的報(bào)告,開(kāi)發(fā)數(shù)據(jù)管理案例,開(kāi)展數(shù)據(jù)管理執(zhí)行效果評(píng)估。
通過(guò)責(zé)任梳理發(fā)現(xiàn),生命科學(xué)數(shù)據(jù)管理過(guò)程涉及政府、科研資助機(jī)構(gòu)、學(xué)術(shù)共同體、期刊等多個(gè)利益主體,利益主體的責(zé)任驅(qū)動(dòng)與行動(dòng)協(xié)同是實(shí)現(xiàn)生命科學(xué)數(shù)據(jù)管理的關(guān)鍵。而脫胎于管理學(xué)和經(jīng)濟(jì)學(xué)的利益相關(guān)者理論的核心思想是組織中的利益相關(guān)者直接影響組織目標(biāo)的實(shí)現(xiàn),應(yīng)充分考慮和滿(mǎn)足不同層次利益相關(guān)者的訴求, “在股東利益和社會(huì)責(zé)任之間取得平衡,形成相關(guān)利益者之間的多邊契約[30],”以獲得更長(zhǎng)遠(yuǎn)的競(jìng)爭(zhēng)力。利益相關(guān)者理論的運(yùn)用,有助于澄清生命科學(xué)數(shù)據(jù)管理體系內(nèi)不同利益主體的身份與特征,客觀反映各主體的利益訴求和行為邏輯,為破解生命科學(xué)數(shù)據(jù)管理問(wèn)題提供了可資借鑒的分析框架。
2? ?生命科學(xué)數(shù)據(jù)管理的主體構(gòu)成及其驅(qū)動(dòng)機(jī)制分析
開(kāi)放數(shù)據(jù)是開(kāi)放科學(xué)的重要組成部分,不僅更好地詮釋了現(xiàn)代科學(xué)的普遍主義、公有性、無(wú)私利性等基本原則,也深化了科學(xué)數(shù)據(jù)管理的目標(biāo)任務(wù)。根據(jù)Springer Nature Group對(duì)全球各學(xué)科7700多研究人員的調(diào)查結(jié)果,將近三分之二(63%)的受訪者會(huì)將數(shù)據(jù)文件作為補(bǔ)充信息提交,或?qū)⑽募娣旁诖鎯?chǔ)庫(kù)中,或兩者同時(shí)進(jìn)行。其中,生物科學(xué)研究人員共享與出版物有關(guān)數(shù)據(jù)的比例最高(75%),其次是地理科學(xué)研究人員(63%),再次為醫(yī)學(xué)研究人員(59%)[31]。從利益相關(guān)者角度判斷,相較其他學(xué)科,生命科學(xué)數(shù)據(jù)管理的責(zé)任主體已初步形成了良好的數(shù)據(jù)共享傳統(tǒng)與數(shù)據(jù)開(kāi)放驅(qū)動(dòng)機(jī)制。
2.1? ? 生命科學(xué)數(shù)據(jù)管理主體要素構(gòu)成
從數(shù)據(jù)生態(tài)角度來(lái)看,生命科學(xué)數(shù)據(jù)管理需要整個(gè)研究界的共同關(guān)注,并需要政府部門(mén)、資助者、研究機(jī)構(gòu)、圖書(shū)館、出版商和研究人員本身提供協(xié)作解決方案。除上述主體外,生命科學(xué)數(shù)據(jù)管理的復(fù)雜性決定了參與主體的多元性,還包括數(shù)據(jù)倉(cāng)儲(chǔ)或平臺(tái)、學(xué)術(shù)共同體以及民眾、受試者等多類(lèi)型主體。正如利益相關(guān)者理論所闡述的,“利益相關(guān)者之間并非均質(zhì),不同的利益相關(guān)者對(duì)一個(gè)項(xiàng)目的作用和地位有所差異[32]?!备髦黧w在生命科學(xué)數(shù)據(jù)管理中發(fā)揮的作用影響不盡相同,分別以決策者、監(jiān)督者、執(zhí)行者、參與者、激勵(lì)者、服務(wù)者等多重身份存在,有些直接參與到數(shù)據(jù)管理過(guò)程中,如數(shù)據(jù)倉(cāng)儲(chǔ)/平臺(tái)、期刊出版部門(mén)等,有些間接施加影響,如政府部門(mén)、民眾等。同時(shí),有些主體以顯性方式通過(guò)資源、載體、技術(shù)等直接對(duì)生命科學(xué)數(shù)據(jù)管理過(guò)程產(chǎn)生影響,有些主體則以間接、內(nèi)隱的方式,如圖書(shū)館員的數(shù)據(jù)技能培訓(xùn)、同行數(shù)據(jù)共享氛圍等參與到生命科學(xué)數(shù)據(jù)管理過(guò)程,并發(fā)揮持久作用影響??傮w而言,在政府宏觀引導(dǎo)下,科研項(xiàng)目資助機(jī)構(gòu)、期刊出版部門(mén)、PI及其研究團(tuán)隊(duì)、學(xué)術(shù)共同體以及數(shù)據(jù)倉(cāng)儲(chǔ)/平臺(tái)構(gòu)成了生命科學(xué)數(shù)據(jù)管理的核心責(zé)任主體(見(jiàn)圖1)。
2.2? ? 生命科學(xué)數(shù)據(jù)管理的主體驅(qū)動(dòng)機(jī)制
生命科學(xué)數(shù)據(jù)管理展現(xiàn)了生命科學(xué)研究創(chuàng)新的過(guò)程與結(jié)果,數(shù)據(jù)開(kāi)放與再利用有助于形成新的數(shù)據(jù)關(guān)聯(lián)與創(chuàng)新發(fā)現(xiàn),并通過(guò)數(shù)據(jù)生產(chǎn)與數(shù)據(jù)開(kāi)放將生命科學(xué)學(xué)術(shù)研究與學(xué)術(shù)傳播融合在一起,構(gòu)成復(fù)雜的數(shù)據(jù)管理生態(tài)網(wǎng)絡(luò)。其中,主體數(shù)據(jù)管理驅(qū)動(dòng)力的來(lái)源包括各主體內(nèi)在的目標(biāo)愿景、外在預(yù)期以及與各種壓力、條件的對(duì)沖。以PI及其團(tuán)隊(duì)研究人員為例(見(jiàn)圖2),其數(shù)據(jù)管理的內(nèi)在動(dòng)力來(lái)自于數(shù)據(jù)共享與再利用后的學(xué)術(shù)引用與同行認(rèn)同、學(xué)術(shù)影響力提升,外在動(dòng)力則源自資助機(jī)構(gòu)、所在單位以及學(xué)術(shù)期刊對(duì)于數(shù)據(jù)采集、加工與共享利用的具體要求。此外,生命科學(xué)倫理以及受試者隱私保護(hù)等也會(huì)對(duì)研究人員的數(shù)據(jù)行為形成感知風(fēng)險(xiǎn)與底線要求,并對(duì)數(shù)據(jù)開(kāi)放與共享造成一定沖抵,而數(shù)據(jù)倉(cāng)儲(chǔ)以及平臺(tái)工具類(lèi)的完備程度與便利水平、圖書(shū)館數(shù)據(jù)技能培訓(xùn)咨詢(xún)的服務(wù)提供與利用情況等也會(huì)構(gòu)成數(shù)據(jù)管理的外在氛圍與驅(qū)動(dòng)要素。
結(jié)合各主體數(shù)據(jù)價(jià)值訴求及功能耦合(見(jiàn)表1),各主體生命科學(xué)數(shù)據(jù)管理責(zé)任具有明顯的差異性和互補(bǔ)性,對(duì)于PI及其團(tuán)隊(duì)研究人員而言,資助機(jī)構(gòu)與期刊出版、數(shù)據(jù)倉(cāng)儲(chǔ)/平臺(tái)之間圍繞項(xiàng)目資助、數(shù)據(jù)采集加工、共享與存儲(chǔ)再利用形成了銜接有序的上下游主體數(shù)據(jù)交換與數(shù)據(jù)責(zé)任銜接機(jī)制,既有項(xiàng)目資助、學(xué)術(shù)發(fā)表以及職務(wù)晉升等顯性激勵(lì),也有影響力提升、同行認(rèn)同等隱性激勵(lì),還有數(shù)據(jù)開(kāi)放共享后的數(shù)據(jù)質(zhì)量驗(yàn)證以及隱私、安全審核等學(xué)風(fēng)、倫理底線約束。同時(shí),在數(shù)字化環(huán)境下數(shù)據(jù)管理的責(zé)任分工趨向精細(xì)化和專(zhuān)業(yè)化,數(shù)據(jù)管理的決策責(zé)任、指導(dǎo)責(zé)任、執(zhí)行責(zé)任、監(jiān)管責(zé)任、技術(shù)支撐責(zé)任等通過(guò)橫向和縱向多主體的責(zé)任分工,形成“組合拳”效應(yīng),營(yíng)造了數(shù)據(jù)管理的環(huán)境驅(qū)動(dòng)、制度驅(qū)動(dòng)、管理驅(qū)動(dòng)、服務(wù)驅(qū)動(dòng)氛圍,并發(fā)揮了“1+1>2”的協(xié)同管理功效,推動(dòng)生命科學(xué)數(shù)據(jù)管理模式從指令要求、外在驅(qū)動(dòng)轉(zhuǎn)向自覺(jué)執(zhí)行、內(nèi)生驅(qū)動(dòng)的主動(dòng)性行為。
3? ?多元主體生命科學(xué)數(shù)據(jù)管理責(zé)任劃分
早在2003年,惠康基金就提出了基于大規(guī)模生物學(xué)研究項(xiàng)目的資源生產(chǎn)者、資源用戶(hù)與科研項(xiàng)目資助機(jī)構(gòu)的三方主體數(shù)據(jù)共享責(zé)任框架(見(jiàn)表2)。鑒于PI及其團(tuán)隊(duì)研究人員數(shù)據(jù)管理責(zé)任劃分的國(guó)內(nèi)外研究較多,本文著重對(duì)資助機(jī)構(gòu)、期刊出版部門(mén)、數(shù)據(jù)倉(cāng)儲(chǔ)/平臺(tái)以及學(xué)術(shù)共同體的數(shù)據(jù)管理規(guī)則、方式與手段進(jìn)行分析。
3.1? ? 科研項(xiàng)目資助方的生命科學(xué)數(shù)據(jù)管理行為分析
無(wú)論是公共部門(mén)還是民間乃至企業(yè)的科研項(xiàng)目,資助方的數(shù)據(jù)管理規(guī)則與要求對(duì)于研究人員科學(xué)數(shù)據(jù)管理計(jì)劃的制定、執(zhí)行有著舉足輕重的重要影響。由于掌握著資源調(diào)配權(quán),科研項(xiàng)目資助方可以運(yùn)用多種方式推進(jìn)生命科學(xué)數(shù)據(jù)管理,如指定科研項(xiàng)目數(shù)據(jù)管理責(zé)任人、將數(shù)據(jù)管理計(jì)劃作為項(xiàng)目申報(bào)的必要要件、審核數(shù)據(jù)管理計(jì)劃制定情況、根據(jù)計(jì)劃執(zhí)行情況劃撥經(jīng)費(fèi)、推選數(shù)據(jù)管理最佳案例等。
以美國(guó)國(guó)家科學(xué)基金會(huì)對(duì)生命科學(xué)數(shù)據(jù)管理的有關(guān)要求為例,在責(zé)任主體界定上,一方面在項(xiàng)目申報(bào)書(shū)、執(zhí)行建議中指出,首席PI負(fù)責(zé)整個(gè)項(xiàng)目數(shù)據(jù)管理計(jì)劃的制定和實(shí)施,包括在項(xiàng)目年度執(zhí)行報(bào)告和最終結(jié)題報(bào)告中匯報(bào)整個(gè)項(xiàng)目的數(shù)據(jù)保存和訪問(wèn)、共享等管理情況。另一方面,還規(guī)定項(xiàng)目主管部門(mén)和訪客委員會(huì)將監(jiān)督數(shù)據(jù)管理計(jì)劃的執(zhí)行;在數(shù)據(jù)管理計(jì)劃的內(nèi)容制定中,要求必須明確:(1)描述將要收集的數(shù)據(jù)類(lèi)型與內(nèi)容、來(lái)源,以及所使用的數(shù)據(jù)和元數(shù)據(jù)格式及標(biāo)準(zhǔn);(2)描述項(xiàng)目結(jié)題后將使用哪些物理和/或網(wǎng)絡(luò)資源和設(shè)施(包括第三方資源)來(lái)存儲(chǔ)和保存數(shù)據(jù);(3)描述項(xiàng)目結(jié)題后將使用哪些媒體和傳播方法以保證數(shù)據(jù)和元數(shù)據(jù)可供其他人利用;(4)描述數(shù)據(jù)共享和公共訪問(wèn)的政策(包括隱私保護(hù)、保密性、安全性、知識(shí)產(chǎn)權(quán)和其他相應(yīng)權(quán)利的規(guī)定);(5)描述結(jié)題后各方的數(shù)據(jù)管理角色和職責(zé)(包括關(guān)鍵人員離開(kāi)項(xiàng)目的應(yīng)急計(jì)劃);在項(xiàng)目結(jié)題報(bào)告中,有關(guān)數(shù)據(jù)管理計(jì)劃執(zhí)行情況的說(shuō)明必須清晰說(shuō)明以下內(nèi)容:(1)項(xiàng)目研究中產(chǎn)生的各種數(shù)據(jù);(2)結(jié)題后將要保留的數(shù)據(jù);(3)如何傳播和驗(yàn)證數(shù)據(jù)以便共享?(4)使數(shù)據(jù)可供他人利用的格式(包括元數(shù)據(jù));(5)項(xiàng)目生成的數(shù)據(jù)已存放/正在存儲(chǔ)以供公眾長(zhǎng)期訪問(wèn)的具體位置。
為加速癌癥研究與治療方法的創(chuàng)新,2016年,美國(guó)國(guó)家癌癥研究所啟動(dòng)了18億美元的“癌癥登月計(jì)劃”,其中數(shù)據(jù)生成后的公開(kāi)存取與共享政策(PADS)是該計(jì)劃實(shí)施的關(guān)鍵性舉措[34]。按照PADS政策規(guī)定,一是所有項(xiàng)目申請(qǐng)人都應(yīng)提交書(shū)面的數(shù)據(jù)公開(kāi)存取與共享計(jì)劃書(shū),清晰描述數(shù)據(jù)公開(kāi)和共享的具體流程與方式,如果不能共享,則應(yīng)說(shuō)明理由和依據(jù);二是數(shù)據(jù)公開(kāi)要求更加激進(jìn),規(guī)定在可行范圍內(nèi),受資助的所有研究項(xiàng)目均應(yīng)在公布研究結(jié)果的同時(shí)(最好在期刊發(fā)表四周內(nèi)),將數(shù)據(jù)存儲(chǔ)到PubMed Central中,而不是期刊發(fā)表后一年內(nèi)公開(kāi)提供數(shù)據(jù);三是進(jìn)一步擴(kuò)大了數(shù)據(jù)公開(kāi)范圍,不同于國(guó)立衛(wèi)生研究院規(guī)定的數(shù)據(jù)共享范圍,PADS政策將數(shù)據(jù)共享范圍界定為必須共享的任何“記錄在案的科學(xué)事實(shí),科學(xué)界普遍接受,以記錄和支持出版物的研究發(fā)現(xiàn)”,涵蓋了所有形式的臨床、藥理學(xué)、人口統(tǒng)計(jì)學(xué)、分析結(jié)果、調(diào)查報(bào)告以及收集或開(kāi)發(fā)的其他數(shù)據(jù)[35]。
民間生命科學(xué)研究項(xiàng)目資助方同樣積極推進(jìn)數(shù)據(jù)開(kāi)放與共享,比爾與梅琳達(dá)·蓋茨基金會(huì)(Bill and Melinda Gates Foundation)和陳扎克伯格倡議(Chan Zuckerberg Initiative)等資助機(jī)構(gòu)對(duì)其支持的任何研究項(xiàng)目都有明確的開(kāi)放數(shù)據(jù)要求。作為全球最大的非政府來(lái)源生命科學(xué)研究項(xiàng)目資助機(jī)構(gòu),英國(guó)的惠康基金會(huì)是第一家強(qiáng)制要求執(zhí)行開(kāi)放存取的學(xué)術(shù)資助機(jī)構(gòu)(2006年),其《數(shù)據(jù)管理和共享政策》,不僅強(qiáng)制實(shí)施學(xué)術(shù)成果的開(kāi)放獲取,并且會(huì)核實(shí)、評(píng)估和監(jiān)督數(shù)據(jù)共享工作的實(shí)施進(jìn)展[36]。按照惠康基金資助項(xiàng)目的最低要求,研究論文的基礎(chǔ)數(shù)據(jù),包括查看數(shù)據(jù)集或復(fù)制分析所需的任何原始軟件均應(yīng)在發(fā)表時(shí)提供給其他研究人員。當(dāng)研究數(shù)據(jù)與突發(fā)公共衛(wèi)生事件有關(guān)時(shí),研究人員必須盡可能迅速和廣泛地共享有質(zhì)量保證的中期和最終數(shù)據(jù),并在期刊出版之前共享[37]。
3.2? ? 期刊出版部門(mén)的生命科學(xué)數(shù)據(jù)管理行為分析
學(xué)術(shù)發(fā)表既是激勵(lì)研究人員數(shù)據(jù)開(kāi)放共享的首要驅(qū)動(dòng)力,也是期刊出版部門(mén)引導(dǎo)研究人員推進(jìn)生命科學(xué)數(shù)據(jù)管理的主要調(diào)控手段。隨著數(shù)據(jù)驅(qū)動(dòng)型研究的推廣普及,研究成果的數(shù)據(jù)發(fā)布以及相關(guān)資料的存儲(chǔ)再利用日益受到重視,成為生命科學(xué)在內(nèi)許多學(xué)科學(xué)術(shù)發(fā)表的重要組成部分,并推動(dòng)了重在描述實(shí)驗(yàn)和觀察數(shù)據(jù)的新型期刊-數(shù)據(jù)期刊的出現(xiàn)。1999年美國(guó)生態(tài)學(xué)會(huì)(ESA)出版的學(xué)術(shù)期刊Ecology首次刊發(fā)數(shù)據(jù)論文[38],隨后涌現(xiàn)出BMC Plant Biology、Human Genomics和BMC Research Notes三種數(shù)據(jù)期刊,繼而推動(dòng)數(shù)據(jù)期刊向其他學(xué)科延伸擴(kuò)張。
2011年,國(guó)際科學(xué)、技術(shù)和醫(yī)學(xué)出版商協(xié)會(huì)提出了數(shù)據(jù)出版物的金字塔模型[39](見(jiàn)圖3),將所有項(xiàng)目研究數(shù)據(jù)劃分為原始數(shù)據(jù)和數(shù)據(jù)集、數(shù)據(jù)收集和結(jié)構(gòu)化的數(shù)據(jù)庫(kù)、經(jīng)過(guò)加工的數(shù)據(jù)和數(shù)據(jù)表達(dá)以及數(shù)據(jù)出版物四個(gè)層次,不同層次的數(shù)據(jù)在學(xué)術(shù)發(fā)表環(huán)節(jié)有著不同的規(guī)范要求與展現(xiàn)方式。對(duì)于生命科學(xué)數(shù)據(jù)而言,期刊出版部門(mén)的主要管理方式、手段如下:
(1)制定鼓勵(lì)數(shù)據(jù)開(kāi)放共享的管理政策。英國(guó)皇家學(xué)會(huì)在其《出版?zhèn)惱砼c政策》中明確:為了讓其他人能夠驗(yàn)證并利用發(fā)表在皇家學(xué)會(huì)期刊上的研究成果,作為成果發(fā)表的先決條件,作者應(yīng)提供支持文章結(jié)論的相關(guān)數(shù)據(jù)、代碼和研究資料,并存放到恰當(dāng)、公認(rèn)、公開(kāi)可用的存儲(chǔ)庫(kù)中,如Dryad或Figshare。為鼓勵(lì)研究人員的數(shù)據(jù)共享,皇家學(xué)會(huì)還向Dryad支付了所屬期刊的數(shù)據(jù)存放費(fèi)用[40]。2016年,國(guó)際醫(yī)學(xué)期刊編輯委員會(huì)(ICMJE)發(fā)布了一項(xiàng)關(guān)于臨床試驗(yàn)數(shù)據(jù)共享的提案,要求2018年7月1日后提交到ICMJE所有成員期刊的研究報(bào)告必須包含數(shù)據(jù)共享聲明,聲明中應(yīng)明確是否去除了個(gè)體標(biāo)識(shí)性數(shù)據(jù)、可共享哪些數(shù)據(jù)、何時(shí)可獲取以及獲取要求等。同時(shí),還規(guī)定2019年1月1日后,有關(guān)受試者的臨床試驗(yàn)數(shù)據(jù),必須在臨床試驗(yàn)注冊(cè)平臺(tái)提交數(shù)據(jù)共享計(jì)劃并就相關(guān)問(wèn)題進(jìn)行闡述說(shuō)明[41]。
(2)進(jìn)一步細(xì)化數(shù)據(jù)提交、可用性、存儲(chǔ)與開(kāi)放存取等規(guī)范要求,增強(qiáng)數(shù)據(jù)管理的可操作性。目前,Nature、Science、Cell等許多涉及生命科學(xué)研究的高影響力期刊都制定了如《數(shù)據(jù)政策》《編輯出版政策》《數(shù)據(jù)可用性聲明》等制度條例,要求保存與提交的文章或研究項(xiàng)目必須提供相關(guān)數(shù)據(jù)集,幾乎所有期刊都對(duì)數(shù)據(jù)歸檔有強(qiáng)制性要求(見(jiàn)表3),并應(yīng)詳細(xì)說(shuō)明如何保存和引用共享數(shù)據(jù)。2016年,Cell 出版集團(tuán)推出了結(jié)構(gòu)化、透明、可訪問(wèn)和可報(bào)告的數(shù)據(jù)處理方法 (STAR)[42],要求共享所有技術(shù)、源數(shù)據(jù)以及重復(fù)實(shí)驗(yàn)所需的任何信息資源,并要求同行評(píng)審專(zhuān)家在審閱文章的同時(shí)檢查數(shù)據(jù)是否可用,以提高其期刊發(fā)表成果的研究透明度和可再現(xiàn)性。
作為全球生命科學(xué)領(lǐng)域最大的開(kāi)放存取出版商,有著約300種同行評(píng)審期刊的BMC(BioMed Central)明確提出“在不違背參與者隱私保護(hù)的前提下,應(yīng)向BMC期刊提交手稿意味著手稿中描述的材料,包括所有相關(guān)原始數(shù)據(jù),將免費(fèi)提供給任何希望將其用于非商業(yè)目的的科學(xué)家?!盵44]為此,BMC(BioMed Central)要求所有投稿作者提交的手稿材料中必須包含“數(shù)據(jù)和材料可用性”部分,詳細(xì)說(shuō)明在哪里可以查找到相關(guān)數(shù)據(jù)(必須進(jìn)行數(shù)據(jù)存儲(chǔ),鼓勵(lì)以機(jī)器可讀格式存儲(chǔ)在公開(kāi)可用的數(shù)據(jù)存儲(chǔ)庫(kù)中),不希望共享數(shù)據(jù)的作者必須聲明不能共享數(shù)據(jù)的原因。
(3)加強(qiáng)與數(shù)據(jù)倉(cāng)儲(chǔ)/平臺(tái)機(jī)構(gòu)的合作,為生命科學(xué)數(shù)據(jù)的開(kāi)放管理提供存儲(chǔ)服務(wù)。許多期刊紛紛與Dryad或Figshare、Mendeley Data、Protein Data Bank、GenBank等有關(guān)生命科學(xué)的數(shù)據(jù)存儲(chǔ)、托管機(jī)構(gòu)展開(kāi)合作,并要求將提交的論文數(shù)據(jù)、資料等上傳到指定數(shù)據(jù)平臺(tái),形成數(shù)據(jù)存儲(chǔ)與期刊成果發(fā)表之間的內(nèi)在關(guān)聯(lián)。
3.3? ? 數(shù)據(jù)倉(cāng)儲(chǔ)/平臺(tái)方的生命科學(xué)數(shù)據(jù)管理行為分析
數(shù)據(jù)倉(cāng)儲(chǔ)/平臺(tái)既是當(dāng)前生命科學(xué)數(shù)據(jù)組織、存儲(chǔ)、管理、分析、共享及發(fā)布的最重要載體,也是廣義的數(shù)據(jù)發(fā)表與出版平臺(tái)。通過(guò)政府部門(mén)、資助機(jī)構(gòu)以及期刊出版商、研究機(jī)構(gòu)等數(shù)據(jù)管理法規(guī)政策的執(zhí)行,數(shù)據(jù)倉(cāng)儲(chǔ)/平臺(tái)能夠有效匯聚生命科學(xué)出版物、專(zhuān)利、數(shù)據(jù)集、軟件和材料,實(shí)現(xiàn)數(shù)據(jù)資源的統(tǒng)一標(biāo)識(shí)與統(tǒng)一歸檔,支持標(biāo)準(zhǔn)化的數(shù)據(jù)質(zhì)量控制和完整的全生命周期管理,進(jìn)而吸納更多生命科學(xué)研究資源和用戶(hù)、工具的加入,形成數(shù)據(jù)存儲(chǔ)、監(jiān)護(hù)、共享與關(guān)聯(lián)利用的良性循環(huán)。
西方發(fā)達(dá)國(guó)家十分重視生命科學(xué)數(shù)據(jù)倉(cāng)儲(chǔ)/平臺(tái)建設(shè),英國(guó)的生物技術(shù)與生物科學(xué)研究理事會(huì)(BBSRC)專(zhuān)門(mén)設(shè)立了生物信息與生物資源基金(BBR),旨在加強(qiáng)生命科學(xué)數(shù)據(jù)庫(kù)、軟件工具以及種質(zhì)資源等生物資源建設(shè),強(qiáng)化生命科學(xué)基礎(chǔ)設(shè)施服務(wù)與保障能力[45]。當(dāng)前,生命科學(xué)領(lǐng)域代表性數(shù)據(jù)倉(cāng)儲(chǔ)/平臺(tái)大都明確了自身的數(shù)據(jù)共享管理政策與使用條例,制定了數(shù)據(jù)提交與質(zhì)量審核辦法。如加拿大的Brain-CODE設(shè)置了信息管理政策與平臺(tái)使用條款,指導(dǎo)用戶(hù)收集、存儲(chǔ)和訪問(wèn)數(shù)據(jù);美國(guó)癌癥影像中心(TCIA)制定了數(shù)據(jù)使用政策,為數(shù)據(jù)管理與共享提供了標(biāo)準(zhǔn)規(guī)范[46]。
為方便研究人員利用,美國(guó)國(guó)立生物技術(shù)信息中心的數(shù)據(jù)平臺(tái)(NCBI)、歐洲生物信息研究所分子生物學(xué)數(shù)據(jù)庫(kù)(EMBL-EBI)等平臺(tái)機(jī)構(gòu)不僅為研究人員編制數(shù)據(jù)管理計(jì)劃提供服務(wù)[49],還提供數(shù)據(jù)保存、分配數(shù)據(jù)標(biāo)識(shí)符(GenBank 數(shù)據(jù)庫(kù)使用GI 標(biāo)識(shí)符,NCBI、EMBL 等平臺(tái)則提供Accession、Version 標(biāo)識(shí)符,Dryad 給予DOI 標(biāo)識(shí))、在線參考咨詢(xún)、數(shù)據(jù)技能培訓(xùn)、工具軟件應(yīng)用指導(dǎo)等,以便用戶(hù)能夠更好地利用數(shù)據(jù)倉(cāng)儲(chǔ)/平臺(tái)開(kāi)展生命科學(xué)數(shù)據(jù)管理與研究發(fā)現(xiàn)。
2016年,美國(guó)癌癥研究中心提出創(chuàng)建一個(gè)全國(guó)性的數(shù)據(jù)生態(tài)系統(tǒng),由可互操作的存儲(chǔ)庫(kù)、分析服務(wù)和互動(dòng)門(mén)戶(hù)的動(dòng)態(tài)集合組成,允許研究人員、患者和臨床醫(yī)生以獨(dú)特而強(qiáng)大的方式查詢(xún)、聚合、分析和可視化癌癥數(shù)據(jù)。就本質(zhì)而言,這一系統(tǒng)不僅為研究人員成功地打造了一個(gè)安全、高效的癌癥研究科研環(huán)境,還是匯聚患者、研究人員、數(shù)據(jù)平臺(tái)等各方合力的癌癥數(shù)據(jù)管理生態(tài)體系(見(jiàn)圖4),既建立了互動(dòng)開(kāi)放的大型數(shù)據(jù)共享專(zhuān)區(qū),支持患者與健康人士為攻克癌癥研究貢獻(xiàn)數(shù)據(jù)(臨床或遺傳數(shù)據(jù)等),也實(shí)現(xiàn)了用戶(hù)、資源、系統(tǒng)和相關(guān)配置的集成管理。
3.4? ? 學(xué)術(shù)共同體的生命科學(xué)數(shù)據(jù)管理行為分析
學(xué)術(shù)共同體由具有共同研究興趣和價(jià)值取向,并遵守共同學(xué)術(shù)規(guī)則的同行群體組成,形式上多以組織化的研究機(jī)構(gòu)和松散化的學(xué)會(huì)、理事會(huì)等組成。盡管“數(shù)據(jù)共享是確保生物科學(xué)研究透明且可復(fù)制的主要要素”[49],但因受試者隱私保護(hù)、醫(yī)學(xué)倫理等要求等使得生命科學(xué)數(shù)據(jù)管理更具敏感性和脆弱性,客觀上會(huì)促使研究人員的數(shù)據(jù)行為走向封閉,需要學(xué)術(shù)共同體在強(qiáng)化研究人員數(shù)據(jù)管理主體責(zé)任意識(shí)、營(yíng)造良好數(shù)據(jù)生態(tài)方面發(fā)揮重要作用。
大學(xué)、研究院等PI及其團(tuán)隊(duì)研究人員所屬研究機(jī)構(gòu),是有效規(guī)范與執(zhí)行、監(jiān)督生命科學(xué)數(shù)據(jù)管理的首要責(zé)任主體,既要“承上”,采取有效措施保證政府主管部門(mén)及其資助機(jī)構(gòu)數(shù)據(jù)管理法規(guī)政策的有效實(shí)施,也要“啟下”,動(dòng)員和引導(dǎo)研究人員有效執(zhí)行數(shù)據(jù)管理政策,并對(duì)其數(shù)據(jù)行為進(jìn)行監(jiān)督約束。目前,很多大學(xué)均制定了各自的數(shù)據(jù)管理政策,如哈佛大學(xué)的《科研數(shù)據(jù)與資料的保存》、斯坦福大學(xué)《研究數(shù)據(jù)保存、獲取政策》、劍橋大學(xué)《科研數(shù)據(jù)管理政策》、牛津大學(xué)《研究數(shù)據(jù)及記錄管理政策》……,不僅結(jié)合各校實(shí)際明確了數(shù)據(jù)管理的目標(biāo)原則、倫理隱私、知識(shí)產(chǎn)權(quán)保護(hù)以及數(shù)據(jù)保存、備份、存儲(chǔ)、組織等具體政策,還劃分了研究人員、數(shù)據(jù)分析專(zhuān)家、圖書(shū)館員、信息中心等相關(guān)人員和部門(mén)的職責(zé)任務(wù),切實(shí)保障了學(xué)術(shù)共同體內(nèi)生命科學(xué)數(shù)據(jù)管理任務(wù)的執(zhí)行。悉尼大學(xué)的《科研數(shù)據(jù)管理政策》不僅規(guī)定了學(xué)校層面、院系層面以及研究人員等不同類(lèi)型責(zé)任主體的數(shù)據(jù)管理職責(zé)任務(wù),還要求各主體之間加強(qiáng)協(xié)作,建立數(shù)據(jù)管理的伙伴關(guān)系(見(jiàn)表4)。
此外,康奈爾大學(xué)、悉尼大學(xué)、弗吉尼亞理工大學(xué)等許多高校圖書(shū)館、科研記錄管理辦公室等還會(huì)提供針生命科學(xué)數(shù)據(jù)管理的咨詢(xún)指導(dǎo)、最佳案例等專(zhuān)門(mén)性服務(wù),英國(guó)的巴斯大學(xué)、比利時(shí)肯特大學(xué)等還將數(shù)據(jù)集、數(shù)據(jù)庫(kù)的公開(kāi)共享納入科研項(xiàng)目以及教師職業(yè)晉升的考核指標(biāo),大學(xué)內(nèi)部多主體的協(xié)同管理成功營(yíng)造了良好的數(shù)據(jù)管理生態(tài),并構(gòu)成研究人員數(shù)據(jù)管理的積極驅(qū)動(dòng)力。
盡管學(xué)會(huì)、理事會(huì)等機(jī)構(gòu)組織形式松散,缺乏數(shù)據(jù)管理的強(qiáng)制執(zhí)行力,但學(xué)會(huì)內(nèi)在的學(xué)術(shù)價(jià)值觀、數(shù)據(jù)文化、群體認(rèn)同等在客觀上會(huì)形成強(qiáng)大的行為約束力。因此,很多學(xué)術(shù)團(tuán)體成為加強(qiáng)生命科學(xué)數(shù)據(jù)管理不可或缺的倡導(dǎo)者、引領(lǐng)者和推動(dòng)者,促使研究人員不斷強(qiáng)化數(shù)據(jù)管理的行為自覺(jué)。2012年,美國(guó)細(xì)胞生物學(xué)學(xué)會(huì)年會(huì)上,研究人員對(duì)于學(xué)術(shù)評(píng)估中期刊影響因子的濫用及其對(duì)研究文化的負(fù)面影響展開(kāi)討論,直接催生了《舊金山研究評(píng)價(jià)宣言》的誕生,并對(duì)研究人員、資助機(jī)構(gòu)、期刊以及研究機(jī)構(gòu)提出了不同的評(píng)價(jià)要求;為進(jìn)一步激發(fā)研究人員數(shù)據(jù)共享熱情,一些研究機(jī)構(gòu)、學(xué)會(huì)開(kāi)始修改其數(shù)據(jù)政策和評(píng)價(jià)制度,如開(kāi)放研究基金會(huì)在其《通過(guò)研究評(píng)估激勵(lì)研究成果共享:資助者實(shí)施藍(lán)圖》的報(bào)告中提出要改變?cè)诟哂绊懥ζ诳习l(fā)表文章是唯一衡量標(biāo)準(zhǔn)的觀念,應(yīng)重視并獎(jiǎng)勵(lì)開(kāi)放數(shù)據(jù)等所有類(lèi)型的研究成果[51]。
4? ?研究結(jié)論與對(duì)策建議
在數(shù)字化時(shí)代,生命科學(xué)數(shù)據(jù)管理不僅貫穿于生命科學(xué)學(xué)術(shù)研究、學(xué)術(shù)傳播的全過(guò)程,而且滲透到醫(yī)療健康管理的各個(gè)層面,數(shù)據(jù)與生命科學(xué)研究的關(guān)系愈加緊密,就愈加需要有充分而高質(zhì)量的數(shù)據(jù)管理機(jī)制來(lái)幫助研究人員乃至患者理解和利用數(shù)據(jù)。同時(shí),生命科學(xué)數(shù)據(jù)管理也是一項(xiàng)復(fù)雜而牽涉面廣泛的系統(tǒng)工程,需要充分調(diào)動(dòng)和吸引研究人員、科研項(xiàng)目資助方、期刊出版部門(mén)、數(shù)據(jù)倉(cāng)儲(chǔ)/平臺(tái)以及學(xué)術(shù)共同體等多責(zé)任主體的參與,并構(gòu)建多主體協(xié)同的生命科學(xué)數(shù)據(jù)管理責(zé)任機(jī)制。
為此,一是要倡導(dǎo)開(kāi)放科學(xué),深化生命科學(xué)數(shù)據(jù)資源開(kāi)發(fā)利用重要性的認(rèn)識(shí),形成數(shù)據(jù)開(kāi)放共享的各方共識(shí);二是要兼顧不同責(zé)任主體的數(shù)據(jù)利益,從激發(fā)主體數(shù)據(jù)管理內(nèi)驅(qū)力入手,如完善科研評(píng)價(jià)制度,調(diào)動(dòng)研究人員數(shù)據(jù)開(kāi)放的主動(dòng)性。再如,加大投入,增強(qiáng)數(shù)據(jù)倉(cāng)儲(chǔ)/平臺(tái)生命科學(xué)數(shù)據(jù)集成與服務(wù)能力,全面提升多主體數(shù)據(jù)管理的源動(dòng)力(見(jiàn)圖5);三是要科學(xué)厘清數(shù)據(jù)管理各環(huán)節(jié)的職責(zé)目標(biāo),形成銜接緊密的責(zé)任閉環(huán),既要保持各環(huán)節(jié)數(shù)據(jù)管理主體職責(zé)履行的獨(dú)立性,也要注重分環(huán)節(jié)主體責(zé)任的傳遞性與銜接性;四是以數(shù)據(jù)倉(cāng)儲(chǔ)/平臺(tái)為依托,建設(shè)多主體共同參與的生命科學(xué)數(shù)據(jù)共享空間,推進(jìn)多元主體數(shù)據(jù)管理業(yè)務(wù)的有效銜接與業(yè)務(wù)協(xié)同,提升整體數(shù)據(jù)管理水平;五是把握生命科學(xué)數(shù)據(jù)管理特點(diǎn),強(qiáng)化數(shù)據(jù)安全與隱私保護(hù)、倫理規(guī)范的制度執(zhí)行,增強(qiáng)研究人員數(shù)據(jù)管理自我約束力,健全數(shù)據(jù)審核機(jī)制與質(zhì)量保障機(jī)制,提高數(shù)據(jù)再利用水平,實(shí)現(xiàn)生命科學(xué)數(shù)據(jù)管理與科學(xué)研究創(chuàng)新和醫(yī)療健康水平的同步發(fā)展。
參考文獻(xiàn):
[1]? Strasser B J.Collecting,Comparing,and Computing Sequences:The Making of Margaret O.Dayhoff's Atlas of Protein Sequence and Structure,1954-1965[J].Journal of the History of Biology,2010,43(4):623.
[2]? Hedrick T E.Justifications for the Sharing of Social Science Data[J].Law & Human Behavior,1988,12(2):163-171.
[3]? Stevens H.The Politics of Sequence:Data Sharing and the Open Source Software Movement[J].Information & Culture:A Journal of History,2015,50(4):465-503.
[4]? Prainsack Barbara.Personalized medicine:Empowered patients in the 21st century?[M].New York:New York University Press,2017.
[5]? 朱彥,賈李蓉,高博,等.中醫(yī)臨床術(shù)語(yǔ)系統(tǒng)v2.0設(shè)計(jì)與構(gòu)建[J].中國(guó)中醫(yī)藥圖書(shū)情報(bào)雜志,2018,42(3):10-15.
[6]? Martin Bobrow.What is"data sharing"and why should biomedical researchers embrace it?[J].Transplantation,2015,99 (4):654-655.
[7]? Goisauf M,Kaya Akyüz,Martin G M.Moving back to the future of big data-driven research:reflecting on the social in genomics[J].Humanities and Social Sciences Communications,2020(7):55.
[8]? Rung J,Brazma A.Reuse of public genome-wide gene expression data[J].Nature Reviews Genetics,2013,14(2):89-99.
[9]? Sherkow,Jacob S.Cancer's IP[J].North Carolina Law Review,2018(96):297-380.
[10]? Bollinger J M,Zuk P D,Majumder M A,et al.What is a Medical Information Commons?[J].The Journal of Law Medicine & Ethics,2019,47(1):41-50.
[11]? Kaye J,Heeney C,Hawkins N,et al.Data sharing in genomics——re-shaping scientific practice[J].Nature Reviews Genetics,2009,10(5):331-335.
[12]? Zimmerman M D,Grabowski M, Domagalski M J,et al.Data Management in the Modern Structural Biology and Biomedical Research Environment[M].Structural Genomics and Drug Discovery,2014:1-25.
[13]? Griffin P C,Khadake J,Lemay K S,et al.Best practice data life cycle approaches for the life sciences[J].F1000research,2017,6:1618.
[14]? Roche D G,Lanfear R,Binning S A,et al.Troubleshooting Public Data Archiving:Suggestions to Increase Participation[J].PLoS Biology,2014,12(1):e1001779.
[15]? Faniel I M,Jacobsen T E.Reusing Scientific Data:How Earthquake Engineering Researchers Assess the Reusability of Colleagues' Data[J].Computer Supported Cooperative Work(CSCW),2010,19(3):355-375.
[16]? Sparks R,Lau W W,Tsang J S.Expanding the Immunology Toolbox:Embracing Public-Data Reuse and Crowdsourcing[J].Immunity,2016,45(6):1191-1204.
[17]? Figueiredo S.Data Sharing:Convert Challenges into Opportunities[J].Frontiers in Public Health,2017,5:327.
[18]? Gardner D,Toga A W,Ascoli G A,et al.Towards effective and rewarding data sharing[J].Neuroinformatics,2003,1(3):289-295.
[19]? Bhattacharya S,Andorf S,Gomes L,et al.ImmPort:disseminating data to the public for the future of immunology[J].Immunologic Research,2014,58(2-3):234-239.
[20]? TFrisby T M,Contreras J L.The National Cancer Institute Cancer Moonshot Public Access and Data Sharing Policy—Initial assessment and implications[J].Data & Policy,2020,2:e9.
[21]? T Tenopir C,Allard S,Sinha P,et al.Data Management Education from the Perspective of Science Educators[J].International Journal of Digital Curation,2016,11(1):232-251.
[22]? Yoon A,Kim Y.The role of data-reuse experience in biological scientists' data sharing:an empirical analysis[J].The Electronic Library,2020,38(1):186-208.
[23]? T Travis K.Sharing Data in Biomedical and Clinical Research[J/OL].[2021-02-20].Science:www.sciencemag.org/careers/2011/02/sharing-data-biomedical-and-clinical-research.
[24]? 關(guān)健.醫(yī)學(xué)科學(xué)數(shù)據(jù)共享與使用的倫理要求和管理規(guī)范(一)前言[J].中國(guó)醫(yī)學(xué)倫理學(xué),2020,33(2):143-146.
[25]? Nebeker C,Torous J,Bartlett Ellis R J.Building the case for actionable ethics in digital health research supported by artificial intelligence[J].BMC Med,2019,17:137.
[26]? Kobayashi S,Kane T B,Paton C.The privacy and security implications of open data in healthcare[J].Year Med Inform,2018,27(1):41-47.
[27]? Duke C S ,Porter J H.The Ethics of Data Sharing and Reuse in Biology[J].Bioscience,2013,63(6):483-489.
[28]? Directorate for Biological Sciences Information about the Data Management Plan Required for all Proposals[EB/OL].[2021-03-02].https://www.nsf.gov/bio/pubs/BIODMP061511_old.pdf.
[29]? Clinical Research Data Management(DMID Policy-013-NCRS 2.2 v2.0)[EB/OL].[2021-03-02].https://www.niaid.nih.gov/sites/default/files/datamanagement.pdf.
[30]? Freeman R E,Evan W M.Corporate Governance:A Stakeholder Interpretation[J].Journal of Behavioral Economics,1990,19(4):337-359.
[31]? Researcherschallenges in sharing data cross geographic borders and disciplines[EB/OL].[2021-03-02].https://group.springernature.com/gp/group/media/press-releases/archive-2018/researchers-challenges-in-sharing-data-cross-geographic-borders-/15545272.
[32]? 何平均,劉思璐.農(nóng)業(yè)基礎(chǔ)設(shè)施PPP投資:主體動(dòng)機(jī)、行為響應(yīng)與利益協(xié)調(diào)——基于利益相關(guān)者理論[J].農(nóng)村經(jīng)濟(jì),2018(1):76-81.
[33]? Sharing Data from Large-scale Biological Research Projects:A System of Tripartite Responsibility[EB/OL].[2021-03-02].https://wellcome.org/sites/default/files/wtd003207.pdf.
[34]? Kaiser J.Open access takes root at National Cancer Institute[J].Science,2019,365(6465):629.
[35]? NCI Cancer Moonshot Public Access and Data Sharing Policy[EB/OL].[2020-08-04].https://www.cancer.gov/research/key-initiatives/oonshot-cancer-initiative/funding/public-access-policy.
[36]? Policy on data,software and materials management and sharing[EB/OL].[2021-03-02].http://welcome.ac.uk/funding/guidance/policy-data-software-materialsmanagement-and-sharing.
[37]? Data,software and materials management and sharing policy[EB/OL].[2021-03-02].https://wellcome.org/grant-funding/guidance/data-software-materials-management-and-sharing-policy.
[38]? 劉燦,王玲,任勝利.數(shù)據(jù)期刊的發(fā)展現(xiàn)狀及趨勢(shì)分析[J].編輯學(xué)報(bào),2018,30(4):18-23.
[39]? Integration of Data and Publications[EB/OL].[2021-03-02].https://www.stm-assoc.org/standards-technology/2020-stm-research-data-year/integration-of-data-and-publications/.
[40]? Data sharing and mining[EB/OL].[2021-03-02].https://royalsociety.org/journals/ethics-policies/data-sharing-minin.
[41]? 陳昕,姜永茂,包雅琳.大數(shù)據(jù)時(shí)代醫(yī)學(xué)期刊數(shù)據(jù)共享方案的實(shí)施探討[J].中國(guó)科技期刊研究,2018(5):474-477.
[42]? Introducing STAR methods[EB/OL].[2021-03-02].https://www.cell.com/star-methods.
[43]? He L,Nahar V.Reuse of scientific data in academic publications:An investigation of Dryad Digital Repository[J].Aslib Journal of Information Management,2014,68(4):478-494.
[44]? Editorial policies[EB/OL].[2021-03-02].www.biomedcentral.com/about/editorialpolicies#DataandMaterialRelease.
[45]? 2019 Bioinformatics and Biological Resources(BBR)Fund[EB/OL].[2019-12-13].https://webarchive.nationalarchives.gov.uk/20200930155721/https://bbsrc.ukri.org/funding/filter/2019-bioinformatics-biological-resources-fund/.
[46]? 趙安琪,付少雄,馮亞飛.國(guó)外健康科學(xué)數(shù)據(jù)管理實(shí)踐及啟示[J].圖書(shū)情報(bào)知識(shí),2020(1):105-114.
[47]? 袁夢(mèng)雪.國(guó)內(nèi)外健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺(tái)對(duì)比分析[J].數(shù)字圖書(shū)館論壇,2020(1):11-19.
[48]? Enhanced Data Sharing Working Group Recommendation[EB/OL].[2021-03-02].https://www.cancer.gov/research/key-initiatives/moonshot-cancer-initiative/blue-ribbon-panel/enhanced-data-sharing-working-group-report.pdf.
[49]? Vasilevsky N A,Minnier J,Haendel M A,et al.Reproducible and reusable research:are journal data sharing policies meeting the mark?[J].Peer J,2017,5(10):e3208.
[50]? RESEARCH DATA MANAGEMENT POLICY 2014[EB/OL].[2021-03-02].http://sydney.edu.au/policies/showdoc.aspx?recnum=PDOC2013/337.
[51]? Incentivization Blueprint[EB/OL].[2021-03-02].https://www.orfg.org/incentivization-blueprint.
作者簡(jiǎn)介:夏義堃,女,武漢大學(xué)信息資源研究中心教授,研究方向:政府?dāng)?shù)據(jù)治理;管茜,女,武漢大學(xué)信息管理學(xué)院碩士研究生;周艷,女,湖北國(guó)際旅行衛(wèi)生保健中心工程師。