文 /Stefan Br?se,Britta Nestler
每一個實驗室都會承擔多個科研項目 // 每一個科研項目的完成都需要許多人的合作,科研項目的進行也需要信息自由地交流,然而數(shù)據(jù)在交換時常會遇到了一些阻力。Karsruhe市建造的數(shù)據(jù)管理和數(shù)據(jù)分析能力中心有望解決這一問題,利用統(tǒng)一的數(shù)字化平臺處理來自科研實驗中的一系列數(shù)據(jù)。
大多數(shù)情況下,實驗數(shù)據(jù)和模擬分析數(shù)據(jù)的產(chǎn)生和存儲,都消耗了大量的人力、物力和財力,這些數(shù)據(jù)對科研實驗非常重要??梢蚤L久地保存和利用這些數(shù)據(jù)有著非常重要的意義。數(shù)據(jù)的丟失也就意味著丟失了已經(jīng)獲得的知識。人工智能的快速發(fā)展都是建立在大數(shù)據(jù)基礎之上的,同時,人工智能也將是未來實驗室發(fā)展的方向,因此,可持續(xù)發(fā)展科研數(shù)據(jù)庫就更有價值了。
由于缺少高效管理科研數(shù)據(jù)所需的基礎設施和軟件,科研人員在處理科研數(shù)據(jù)時經(jīng)常會遇到一些障礙。這一缺失直接導致自然科學和工程學科研領域中的許多研究數(shù)據(jù)無法長期保存和使用。這不僅影響到專業(yè)領域內(nèi)部數(shù)據(jù)的應用問題,而且也影響到跨學科領域的數(shù)據(jù)應用問題。2019年7月,Karlsruhe理工學院(KIT)與Karlsruhe大學、Karlsruhe FIZ萊布尼茨信息基礎設施研究所合作,建立了MoMaF科研數(shù)據(jù)中心SDC。它將幫助研發(fā)團隊克服科研數(shù)據(jù)管理中存在的障礙。由于自然科學和工程科學領域中的許多專業(yè)是相互交織、相互配合的,它們的科研數(shù)據(jù)和科研成果也常??梢杂糜陔p方的科學研究,因此,MoMaF數(shù)據(jù)中心不僅支持本學科領域中的科研工作,也支持跨學科相關領域中的科學研究工作。
SDC科研數(shù)據(jù)中心將通過下述方法為科學研究人員提供支持和幫助:
■開發(fā)電子實驗室期刊,并將其作為科研工作中有用的虛擬工作環(huán)境;
■建立發(fā)布和保存數(shù)據(jù)的資料庫;
■為科研數(shù)據(jù)的管理和數(shù)據(jù)分析做好推薦服務工作,建立數(shù)據(jù)推薦服務系統(tǒng)。
■開發(fā)各個主管部門、外部數(shù)據(jù)庫與內(nèi)部資源適用的接口。
■整合現(xiàn)有資源,例如科研數(shù)據(jù)存儲和分類歸檔。
這些措施是通過Karlsruhe理工學院KIT和合作伙伴Karlsruhe大學(Hs-Ka)、Karlsruhe萊布尼茨信息基礎設施研究所(FIZ)中的不同工作組來貫徹落實的。優(yōu)勢互補的相互結(jié)合能夠制定出以實踐為主導的科研數(shù)據(jù)管理的整體方案。
電子實驗室期刊ELNs和數(shù)據(jù)儲存庫是SDC科研數(shù)據(jù)中心的兩大支柱,能為科研人員當前的文件資料編撰提供更好的支持和幫助。SDC科研數(shù)據(jù)中心開發(fā)的應用軟件簡化了科研工作的日常工作流程,為用戶提供了優(yōu)質(zhì)的服務,從而能夠吸引更多的科研人員使用這一軟件產(chǎn)品。另外,所有的科研人員都擁有開發(fā)許可證,這就能夠構(gòu)建更加廣泛的用戶群和開發(fā)者社區(qū)。
數(shù)據(jù)中心開發(fā)的電子實驗室期刊軟件是在Chemotion ELN電子實驗室筆記本項目基礎之上進行的。電子實驗室期刊軟件的開發(fā)由有機化學研究所、Steinbuch計算中心和KIT的圖書館等部門共同籌備,并在多個綜合小組開展測試?,F(xiàn)在已經(jīng)可以使用的源代碼最初是為有機化學領域的科學家使用而編寫的,現(xiàn)在正在逐步地推廣到相鄰專業(yè)領域中使用。電子實驗室期刊軟件開發(fā)方的模塊化方案能夠滿足不同實驗室用戶在實驗分析和模擬計算時的不同要求。對于有著相似工作過程和分析過程的科研領域,只需要對電子實驗室筆記本軟件補充幾個模塊,就能保證其功能和應用。在MoMaF數(shù)據(jù)中心框架內(nèi)的ELN電子實驗室筆記本軟件將由專門小組安裝在各個相關研究所的計算機中,保證了系統(tǒng)里的科研數(shù)據(jù)和各種當前科研信息不會被泄漏,被帶出實驗室。SDC科研數(shù)據(jù)中心將伴隨和服務用戶使用電子實驗室期刊的全過程。
每一個研究所的電子實驗室期刊軟件都可以將數(shù)據(jù)按照交互操作的方式傳輸給獨立運行的科研數(shù)據(jù)庫,這就使得科研人員不但可以隨時更新是數(shù)據(jù)庫,還能夠獲取更多的科研數(shù)據(jù)和信息。最初,科研人員需要將ELN電子實驗室筆記本中的數(shù)據(jù)傳輸?shù)終IT理工學院負責運營的數(shù)據(jù)中心,還要對數(shù)據(jù)中心的審查過程提供支持?,F(xiàn)在,電子實驗室期刊軟件可以幫助每一個科研人員毫不費力地將數(shù)據(jù)直接傳輸?shù)綌?shù)據(jù)庫。從長期發(fā)展的角度來看,通過這種方式源源不斷地提供數(shù)據(jù)將有利于各個專業(yè)專用數(shù)據(jù)庫的建設。有些數(shù)據(jù)因缺少專業(yè)性而不被關注,并很少被重復使用,而那些有著明確專業(yè)性的數(shù)據(jù)、信息將成為科研工作的主要信息來源。在KIT管理學院建成的Chemotion資料庫已經(jīng)可以在科研項目的第一個階段中應用了,并為其它領域的科研項目提供了示范。
上述電子實驗室期刊和資料庫的發(fā)展離不開基礎設施和專業(yè)技術的支持。其中的基礎設施包括了實現(xiàn)計劃工作所需的數(shù)據(jù)存儲能力和計算能力。技術支持包括了各個ELN電子實驗室筆記和資料庫之間的接口。另外,還有以FAIR公平數(shù)據(jù)原則為主導的最佳實踐模型也是電子實驗室期刊和資料庫擴展的基礎。這一擴展不僅需要有收集、整合原數(shù)據(jù)的解決方案,而且也需要從法律的角度考慮SDC科研數(shù)據(jù)中心的研發(fā)設計儲存問題。