王 卓 宋丹戎 許 斌 羅薛超 魏江林 魏學(xué)棟
(1.中南大學(xué),湖南 長沙 410083; 2.成都材智科技有限公司,四川 成都 610041; 3.中國核動力研究設(shè)計院,四川 成都 610213; 4.核反應(yīng)堆系統(tǒng)設(shè)計技術(shù)重點實驗室,四川 成都 610213)
傳統(tǒng)材料數(shù)據(jù)庫的主要功能是數(shù)據(jù)存儲和數(shù)據(jù)管理,同時還提供數(shù)據(jù)檢索服務(wù),方便用戶快速獲取感興趣的數(shù)據(jù)信息。隨著計算機技術(shù)的普及和進(jìn)步,材料數(shù)據(jù)庫趨于網(wǎng)絡(luò)化、商業(yè)化、標(biāo)準(zhǔn)化及智能化,材料數(shù)據(jù)庫功能得到快速發(fā)展。國外有名的材料數(shù)據(jù)庫有美國MatWeb和NIST在線數(shù)據(jù)庫、日本國立材料科學(xué)研究院NIMS材料數(shù)據(jù)庫、英國NPL、GrantaMI材料數(shù)據(jù)庫、MaterialCenter材料數(shù)據(jù)管理系統(tǒng)、德國Key to Steel數(shù)據(jù)庫和瑞士Total Material材料性能數(shù)據(jù)庫等[1]。這些數(shù)據(jù)庫既支持用戶對材料數(shù)據(jù)的查詢,也滿足數(shù)據(jù)的錄入和管理,還可以靈活地導(dǎo)入和導(dǎo)出數(shù)據(jù)以及與CAE、ANSYS等外部工具的集成[2]。隨著美國材料基因組理念的提出[3],材料數(shù)字化軟件已成為材料數(shù)據(jù)庫新的發(fā)展方向。在材料基因工程框架下的材料數(shù)字化平臺基于數(shù)據(jù)庫、材料信息學(xué)、大數(shù)據(jù)、機器學(xué)習(xí)等技術(shù),對試驗數(shù)據(jù)、計算數(shù)據(jù)、系統(tǒng)數(shù)據(jù)、網(wǎng)絡(luò)數(shù)據(jù)及文獻(xiàn)數(shù)據(jù)進(jìn)行高效集成,通過信息化技術(shù)對大規(guī)模、多源異構(gòu)的材料數(shù)據(jù)進(jìn)行處理分析,從而具備進(jìn)行材料“基因組”整合、知識再發(fā)現(xiàn)、數(shù)據(jù)資源共享及跨平臺協(xié)同研究等方面的功能。本文詳述了結(jié)合核電領(lǐng)域典型應(yīng)用場合的核電材料數(shù)字化平臺的建設(shè)方案及功能。
本核電材料數(shù)字化平臺包括網(wǎng)絡(luò)資源采集、文檔數(shù)據(jù)處理、數(shù)據(jù)庫管理、核電材料數(shù)據(jù)應(yīng)用等4個系統(tǒng),如圖1所示。
圖1 核電材料數(shù)字平臺架構(gòu)示意圖Fig.1 Architecture of digital platform for nuclear power materials
要使材料數(shù)據(jù)應(yīng)用全面進(jìn)入科學(xué)探索的第四范式,必須先解決材料數(shù)據(jù)缺乏這一全球性難題[4]。因此,數(shù)據(jù)采集功能決定平臺對各類設(shè)備、計算軟件、系統(tǒng)、網(wǎng)站的連接能力,也決定數(shù)據(jù)庫的規(guī)模和活力??茖W(xué)研究第四范式下的全新的材料科學(xué)研究方式,要求軟件能夠快速、準(zhǔn)確地獲取各個來源的關(guān)鍵數(shù)據(jù)。
本文開發(fā)在線數(shù)據(jù)資源的采集技術(shù),將網(wǎng)絡(luò)資源采集系統(tǒng)用于對材料領(lǐng)域重要的在線數(shù)據(jù)庫的數(shù)據(jù)實現(xiàn)定向采集。用戶可在系統(tǒng)中錄入在線數(shù)據(jù)庫的網(wǎng)址,以設(shè)置關(guān)鍵詞的方式實現(xiàn)數(shù)據(jù)篩選和定向采集。本文主要針對核電材料的在線數(shù)據(jù)以及相關(guān)網(wǎng)絡(luò)資源進(jìn)行采集,從而構(gòu)建參考數(shù)據(jù)庫。
文獻(xiàn)是科學(xué)與技術(shù)的載體,對海量文獻(xiàn)中有價值信息的提取將極大提高數(shù)據(jù)庫的質(zhì)量和數(shù)量規(guī)模。文獻(xiàn)數(shù)據(jù)的采集分為4類,即文本數(shù)據(jù)、表格數(shù)據(jù)、圖表數(shù)據(jù)和圖片數(shù)據(jù)的采集。文獻(xiàn)數(shù)據(jù)的采集尚無普遍適用的技術(shù),目前主要以機器學(xué)習(xí)、數(shù)據(jù)挖掘、深度學(xué)習(xí)等方法為主。Kim等[5]通過以機器學(xué)習(xí)方法構(gòu)建的軟件,能夠自動閱讀材料科學(xué)期刊論文獲取金屬氧化物合成條件等相關(guān)信息,為文獻(xiàn)文本數(shù)據(jù)的自動采集提供了便利。Swain等[6]設(shè)計的表格解析軟件可以直接提取表格中的數(shù)據(jù)。曾德華等[7]針對各類標(biāo)準(zhǔn)對應(yīng)的材料手冊開發(fā)出適應(yīng)性廣泛的材料性能表格數(shù)據(jù)化工具,將手冊中的材料性能參數(shù)和試驗技術(shù)狀態(tài)數(shù)據(jù)解析成可以被軟件存儲、識別的數(shù)據(jù)化XML數(shù)據(jù)。對于圖片數(shù)據(jù)的采集,如金屬材料顯微組織的自動分類,研究者采用數(shù)據(jù)挖掘和深度學(xué)習(xí)的方法獲得非常準(zhǔn)確的結(jié)果[8-9]。
文檔數(shù)據(jù)處理系統(tǒng)用于材料研究或?qū)ρb備設(shè)計中涉及到的重要文獻(xiàn)數(shù)據(jù)進(jìn)行高效提取。平臺對文獻(xiàn)文檔利用OCR識別技術(shù)和差異化識別技術(shù)進(jìn)行結(jié)構(gòu)化數(shù)據(jù)(題錄、段落數(shù)據(jù)、表格)和非結(jié)構(gòu)化數(shù)據(jù)(曲線、圖片)等的提取。本文主要對ASME BPVC第II卷D篇中的表格數(shù)據(jù)實現(xiàn)提取。
核電材料數(shù)據(jù)庫管理系統(tǒng)通過集成網(wǎng)絡(luò)資源采集系統(tǒng)、文獻(xiàn)數(shù)據(jù)處理系統(tǒng)中的數(shù)據(jù)以及錄入核電材料牌號性能數(shù)據(jù),從而構(gòu)建專業(yè)數(shù)據(jù)庫。各個來源匯聚的核電材料數(shù)據(jù),包括化學(xué)成分、組織結(jié)構(gòu)、物理性能、力學(xué)性能、服役性能、熱處理工藝、測試條件、分析結(jié)果和文獻(xiàn)等,數(shù)據(jù)的形式多種多樣,不僅包括常見的數(shù)據(jù)和文本字段,還有圖片、曲線、表格及文檔等的數(shù)據(jù)形式,需要對材料數(shù)據(jù)指標(biāo)的描述進(jìn)行統(tǒng)一,經(jīng)過標(biāo)準(zhǔn)化和規(guī)范化處理后導(dǎo)入系統(tǒng)。這些材料數(shù)據(jù)的特點和應(yīng)用需求對核電材料數(shù)據(jù)庫管理系統(tǒng)的實現(xiàn)提出了挑戰(zhàn)。因此,系統(tǒng)提供數(shù)據(jù)庫設(shè)計、數(shù)據(jù)管理、數(shù)據(jù)可視化、數(shù)據(jù)關(guān)聯(lián)、權(quán)限管理等功能,以較好的擴(kuò)展性與靈活性的功能高效便捷實現(xiàn)核電材料數(shù)據(jù)管理的系統(tǒng)化、結(jié)構(gòu)化、標(biāo)準(zhǔn)化、完整化。
數(shù)據(jù)庫設(shè)計功能根據(jù)特定材料領(lǐng)域數(shù)據(jù)體系特點進(jìn)行系統(tǒng)化與結(jié)構(gòu)化的無代碼設(shè)計。數(shù)據(jù)庫設(shè)計工具提供多級容器實現(xiàn)數(shù)據(jù)庫樹形結(jié)構(gòu)的設(shè)計。如圖2所示,多級容器包括根系統(tǒng)(1級)、數(shù)據(jù)庫文件夾(2級)、數(shù)據(jù)庫(3級)、數(shù)據(jù)表分組(4級)、數(shù)據(jù)表(5級)、文件夾(6級),各級容器可添加多個下級容器,其中文件夾容器支持多個層級的子文件夾的添加。各級容器均可以提供專業(yè)數(shù)據(jù)庫的應(yīng)用場景和數(shù)據(jù)內(nèi)容進(jìn)行自定義命名。
圖2 多級容器樹形結(jié)構(gòu)示意圖Fig.2 Schematic diagram of the tree structure for multi-level containers
材料數(shù)據(jù)庫的結(jié)構(gòu)和內(nèi)容可隨著數(shù)據(jù)體系的發(fā)展進(jìn)行擴(kuò)展,從而保障數(shù)據(jù)庫內(nèi)容的持續(xù)開發(fā)。系統(tǒng)提供的多級容器可以通過3種方式不同程度地實現(xiàn)數(shù)據(jù)庫的擴(kuò)展,分別為:(1)新建根系統(tǒng),根據(jù)新的專業(yè)數(shù)據(jù)庫建設(shè)需求,擴(kuò)展新的數(shù)據(jù)庫體系;(2)新建數(shù)據(jù)庫文件夾、數(shù)據(jù)庫或數(shù)據(jù)表,根據(jù)原材料數(shù)據(jù)體系管理需求的擴(kuò)展,在這三級容器上進(jìn)行擴(kuò)展,構(gòu)建新的數(shù)據(jù)庫內(nèi)容;(3)新增數(shù)據(jù)表中材料數(shù)據(jù)字段屬性,在原表單數(shù)據(jù)內(nèi)容基礎(chǔ)上設(shè)計新的材料數(shù)據(jù)字段,進(jìn)而逐步完善現(xiàn)有材料數(shù)據(jù)體系,而不影響原數(shù)據(jù)的管理。
數(shù)據(jù)管理功能用于多源異構(gòu)數(shù)據(jù)管理表單的設(shè)計與標(biāo)準(zhǔn)化管理,實現(xiàn)數(shù)據(jù)指標(biāo)的設(shè)計,用戶可以自定義設(shè)計指標(biāo)名稱和指標(biāo)代表符號。系統(tǒng)還提供單位管理,用戶可以自定義單位,單位之間可以實現(xiàn)自動轉(zhuǎn)化。當(dāng)用戶錄入或?qū)霐?shù)據(jù)時,只需進(jìn)行數(shù)據(jù)的操作即可,數(shù)據(jù)將與已設(shè)計好的指標(biāo)名稱、指標(biāo)代表符號和單位進(jìn)行組合,實現(xiàn)標(biāo)準(zhǔn)化與規(guī)范化處理。目前數(shù)據(jù)表單提供20種通用的數(shù)據(jù)類型屬性和多種材料專業(yè)數(shù)據(jù)類型屬性,可涵蓋核電材料的所有數(shù)據(jù)類型,確保數(shù)據(jù)跨庫查詢、對比以及數(shù)據(jù)應(yīng)用分析結(jié)果的準(zhǔn)確性。數(shù)據(jù)可視化功能支持對材料多維數(shù)據(jù)的可視化呈現(xiàn)。數(shù)據(jù)關(guān)聯(lián)功能用于材料數(shù)據(jù)之間建立聯(lián)系以提高數(shù)據(jù)的完整性,如成分-工藝-組織-性能數(shù)據(jù)關(guān)聯(lián)、測試表征數(shù)據(jù)與設(shè)備基本參數(shù)指標(biāo)關(guān)聯(lián)、文獻(xiàn)數(shù)據(jù)與參考文獻(xiàn)關(guān)聯(lián)。
核電材料數(shù)據(jù)應(yīng)用系統(tǒng)提供材料查詢、材料審核、牌號對照、選材用材、數(shù)據(jù)接口等功能,對專業(yè)數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行應(yīng)用。
核電材料數(shù)據(jù)庫(尤其是金屬結(jié)構(gòu)材料)的設(shè)計、開發(fā)與集成應(yīng)用是核電材料數(shù)字化平臺的重要組成部分。核電金屬結(jié)構(gòu)材料服役數(shù)據(jù)、設(shè)計數(shù)據(jù)及標(biāo)準(zhǔn)中材料牌號性能數(shù)據(jù)的綜合利用將大大提高核電設(shè)計人員進(jìn)行材料查詢、材料對比、選材用材的效率,以及為工程技術(shù)人員在反應(yīng)堆運行中安全評估提供幫助。
在核電領(lǐng)域,歐洲的聚變材料數(shù)據(jù)庫(Fusion Materials Database)是一款集數(shù)據(jù)下載、瀏覽、檢索以及提交等多種功能于一體的在線數(shù)據(jù)庫,涵蓋原始試驗數(shù)據(jù)、專家組認(rèn)證數(shù)據(jù)及相關(guān)電子報告[10];歐洲原子能共同體建設(shè)的MatDB數(shù)據(jù)庫,主要服務(wù)于第四代反應(yīng)堆,可通過材料牌號、性能指標(biāo)等條件進(jìn)行數(shù)據(jù)篩選,數(shù)據(jù)內(nèi)容涵蓋數(shù)據(jù)來源、材料尺寸、化學(xué)成分、材料工藝、測試條件及性能數(shù)據(jù),部分?jǐn)?shù)據(jù)以圖表展示;日本的核材料數(shù)據(jù)庫(Data-Free-Way)整合了大量材料輻照性能數(shù)據(jù),并具有數(shù)據(jù)繪圖等拓展功能[11];我國的核反應(yīng)堆材料數(shù)據(jù)庫(NRMD,nuclear reactor material database)具備材料性能數(shù)據(jù)查詢、比較分析及下載等功能[12]。
核電材料數(shù)字化平臺構(gòu)建了3個核電結(jié)構(gòu)材料數(shù)據(jù)庫,即參考數(shù)據(jù)庫、ASME數(shù)據(jù)庫和牌號數(shù)據(jù)庫,其中參考數(shù)據(jù)庫包含6 492條數(shù)據(jù)(圖3)、ASME數(shù)據(jù)庫包含10 718條數(shù)據(jù)(以ASME BPVC第II卷D篇中的數(shù)據(jù)為主)、牌號數(shù)據(jù)庫包括51個國內(nèi)外常用金屬材料牌號。平臺后續(xù)建設(shè)可利用數(shù)據(jù)庫管理系統(tǒng)中數(shù)據(jù)庫設(shè)計功能擴(kuò)展新的數(shù)據(jù)庫。用戶可按需設(shè)計數(shù)據(jù)庫結(jié)構(gòu),通過導(dǎo)入材料數(shù)據(jù)構(gòu)建新的專業(yè)數(shù)據(jù)庫。
圖3 核電材料數(shù)字化平臺的參考數(shù)據(jù)庫Fig.3 Reference database of the material digitization platform in the field of nuclear power
為了滿足工程設(shè)計人員對材料性能數(shù)據(jù)的權(quán)威要求,所有入庫的數(shù)據(jù)必須經(jīng)過嚴(yán)格的專家審核后才能通過管理員對數(shù)據(jù)進(jìn)行發(fā)布。未發(fā)布的材料數(shù)據(jù)無法通過材料查詢、材料對照、選材用材、數(shù)據(jù)接口等進(jìn)行使用。平臺管理員可通過權(quán)限管理的功能,賦予用戶不同的角色,如數(shù)據(jù)錄入人員、數(shù)據(jù)審核人員、數(shù)據(jù)查看人員。數(shù)據(jù)錄入人員完成數(shù)據(jù)錄入后,將新的數(shù)據(jù)記錄提交審核。如圖4所示,數(shù)據(jù)審核人員將收到審核提醒,提醒信息中包含數(shù)據(jù)記錄名稱、數(shù)據(jù)錄入人員姓名、創(chuàng)建時間、數(shù)據(jù)鏈接及流程信息。
圖4 數(shù)據(jù)審核提醒信息Fig.4 Reminder message for data audit
材料查詢是平臺的基本應(yīng)用功能之一,用戶可根據(jù)關(guān)鍵詞或數(shù)據(jù)范圍快速篩選查找數(shù)據(jù),能夠滿足比較復(fù)雜的檢索需求。核電設(shè)計人員通過材料信息的篩選,獲知滿足工程部件適用的材料及相關(guān)信息。
材料查詢應(yīng)用支持自定義檢索字段、組合檢索、全文檢索等功能。如圖5所示,用戶可以按照材料、成分、性能分別進(jìn)行搜索,也可將材料-成分-性能進(jìn)行組合檢索,檢索項數(shù)可根據(jù)需求增加。對不同類型的字段提供不同檢索規(guī)則,實現(xiàn)數(shù)據(jù)的精準(zhǔn)判定。材料查詢應(yīng)用支持文本、數(shù)值、枚舉、表格、附件等類型的字段數(shù)據(jù)進(jìn)行檢索。
圖5 材料-成分-性能組合檢索Fig.5 Searching by material-composition-property
國際上的核電運作建設(shè)包括ASME體系、俄羅斯體系、法國RCC-M體系、加拿大CANDU體系和德國KTA體系等,不同體系的壓水堆中所用關(guān)鍵材料有所不同但比較接近。我國核電材料標(biāo)準(zhǔn)體系正在建立中,目前主要采用了引進(jìn)技術(shù)中的一些國外牌號材料。牌號對照功能對于金屬材料的工程應(yīng)用研究具有非常重要的意義。牌號對照功能利用材料化學(xué)成分自動匹配技術(shù),實現(xiàn)中國和美國、法國、俄羅斯等多個國家金屬材料牌號的快速對照和匹配檢索。如圖6所示,用戶對金屬材料牌號進(jìn)行詳細(xì)信息查詢時,牌號對照功能將自動匹配多個國家相似牌號的信息,包括所屬國家、標(biāo)準(zhǔn)體系、標(biāo)準(zhǔn)編號等。用戶點擊相似牌號的名稱將跳轉(zhuǎn)到數(shù)據(jù)詳情頁面,從而查看化學(xué)成分、物理性能、室溫力學(xué)性能、高/低溫力學(xué)性能曲線、許用應(yīng)力曲線等信息(圖7)。
圖6 材料牌號對照匹配結(jié)果Fig.6 Result of material grade matching
圖7 材料牌號數(shù)據(jù)詳情頁面Fig.7 Details of Material grade data
選材用材功能提供可視化分析工具對材料數(shù)據(jù)庫中的數(shù)據(jù)和性能曲線進(jìn)行聯(lián)動分析,實現(xiàn)材料牌號性能的批量、多維度、高效分析,能夠幫助核電設(shè)計人員快速找到適合應(yīng)用工況的材料牌號。
用戶批量選取數(shù)據(jù)列表中的數(shù)據(jù)記錄,加入到選材用材應(yīng)用中進(jìn)行分析。選材用材應(yīng)用提供表格、散點圖和曲線圖等3種工具進(jìn)行分析。用戶確定對比材料種類后,可自定義配置圖表的X/Y軸變量、數(shù)據(jù)擬合、坐標(biāo)軸、標(biāo)題、圖例等信息,其中數(shù)據(jù)擬合方式包括線性擬合、多項式擬合、指數(shù)擬合和對數(shù)擬合。在圖表繪制完成后,用戶對特定區(qū)域放大、縮小、懸停查看等功能進(jìn)行數(shù)據(jù)的動態(tài)交互,通過不斷縮小滿足性能需求的數(shù)據(jù)范圍,鎖定預(yù)選的材料牌號(圖8)。
圖8 選材用材分析界面Fig.8 Analysis interface of material selection and application
核電材料數(shù)字化平臺還可為多種CAD/CAE/PLM系統(tǒng)開發(fā)數(shù)據(jù)訪問接口。在核電設(shè)計過程中,工程設(shè)計人員可以通過數(shù)據(jù)接口直接在外部軟件系統(tǒng)界面訪問材料數(shù)據(jù)庫, 從而查詢與應(yīng)用數(shù)據(jù)。本平臺與Simens Teamcenter PLM系統(tǒng)實現(xiàn)了數(shù)據(jù)協(xié)同?;赥eamcenter PLM系統(tǒng)和開發(fā)環(huán)境,平臺中材料數(shù)據(jù)庫和Teamcenter PLM系統(tǒng)進(jìn)行了無縫集成。用戶在Teamcenter PLM系統(tǒng)中,通過設(shè)計開發(fā)的材料數(shù)據(jù)庫使用界面,根據(jù)材料牌號索引選取對應(yīng)的材料數(shù)據(jù),并通過查詢接口進(jìn)入材料數(shù)據(jù)庫數(shù)據(jù)記錄詳情界面進(jìn)行信息的查詢和使用,從而快速地進(jìn)行模型材料屬性的構(gòu)建,輔助完成CAD建模和有限元分析。
隨著科技技術(shù)的高速發(fā)展,基于材料基因工程理念的材料數(shù)字化平臺融合了材料科學(xué)、 信息科學(xué)、軟件工程、先進(jìn)試驗方法等學(xué)科,采用數(shù)據(jù)庫、計算模擬、數(shù)據(jù)挖掘、人工智能等技術(shù)實現(xiàn)了材料數(shù)據(jù)的高效采集、智能管理、多維分析及深度應(yīng)用,推動了新材料研發(fā)及材料在裝備制造領(lǐng)域中研究應(yīng)用方式。本文詳細(xì)介紹了核電材料數(shù)字化平臺的建設(shè)方案,并從材料審核、材料查詢、牌號對照、選材用材、數(shù)據(jù)接口等幾個方面詳述了該平臺的功能和應(yīng)用,展示了平臺在核電材料數(shù)字化協(xié)同中的重要作用。核電材料數(shù)字化平臺將為技術(shù)人員在反應(yīng)堆設(shè)計中提供高效工具和高價值的材料數(shù)據(jù)。