任程 郭云峰 丁國徽 許俊 王萍萍
摘 要:隨著信息技術的發(fā)展,人類生物信息得到越來越廣泛地挖掘和應用。本文圍繞人類生物信息在生物特征識別和生物醫(yī)學領域的應用展開討論,闡述了人類生物信息應用標準化要點,探討分析了標準化發(fā)展情況及典型標準,并給出了人類生物信息標準化建設的建議,期望為后續(xù)人類生物信息研究和標準化工作提供參考。
關鍵詞:生物信息,生物特征識別,生物醫(yī)學,信息安全,標準化
DOI編碼:10.3969/j.issn.1002-5944.2023.13.009
基金項目:本文受上海市2022年度“科技創(chuàng)新行動計劃”技術標準項目“人類生物信息安全關鍵技術研究及標準研制”(項目編號:22DZ2205300)資助。
Research on Application Standardization of the Human Biological Information
REN Cheng GUO Yun-feng* DING Guo-hui XU Jun WANG Ping-ping
(International Human Phenome Institutes, Shanghai)
Abstract: With the development of information technology, human biological information has been mined and applied more and more widely. Focusing on the application of human biological information in biometric recognition and biomedicine, this paper discusses the main points of application standardization of human biological information, and analyzes the development of standardization and typical standards. It also puts forward suggestions for human biological information standardization so as to provide references for further human biological information research and standardization.
Keywords: biological information, biometric recognition, biomedicine, information security, standardization
0 引 言
人類生物信息蘊含重大的經(jīng)濟社會價值,是一種重要的國家戰(zhàn)略資源。隨著大數(shù)據(jù)時代的高速發(fā)展,人類生物信息數(shù)量呈爆炸式增長,基于人類生物信息的開發(fā)利用和安全保護成為重點研究領域。開展人類生物信息標準化研究,運用標準化手段厘清人類生物信息應用模式,提高技術創(chuàng)新和安全管理水平,是對《中華人民共和國人類遺傳資源管理條例》《中華人民共和國個人信息保護法》《中華人民共和國生物安全法》《中華人民共和國數(shù)據(jù)安全法》等法律法規(guī)的貫徹落實,是“加快標準化、規(guī)范化的人類遺傳資源保藏基礎平臺和人類遺傳資源大數(shù)據(jù)建設,為開展相關研究開發(fā)活動提供支撐”“制定和完善生物安全領域相關標準”“推進數(shù)據(jù)開發(fā)利用技術和數(shù)據(jù)安全標準體系建設”等要求的具體實踐,對發(fā)揮標準對于行業(yè)發(fā)展的引領支撐作用具有重要意義。
1 人類生物信息概述
1.1 定義
人類生物信息包含以下兩類:遺傳信息,通常包括由DNA、RNA和蛋白質等生物大分子所攜帶的信息;非遺傳信息,包括各類診療數(shù)據(jù)、臨床試驗數(shù)據(jù)、研究數(shù)據(jù)等[1]。
1.2 應用
生物識別信息攜帶著每個生物不同的特征信息,具有唯一性和穩(wěn)定性。基于此物理特征開發(fā)出來的人臉識別、指紋識別、虹膜識別等生物特征識技術廣泛應用于安防、金融、教育等領域。生物特征識別技術是通過提取生物信息特征,并與數(shù)據(jù)庫中已有的模板數(shù)據(jù)進行比對,來實現(xiàn)1:N的身份識別和1:1的身份鑒定。人類生物信息在生物醫(yī)學領域的應用研究,已逐步由遺傳信息向非遺傳信息轉變[1]。目前圍繞基因組學、轉錄組學、蛋白質組學和代謝組學等各類組學數(shù)據(jù)與個人的健康生理信息發(fā)展起來的新型醫(yī)療模式——精準醫(yī)療產(chǎn)業(yè)集群正在逐步形成。主要是對大樣本人群與特定疾病進行整合分析與標準化處理,建立不同數(shù)據(jù)之間的關聯(lián)性和差異性,對病理發(fā)生發(fā)展的過程建立定量模型,提出假設與驗證,從而尋找到特定人群甚至個體疾病的精確原因和治療靶點,最終實現(xiàn)對疾病和特定病患進行個性化精準預防和治療的目的[2]。
2 人類生物信息應用標準化要點
2.1 關鍵技術
生物特征識別技術實現(xiàn)過程中,主要包括生物特征樣本采集技術、生物特征樣本預處理技術、生物特征建模與比對技術、呈現(xiàn)攻擊檢測技術、生物特征識別系統(tǒng)性能評價技術[3]。除了確定生物特征識別系統(tǒng)或設備的功能和性能指標之外,還需考慮技術實現(xiàn)方案的互聯(lián)互通。
在生物醫(yī)學領域,各類組學數(shù)據(jù)、健康生理數(shù)據(jù)等來源廣泛且分散、類型多樣,若要實現(xiàn)對這些數(shù)據(jù)的充分挖掘和深入研究,需要建立完善的生物數(shù)據(jù)資源收集和管理體系、信息共享系統(tǒng),在術語定義、數(shù)據(jù)質量、數(shù)據(jù)格式等方面統(tǒng)一的基礎上[4],完成數(shù)據(jù)分析、解釋和共享,才能實現(xiàn)數(shù)據(jù)價值的最大化。
2.2 安全保護
人類生物信息安全涉及數(shù)據(jù)安全和隱私保護兩個方面,數(shù)據(jù)安全貫穿著數(shù)據(jù)全生命周期,面臨著數(shù)據(jù)泄漏、篡改、丟失、損壞或被非法獲取、非法利用等安全風險。近年來,生物特征識別最為突出的安全風險是在信息采集階段識別系統(tǒng)被偽造攻擊等技術破解,比如利用指紋膜、3D人臉面具、合成語音等人造或模仿的生物特征攻擊識別系統(tǒng)[5]。在生物醫(yī)學領域,除了防范基礎設施、信息系統(tǒng)、網(wǎng)絡安全等方面的安全風險,還需注重不同應用場景下使用數(shù)據(jù)的安全性。
如何保障人類生物信息安全,促進數(shù)據(jù)合法、安全、有效流通,充分發(fā)揮數(shù)據(jù)價值,是生物特征識別和生物醫(yī)學領域面臨的重要課題。從技術角度,采用加密存儲、加密傳輸、身份權限控制等方式保證數(shù)據(jù)存儲的安全,采用替代、混洗、數(shù)值變換、加密、遮擋等脫敏技術保護數(shù)據(jù)的隱私安全[6]。開發(fā)出的多模態(tài)識別技術,利用兩種及以上生物特征共同完成驗證,不僅提升了隱私安全性,也提高了識別的準確度和場景適應性。提高識別系統(tǒng)和設備的呈現(xiàn)攻擊檢測能力,是提高識別安全性的通用要求,以防止惡意偽造。從管理角度,建立涵蓋數(shù)據(jù)訪問方式、身份安全認證、權限管理、存儲策略和備份機制等方面的安全管理機制[7],以及數(shù)據(jù)共享機制,考慮不同應用場景下數(shù)據(jù)的共享程度和共享方式,從而保障數(shù)據(jù)隱私安全。
3 人類生物信息標準化分析
3.1 國內外標準化組織及發(fā)布標準
國內與人類生物信息相關的標準化技術組織見表1。與生物特征識別相關的國內標準化組織及其標準發(fā)布情況:全國信息技術標準化技術委員會生物特征識別分技術委員會(TC 28/SC 37)、全國信息技術標準化技術委員會卡及身份識別安全設備分技術委員會(TC 28/SC 17)已發(fā)布國家標準73項,涵蓋術語、應用程序接口、數(shù)據(jù)交換格式、生物特征樣本質量、呈現(xiàn)攻擊檢測、測試和報告等內容;全國安全防范報警系統(tǒng)標準化技術委員會(TC 100)已發(fā)布國家標準12項,社會公共安全行業(yè)(GA)已發(fā)布生物特征識別應用相關的術語、技術要求、應用系統(tǒng)等行業(yè)標準44項。全國金融標準化技術委員會(TC 180)聚焦金融行業(yè)中的生物特征識別數(shù)據(jù)保護,發(fā)布了GB/T 27912-2011《金融服務生物特征識別 安全框架》;全國防偽標準化技術委員會(TC 218)關注人臉識別防偽問題,發(fā)布了GB/ T 38427.1-2019《生物特征識別防偽技術要求 第1部分:人臉識別》。山西省發(fā)布了DB14/T 2164-2020《生物特征識別技術應用指南 公共安全領域》。已發(fā)布的團體標準有T/AI 113-2021《生物特征識別服務中的隱私保護技術指南》、T/TAF 079-2021《移動智能終端及應用軟件生物特征識別安全規(guī)范》。在生物醫(yī)學領域,人類生物信息相關的標委會主要有全國醫(yī)用臨床檢驗實驗室和體外診斷系統(tǒng)標準化技術委員會(TC 136)、全國生物樣本標準化技術委員會(TC 559)、全國生物芯片標準化技術委員會(TC 421),它們的工作范圍側重生物技術標準化工作,在生物信息技術融合方面,未發(fā)布相關標準。TC 28/SC 37于2022年成立基因組識別工作組,負責基因識別數(shù)據(jù)相關的標準化工作。衛(wèi)生健康委員會(WS)已發(fā)布衛(wèi)生信息數(shù)據(jù)元、平臺交互等相關行業(yè)標準81項。四川省發(fā)布了DB51/T 2989-2023《四川省健康醫(yī)療大數(shù)據(jù)應用指南》。當前,從全國標準信息公共服務平臺檢索到的健康醫(yī)療與組學數(shù)據(jù)相關的團體標準見表2。全國信息安全標準化技術委員會(TC 260)負責國內信息安全的標準化工作,目前已發(fā)布GB/T 41819-2022《信息安全技術 人臉識別數(shù)據(jù)安全要求》、GB/T 41806-2022《信息安全技術 基因識別數(shù)據(jù)安全要求》、GB/T 39725-2020《信息安全技術 健康醫(yī)療數(shù)據(jù)安全指南》等數(shù)據(jù)安全相關國家標準9項。
與生物特征識別相關的國際標準化組織及其標準發(fā)布情況:ISO/IEC JTC1/SC37生物特征識別標委會已發(fā)布生物特征識別相關國際標準135項;ISO/IEC JTC1/SC17卡及身份識別安全設備標委會已發(fā)布國際標準118項。IEEE(電氣電子工程師學會)發(fā)布了IEEE 2410-2021《生物特征識別隱私標準》、IEEE 2790-2020《生物特征識別活體檢測標準》2項安全標準。在生物醫(yī)學領域,ISO/TC276/WG5生物技術委員會(數(shù)據(jù)處理與集成委員會分會)主要從技術角度出發(fā),制定數(shù)據(jù)處理與集成方面的標準化工作,已發(fā)布標準2項;ISO/TC 215/SC 1健康信息學委員會(基因組信息學委員會分會)從健康產(chǎn)業(yè)角度出發(fā),已發(fā)布DNA測序質量控制、數(shù)據(jù)交換格式、組學標記語言等相關標準7項。
3.2 標準現(xiàn)狀分析
從標準化發(fā)展情況來看,我國生物識別信息應用標準化工作發(fā)展較早,在基礎通用、產(chǎn)品、檢測方法等方面已發(fā)布生物特征識別術語、數(shù)據(jù)交換格式、生物特征樣本質量、識別系統(tǒng)和設備、呈現(xiàn)攻擊檢測等內容的國家標準,且在人臉識別、活體檢測方面處于國際領先地位[8]。近年來發(fā)布的國標主要圍繞移動設備和識別系統(tǒng)的技術要求、信息安全等方面,以滿足市場快速發(fā)展需求。GB/T 41772-2022《信息技術 生物特征識別 人臉識別系統(tǒng)技術要求》、GB/T 37742-2019《信息技術 生物特征識別 指紋識別設備通用規(guī)范》對圖像質量、響應時間、錯誤接受率等性能指標做出了相應規(guī)定。GB/T 40660-2021《信息安全技術 生物特征識別信息保護基本要求》規(guī)定了各類生物特征識別信息控制者開展生物特征識別信息處理活動應遵循的基本原則和安全要求。GB/T 37036.8-2022《信息技術 移動設備生物特征識別 第8部分:呈現(xiàn)攻擊檢測》、GB/T 41987-2022《公共安全 人臉識別應用 防假體呈現(xiàn)攻擊測試方法》給出了人臉、指紋防假體攻擊檢測流程或方法,虹膜、聲紋等生物特征識別方式呈現(xiàn)攻擊檢測方面還屬空白。
在生物醫(yī)學領域,人類生物信息應用標準化工作尚處于初期發(fā)展階段,團體標準發(fā)展較為迅速。目前國家標準研究和制定工作主要聚焦在數(shù)據(jù)安全方面。GB/T 39725-2020《信息安全技術 健康醫(yī)療數(shù)據(jù)安全指南》、GB/T 41806-2022《信息安全技術 基因識別數(shù)據(jù)安全要求》對醫(yī)療服務場景、消費服務場景、研究開發(fā)場景等不同應用場景下數(shù)據(jù)的使用提出了相應的安全要求。在數(shù)據(jù)的匿名化、分類分級等隱私安全保護技術方面,已發(fā)布相應的團體標準。除此之外,在數(shù)據(jù)集存儲、樣本處理和數(shù)據(jù)分析等方面,也已有相應的團體標準發(fā)布,但未形成標準體系。目前還沒有關于人類生物信息共享的國家和行業(yè)標準。T/SHIA 8-2020《四川省健康醫(yī)療大數(shù)據(jù)共享應用指南》給出了健康醫(yī)療數(shù)據(jù)控制者進行健康醫(yī)療數(shù)據(jù)共享、交換、分析和利用的方法和要求。而對于生物特征識別數(shù)據(jù),GB/T 40660-2021《信息安全技術 生物特征識別信息保護基本要求》中規(guī)定“生物特征識別信息原則上不應共享、轉讓”。
4 人類生物信息應用標準化建議
4.1 發(fā)揮政府主導作用
一是建立健全規(guī)章制度,強化國家監(jiān)管和社會監(jiān)督制度措施,保障人類生物信息安全;二是建立人類生物信息標準化溝通合作機制,做好標準化頂層設計,鼓勵和引導企業(yè)、社會團體和科研機構等參與標準制定與實施,積極發(fā)揮各方優(yōu)勢;三是統(tǒng)籌人類生物信息資源,加強基礎設施建設,建立信息共享機制,為推動生命科學基礎研究、精準醫(yī)療等產(chǎn)業(yè)發(fā)展提供便利。
4.2 構建系統(tǒng)完善的標準體系
人類生物信息數(shù)據(jù)量龐大、來源廣泛、類型多樣,尤其是組學數(shù)據(jù)、健康生理數(shù)據(jù),需充分考慮信息主體、管理方、使用方不同需求,結合不同數(shù)據(jù)類型,分析行業(yè)應用特點,注重數(shù)據(jù)安全和隱私保護,探索構建數(shù)據(jù)格式、數(shù)據(jù)質量、數(shù)據(jù)分析方法和安全管理等多個維度的標準體系,為人類生物信息標準化建設提供指導和方向。
4.3 加大重點標準制定
加快人類生物信息安全保護標準的制定,從技術和管理方面積極探索呈現(xiàn)攻擊檢測、數(shù)據(jù)匯交共享、安全保護和管理等重點標準。加快制定數(shù)據(jù)質量評價、安全風險評估等重點標準,為數(shù)據(jù)的安全應用提供保障。加快國家標準、行業(yè)標準和團體標準的制定,響應市場發(fā)展變化需求,加大標準供給,為行業(yè)高質量發(fā)展提供技術支撐。
5 結 語
人類生物信息能否得到高效、安全地開發(fā)利用,直接影響到個人利益、社會發(fā)展以及國家安全。采用標準化手段指導人類生物信息應用,對推動產(chǎn)業(yè)技術創(chuàng)新和提高安全管理水平具有重要意義。當前人類生物信息在不同領域的應用發(fā)展不盡相同,需要結合行業(yè)特點,發(fā)揮各方優(yōu)勢,加強應用相關的標準化研究,尤其是信息安全方面的標準化工作,構建系統(tǒng)完善的應用標準體系,為產(chǎn)業(yè)有序健康發(fā)展提供標準支撐。
參考文獻
[1]王小理,阮梅花,劉曉,等.生物信息與國家安全[J].中國科學院院刊,2016,31(4):414-422.
[2]何勇群,余紅,楊嘯林,等.本體:生物醫(yī)學大數(shù)據(jù)與精準醫(yī)學研究的基礎[J].生物信息學,2018,16(1):7-14.
[3]生物特征識別白皮書(2019版)[Z].
[4]張育潤,江洲.探討生物信息標準化研究[J].生物信息學,2011,9(1):39-41.
[5]上官曉麗,郝春亮,胡影,等.生物特征識別安全標準化研究[J].信息技術與標準化,2022(4):38-43.
[6]四川省健康醫(yī)療大數(shù)據(jù)共享應用指南:T/SHIA 8—2020[S].
[7]李茹姣,張欣,宋述慧,等.基因組科學數(shù)據(jù)的安全管理與應用[J].大數(shù)據(jù),2022,8(1):37-45.
[8]孫曦,馮春培,落紅衛(wèi).生物特征識別國際標準化研究情況[J].金融電子化,2018(10):60-61.
作者簡介
任程,碩士研究生,工程師,主要從事標準化研究工作。
郭云峰,通信作者,碩士研究生,高級工程師,主要從事計量、標準化研究工作。
丁國徽,博士研究生,研究員,主要從事生物信息學、生物醫(yī)學數(shù)據(jù)安全研究工作。
許俊,碩士研究生,高級工程師,主要從事標準化研究工作。
王萍萍,碩士研究生,工程師,主要從事標準化研究工作。
(責任編輯:袁文靜)