術語是專業(yè)領域中概念的語言指稱[1]。術語和概念的關系理想狀態(tài)下應一一對應,但在實際應用中,同義詞(表示同一概念的多個術語)和多義詞(表示多個不同概念的同一術語)現(xiàn)象比比皆是。此外,概念間還存在諸如包含、序列、聯(lián)想等豐富的語義關系[1]。臨床醫(yī)學領域中也是如此,臨床實踐過程中同一概念的表達形式不規(guī)范統(tǒng)一,同一術語的多義現(xiàn)象非常普遍,嚴重影響了臨床信息的交互、共享和利用。因此加強臨床醫(yī)學術語的標準化建設,構建能揭示各類語義關系的概念術語體系,對提升臨床信息的描述、組織、整合、共享和利用等環(huán)節(jié)的質(zhì)量和效率具有重要意義,是推動臨床信息標準化建設、支持臨床決策、服務臨床醫(yī)學科技創(chuàng)新的重要支撐。
國外在臨床醫(yī)學術語標準化建設方面已經(jīng)研發(fā)了《醫(yī)學術語系統(tǒng)命名-臨床術語》(SNOMED-CT)、《國際疾病分類與代碼》(ICD-10)、《觀測指標標識符邏輯命名與編碼系統(tǒng)》(LOINC)等術語標準,并成功應用推廣。我國的中文臨床醫(yī)學術語標準化建設雖然也取得了一些成果,但起步較晚,以引進翻譯國外標準為主要模式。一方面受語種、知識產(chǎn)權、應用目標、服務環(huán)境等差異的限制,漢化版無法滿足我國醫(yī)療衛(wèi)生的實踐需求;另一方面,國內(nèi)自主研發(fā)的《臨床檢驗項目分類與代碼》、全國科學技術名詞審定委員會(以下簡稱“名詞委”)頒布的相關專業(yè)名詞等術語標準,都局限于某個??祁I域,同時在揭示不同概念間語義關系方面存在缺陷,影響了應用效果。
與發(fā)達國家相比,我國的臨床信息標準還很少,尤其缺乏滿足臨床人員需要、計算機可一致識別的術語和編碼系統(tǒng),阻礙了臨床信息的二次利用[2]。如何建立具有中國特色和自主知識產(chǎn)權的中文臨床醫(yī)學術語系統(tǒng),滿足電子病歷標準化需求,并且方便衛(wèi)生統(tǒng)計和管理、醫(yī)保支付等不同系統(tǒng)間信息交互和共享,是當前亟待攻克的重要課題。因此,2017年中國醫(yī)學科學院醫(yī)學信息研究所牽頭,聯(lián)合醫(yī)科院北京協(xié)和醫(yī)院、公共衛(wèi)生學院和腫瘤醫(yī)院多家單位,共同申請了“中文臨床醫(yī)學術語系統(tǒng)構建研究”項目,并獲準作為中國醫(yī)學科學院“醫(yī)學與健康科技創(chuàng)新工程重大協(xié)同創(chuàng)新項目”正式立項,以期能盡快填補國內(nèi)臨床術語標準領域的空白。
建立術語系統(tǒng)的首要前提是對系統(tǒng)的分類框架進行總體設計。本文將從中文臨床醫(yī)學術語系統(tǒng)分類框架的設計原則和頂層概念類的構建思路兩方面論述。
在充分調(diào)研國內(nèi)術語工作相關標準和規(guī)范的基礎上,以術語學基本理論為指導,結(jié)合已有的術語工作經(jīng)驗,為中文臨床術語系統(tǒng)分類框架擬定了如下7個設計原則。
構建任何一個概念術語體系,都應首先明確目標,確定相應的專業(yè)領域,面向特定的用戶需求,解決實際應用場景中的問題[3]。建立中文臨床醫(yī)學術語系統(tǒng)也應做到目標明確,面向中國臨床醫(yī)學實踐和計算機應用,方便臨床數(shù)據(jù)處理,為電子病歷信息化標準化提供支撐,同時能輔助臨床決策,方便衛(wèi)生管理、醫(yī)保支付等不同系統(tǒng)間信息交互利用,提升醫(yī)療衛(wèi)生信息化水平,從而提高醫(yī)療保健的質(zhì)量和效率。
中文臨床醫(yī)學術語系統(tǒng)分類框架的設計應遵循科學性原則[4],在充分了解臨床醫(yī)學相關學科專業(yè)領域的知識、理論和技術的基礎上,尊重臨床醫(yī)學的既有知識體系,兼顧全面性和準確性。分類框架一方面應盡可能全面覆蓋臨床醫(yī)學各個相關學科專業(yè)領域,避免遺漏;另一方面應準確界定臨床醫(yī)學相關學科專業(yè)領域的范圍,盡量避免收錄不具有該領域特異性的無關術語,減少不必要的重復和干擾。
分類框架的設計應突出概念體系的合理性與層次性[4],兼顧整體層次性和類間均衡性。以概念為核心,統(tǒng)領同義術語,所有概念通過上下位關系形成層級體系。允許同一概念從不同維度劃分,實現(xiàn)多維分類[1]。同一概念可能處于不同分支,但不允許同一概念處在同一支的不同位置,即不允許同一支的上下位概念重名。
分類框架的設計應遵循現(xiàn)行的國家相關法律法規(guī)、標準的規(guī)定,同時考慮與國內(nèi)外其他相關術語標準的銜接和映射,為實現(xiàn)信息資源的交互共享提供便利。如傳染病的分類框架要遵守《中華人民共和國傳染病防治法》中對傳染病的劃分標準,也要和國標《疾病分類與代碼》(GB/T 14396-2016)兼容和銜接。其中的結(jié)核病分類還要考慮相應的衛(wèi)生行業(yè)標準《結(jié)核病分類》(WS 196-2017)。
分類框架中各個節(jié)點的名稱應優(yōu)先選用名詞委審定公布的規(guī)范名詞,并借鑒參考現(xiàn)行的相關法律法規(guī)及國家標準、行業(yè)標準、地方標準、團體標準等各級各類相關標準規(guī)范中采用的名詞術語。此外,權威的工具書、教科書、百科全書等也可作為規(guī)范名稱的來源,盡量保證分類框架各節(jié)點用詞的規(guī)范性、權威性。
為適應學科專業(yè)的發(fā)展和應用需求的多樣化,分類框架應能方便靈活地擴展細化、糾錯調(diào)整和更新維護,同時可根據(jù)不同用戶的個性化需求,實現(xiàn)按需定制。一方面能不斷吸納學科發(fā)展過程中涌現(xiàn)的新概念新術語,力爭能反映最新的學科進展,保證時效性;另一方面對用戶反饋的相關意見和建議及時評估審核,以便采取進一步的改進完善措施,提升分類框架的方便易用性。
設計構建分類框架時,要兼顧質(zhì)量和效率,將自動構建技術與人工審核干預相結(jié)合,從而達到技術上易操作、成本上可接受的預期目標。自動構建和人工審核基本是在已初步開發(fā)完成的“中文臨床醫(yī)學術語素材管理系統(tǒng)”中在線操作。自動構建主要是從已入庫術語素材標準中選取和我們的研究項目比較契合的相關概念類進行整支復用和整合。人工審核干預包括兩方面:一方面綜合對比分析國內(nèi)現(xiàn)行臨床醫(yī)學相關術語標準,深入調(diào)研各類概念的內(nèi)涵和外延,前期人工搭建分類框架的基礎部分;另一方面廣泛搜集調(diào)研國內(nèi)各種臨床規(guī)范指南和臨床實踐日常用語,后期對自動構建結(jié)果進一步擴充細化、修改完善,盡可能準確全面地覆蓋國內(nèi)臨床醫(yī)學領域的概念和術語。在兼顧以上幾點設計原則的前提下,以復用、整合已有術語標準相關概念類為主要構建方式,輔以類名調(diào)整、類級上調(diào)、類級下調(diào)、類間移動、類刪除、類合并、類拆分等操作進行調(diào)整重構。此外還根據(jù)實際需要增設部分概念或族首詞作為分類框架的新節(jié)點,使其結(jié)構邏輯性更強、更易讀。
在對臨床醫(yī)學相關學科專業(yè)領域的國內(nèi)外各種術語資源進行廣泛調(diào)研和對比分析的基礎上,根據(jù)我國現(xiàn)行的醫(yī)療衛(wèi)生相關法律法規(guī)、診療規(guī)范或臨床指南、電子病歷等衛(wèi)生信息化相關標準,結(jié)合我國臨床實踐特色,同時參考國內(nèi)外臨床醫(yī)學領域應用比較廣泛的第十版《國際疾病分類》(ICD-10)和《醫(yī)學術語系統(tǒng)命名-臨床術語》(SNOMED-CT)[6]等術語系統(tǒng),目前分類框架初步設定了14個頂層概念類,依次為:疾病診斷,有機體,解剖部位,診查對象,臨床表現(xiàn),診療項目、技術和方法,化學藥品和生物制品,醫(yī)用設備、器械和材料,物質(zhì),心理行為,環(huán)境地理,事件、事故和災害,人口學及社會經(jīng)濟學特征,限定語。我國作為發(fā)展中國家,疾病譜(如高發(fā)傳染病和惡性腫瘤方面)相對于歐美發(fā)達國家不盡相同,而且臨床應用的藥品器械,以及衛(wèi)生管理、醫(yī)保支付、人口統(tǒng)計學等臨床相關方面也別具特色。下面將從含義、收錄范圍、主要參考源等方面分別闡述這14個頂層概念類的構建思路。
“疾病診斷”是從醫(yī)學角度對人的身體、心理的健康問題或健康狀態(tài)做出判斷[7]的相關概念集合。收錄人類各種身心疾病(障礙、失調(diào)、紊亂、綜合征等)、損傷、中毒及其他健康狀況的診斷描述用語,涉及臨床數(shù)據(jù)的記錄、存儲、檢索環(huán)節(jié)中常用的各類疾病診斷術語。
鑒于《疾病分類與代碼》(GB/T 14396-2016)是對ICD-10和《國際腫瘤分類》(第三版)(ICD-O-3)的等效采用[8],又結(jié)合我國國情進行了本地化修訂,將疾病編碼由4位擴展到6位,覆蓋2萬6千余個疾病條目,已廣泛應用于國內(nèi)醫(yī)療衛(wèi)生服務、醫(yī)療付費、衛(wèi)生統(tǒng)計管理、傳染病報告等領域,成為我國衛(wèi)生信息標準體系的重要組成部分。《疾病分類與代碼》(GB/T 14396-2016)的中文疾病名稱優(yōu)先采用名詞委公布的相關學科的醫(yī)學名詞,對尚沒有標準譯名的則參考國內(nèi)近年出版的較權威的醫(yī)學辭典,科學性、規(guī)范性更有保障。同時因為ICD-10的國際通用性能夠和其他術語標準建立映射,更方便國際交流且無版權爭議,所以將其選作疾病診斷分類框架的主要參考來源。另外還參考了疾病本體(Disease Ontology,DO)的分類體系、美國國立癌癥研究所敘詞表(National Cancer Institute thesaurus,NCIt)的腫瘤分類,以及國內(nèi)疾病分類相關的其他法律法規(guī)或標準規(guī)范,如《中華人民共和國傳染病法》(2013修訂版)、《結(jié)核病分類》(WS 196-2017)、《中國疾病診斷相關分組》(CN-DRGs)等。醫(yī)學領域比較成熟規(guī)范的相關知識組織體系如《醫(yī)學專業(yè)分類表》《中文醫(yī)學主題詞表》(CMeSH)也提供了很多有益的借鑒。
“有機體”是對人類具有病原學意義的各類有機體及其不同的生命周期形態(tài)、營養(yǎng)獲取形式的相關概念集合,主要收錄病毒、細菌、真菌等病原微生物,原蟲、蠕蟲等寄生蟲,動植物等真核生物,以及有機體不同生命周期形態(tài)和營養(yǎng)獲取形態(tài)的相關概念和術語。該類框架的設計是在綜合比較《醫(yī)學術語系統(tǒng)命名-臨床術語》(SNOMED-CT)、《中文醫(yī)學主題詞表》(CMeSH)、《中國圖書館分類法·醫(yī)學專業(yè)分類表》、名詞委審定公布的相關名詞等已有術語系統(tǒng)的基礎上,參考相關學科知識體系設定的。
“解剖部位”是人體正常的身體部位、解剖結(jié)構、組織、細胞、標本等概念的集合,主要收錄身體部位,消化系統(tǒng)、呼吸系統(tǒng)等各個系統(tǒng),感覺器官,組織,細胞,體液和分泌物,胚胎結(jié)構,獲得性身體結(jié)構,標本等相關概念和術語。該類框架的構建主要參考了《中文醫(yī)學主題詞表》(CMeSH)中的“解剖學”、《醫(yī)學術語系統(tǒng)命名-臨床術語》(SNOMED-CT)中的“body structure”、解剖學基本模型本體(Foundational Model of Anatomy Ontology,F(xiàn)MA)等。
“診查對象”是指臨床活動中需要觀察、檢查、監(jiān)測的各種對象的概念集合,主要收錄人體各種生理功能、過程、現(xiàn)象和狀態(tài)(如呼吸、排泄、免疫、遺傳、細胞功能等)、各類檢查監(jiān)測和治療的參數(shù)和特征(如血壓監(jiān)測、影像檢查、放射療法等)。該類框架的構建主要參考了《醫(yī)學術語系統(tǒng)命名-臨床術語》(SNOMED-CT)的“Observable entity”、《中文醫(yī)學主題詞表》(CMeSH)的“現(xiàn)象和過程”等術語資源。
“臨床表現(xiàn)”是臨床上發(fā)現(xiàn)的人體各種異常狀況、一般情況的概念集合,收錄的異常情況包括癥狀、體征、病理改變、影像學異常、功能檢查異常、化驗異常、病原學檢驗異常、分子異常(含遺傳變異)等;一般情況包括精神狀態(tài)、食欲、食量、大小便、睡眠、體力、體重變化,以及疾病史(傳染病、地方病等)、預防接種/外傷/手術史、過敏史等。該類框架設計主要參考了《疾病分類與代碼》(GB/T 14396-2016)、《醫(yī)學術語系統(tǒng)命名-臨床術語》(SNOMED-CT)中的“clinical finding”、《中文醫(yī)學主題詞表》(CMeSH)中的相關概念類、人類表型本體(Human Phenotype Ontology,HPO)、《衛(wèi)生信息數(shù)據(jù)元值域代碼》(WS 364-2011)、《健康體檢體征數(shù)據(jù)元規(guī)范》(DB11/T 1238-2015)等。
“診療項目、技術和方法”是臨床提供的各類醫(yī)療衛(wèi)生保健服務項目及相關技術、方法的概念集合,主要收錄診斷、治療、護理、康復、預防保健等方面的服務項目、技術方法、操作程序的概念術語,如綜合醫(yī)療服務、實驗室診斷、影像學診斷、病理學診斷、各系統(tǒng)臨床診斷、手術治療、非手術治療、物理治療、康復醫(yī)療等。該類框架的構建主要參考了《社會保險醫(yī)療服務項目分類與代碼》(LD/T01-2017)、《手術操作編碼(ICD-9-CM-3)2017維護版》、《醫(yī)學術語系統(tǒng)命名-臨床術語》(SNOMED-CT)中的“procedure”、《全國醫(yī)療服務價格項目規(guī)范》(2012年)、《臨床檢驗項目分類與代碼》(WS/T102-1998)、《觀測指標標識符邏輯命名與編碼系統(tǒng)》(LOINC)、《臨床實驗室試驗項目分類與編碼》(DB33/T 903-2013)、《中文醫(yī)學主題詞表》(CMeSH)中的 “分析、診療技術”、醫(yī)學專業(yè)分類表等。
“化學藥品和生物制品”是各類用于人類疾病診斷、治療、預防、康復、護理等方面的化學藥品和生物制品的概念集合,不包括中藥、民族藥。該類既包括藥品種類、藥品劑型的概念術語,也包括具體藥品品種及其不同劑型的概念術語,最終形成“藥品種類-具體藥品品種-不同劑型”等多層級分類框架[9]。該類框架的設計構建主要參考了《國家基本藥物目錄》(2018年版),從臨床藥理學維度劃分;另外還參考了《藥學名詞》(第二版)、《中華人民共和國藥典》(2015年版)、《國家基本醫(yī)療保險、工傷保險和生育保險藥品目錄》(2017年版)、《社會保險藥品分類與代碼》(LD/T90-2012)、《醫(yī)學術語系統(tǒng)命名-臨床術語》(SNOMED-CT)中的“pharmaceutical/biologic product”、《中文醫(yī)學主題詞表》(CMeSH)中的“藥用制劑”和《中國圖書館分類法·醫(yī)學專業(yè)分類表》的“藥品”等術語標準。
“醫(yī)用設備、器械和材料”是在診斷、治療、護理、康復、保健等臨床活動中用到的消耗性和非消耗性設備、器械和材料的概念集合,收錄了手術器材、口腔頜面器材、植入材料、介入材料、縫合止血護創(chuàng)材料、管套容器過濾器材、注射穿刺器材等相關概念術語。該類框架的構建主要參考了《社會保險醫(yī)療服務分類與代碼》(LD/T01-2017)中的醫(yī)用器材分類與代碼、《中文醫(yī)學主題詞表》(CMeSH)中的“設備和供應”、《醫(yī)療器械分類目錄》、通用醫(yī)療器械命名系統(tǒng)(Universal Medical Device Nomenclature System,UMDNS)等術語資源。
“物質(zhì)”在此表示除化學藥品和生物制品以外,臨床醫(yī)學中經(jīng)常涉及到的其他各種物質(zhì),主要收錄血紅蛋白等人體內(nèi)的生物物質(zhì)、化學結(jié)構和成分,具有特定功能的物質(zhì)、各種危險物質(zhì)、濫用的物質(zhì)和毒品、膳食物質(zhì)(如食品、營養(yǎng)素等)、變應原、癌癥相關物質(zhì)等。該類框架的構建主要參考了《醫(yī)學術語系統(tǒng)命名-臨床術語》(SNOMED-CT)中的“substance”、《中文醫(yī)學主題詞表》(CMeSH)中的相關概念類、《職業(yè)衛(wèi)生名詞術語》(GBZ/T 224-2010)等術語資源。
“心理行為”是與人類疾病和健康相關的心理現(xiàn)象、心理過程、行為和行為機制的概念集合,主要收錄恐懼、發(fā)怒、幸福、悲痛、焦慮等情緒情感,A型人格、B型人格、孤立型人格、攻擊性人格等各類人格性格,多血質(zhì)、抑郁質(zhì)等氣質(zhì)類型,吸煙、酗酒、酒后駕車、危險性行為等行為或生活方式等相關概念和術語。該類框架的構建主要參考了《中文醫(yī)學主題詞表》(CMeSH)中的“心理學和精神病學”和《心理學名詞》(第二版)。
“環(huán)境地理”是與人類健康和疾病相關的環(huán)境類型、環(huán)境因素、地理區(qū)劃等概念的集合,主要收錄的環(huán)境類型包括草原、沼澤、沙漠、沿海等自然環(huán)境,城市、農(nóng)村、住宅、公園等人工環(huán)境以及孤兒院、養(yǎng)老院、監(jiān)獄等各類場所,環(huán)境因素則涉及氣候氣象因素(如熱帶氣候、雨、雪、陽光等,引起損傷的各種物理力(如運動、摩擦、電流、聲音、輻射、熱、空氣壓力等)和物體(如車輛、武器等),地理區(qū)劃主要包括各大洲、國家、地區(qū)、我國省市區(qū)縣等相關概念術語。該類框架的構建主要參考了《醫(yī)學術語系統(tǒng)命名-臨床術語》(SNOMED-CT)中的“environment and geographical locations”“physical force”“physical object”等,以及《中文醫(yī)學主題詞表》(CMeSH)中相關概念類、《世界各國和地區(qū)名稱代碼》(GB/T 2659-2000)、《中華人民共和國行政區(qū)劃代碼》(GB/T 2260-2007)、《縣以下行政區(qū)劃代碼編制規(guī)則》(GB/T 10114-2003)等。
“事件、事故和災害”是可導致人類損傷、中毒、疾病、殘疾、死亡的人為或自然的各類事件、事故和災害的概念集合,主要收錄虐待、自殺、死刑、戰(zhàn)爭、搏斗等事件,也包括火車脫軌、火災、觸電、意外跌倒等事故,還包括洪水、地震、火山噴發(fā)等自然災害。該類具體架構的構建主要參考了《醫(yī)學術語系統(tǒng)命名-臨床術語》(SNOMED-CT)中的“event”、《疾病分類與代碼》(GB/T 14396-2016)第二十章“疾病、損傷和死亡的外因”和《中文醫(yī)學主題詞表》(CMeSH)中相關概念類等術語資源。
“人口學及社會經(jīng)濟學特征”是各種影響人類健康和衛(wèi)生保健的人口學及社會經(jīng)濟學因素的概念集合,涉及描述病歷所需的人口學、社會學、經(jīng)濟學特征的相關術語,如性別、年齡、婚育狀況、人種、國籍、民族、宗教、職業(yè)狀況、教育背景、身份證件、建檔醫(yī)療機構組織代碼、患者類型、醫(yī)療保險類別、醫(yī)療付費方式[10-11]等。該類框架的構建主要參考了《電子病歷基本數(shù)據(jù)集》(WS 445-2014)、《衛(wèi)生信息數(shù)據(jù)元值域代碼》(WS 364-2011)和《醫(yī)學術語系統(tǒng)命名-臨床術語》(SNOMED-CT)中的“social context”等國內(nèi)外術語標準。
“限定語”是臨床實踐中描述疾病特征、檢查檢驗結(jié)果和計量單位等常用限定語的集合。主要收錄發(fā)病過程(急性、慢性、亞急性等)、疾病部位(全身性、單側(cè)、雙側(cè)等)、疾病性質(zhì)(良性、惡性、化膿性、黏液性等)、疾病分期(早期、中期、晚期、Ⅰ期、Ⅱ期、Ⅲ期等)、疾病分級(輕度、中度、重度等)等從各角度描述疾病特征的語詞,還收錄描述結(jié)果的限定語,如陰性、陽性、正常、未見異常、升高、降低、增多、減少等,臨床常用的各種計量單位和符號也在該類下收錄。該類框架的構建可參考《醫(yī)學術語系統(tǒng)命名-臨床術語》(SNOMED-CT)中的“qualifier value”和《量和單位》(GB 3102.3-1993)等術語資源。
截至2018年10月31日,“中文臨床醫(yī)學術語系統(tǒng)”內(nèi)容構建的研究任務按計劃如期推進,目前已基本完成以概念為中心的“中文臨床醫(yī)學術語系統(tǒng)”的頂層框架和概念模型的設計,初步構建和定義了14個頂層概念及65種語義關系,完成了中文臨床醫(yī)學術語遴選標準的制定,指導“中文臨床醫(yī)學術語系統(tǒng)”術語收集遴選工作,已累計收集了63萬余條中文臨床術語。在術語倉儲的基礎上進行整理和加工,初步形成了20.7萬個中文臨床概念,并基本完成了概念間層級關系的構建。在協(xié)同工作平臺和工具的開發(fā)方面,完成了中文臨床術語素材管理和概念協(xié)同構建與管理功能的需求分析,基本實現(xiàn)了中文臨床術語素材管理系統(tǒng)和概念編制工具的開發(fā),并已投入使用。
鑒于構建具有自主知識產(chǎn)權的中文臨床醫(yī)學術語系統(tǒng),對我國臨床信息標準化進程的重要性及其自身建設的復雜性,如何在借鑒國內(nèi)外現(xiàn)有相關先進成果和經(jīng)驗的基礎上,融合、創(chuàng)新、發(fā)展、探索一條具有中國特色的、科學可行的臨床術語標準化之路意義重大、任重道遠,需集思廣益,凝聚多方智慧,群策群力,攜手共同推動該研究順利開展。