[摘要]"脊柱疾病種類繁多,分型復雜,臨床工作中需要對此類患者的資料進行整理和存儲,以利于后續(xù)進行系統(tǒng)性回顧及分析,總結新的經(jīng)驗或臨床理論。本研究通過詳細介紹專病數(shù)據(jù)庫的設計和系統(tǒng)架構的建立、數(shù)據(jù)治理和建設成效,總結展示脊柱疾病數(shù)據(jù)庫的建設、應用及管理經(jīng)驗。
[關鍵詞]"脊柱疾??;數(shù)據(jù)庫;建設;應用
[中圖分類號]"R681.5""""""[文獻標識碼]"A""""""[DOI]"10.3969/j.issn.1673-9701.2024.07.021
Establishment"and"application"of"spinal"disease"database
ZHANG"Linlin,"QIU"Yong,"LI"Song
Department"of"Spine"Surgery,"the"Affiliated"Hospital"of"Nanjing"University"Medical"School,"Nanjing"210008,"Jiangsu,"China
[Abstract]"There"were"many"kinds"of"spinal"diseases"and"their"classification"was"complex."Clinical"work"needed"to"organize"and"store"the"data"of"such"patients"in"order"to"facilitate"the"follow-up"systematic"review"and"analysis,"and"summarize"new"experience"or"clinical"theory."In"this"study,"the"design"of"specific"disease"database,"the"establishment"of"system"architecture,"data"governance"and"construction"resultsnbsp;were"introduced"in"detail,"and"the"experience"in"the"construction,"application"and"management"of"spinal"disease"database"was"summarized"and"demonstrated.
[Key"words]"Spinal"diseases;"Database;"Establishment;"Application
脊柱疾病是指脊柱的骨質、椎間盤、韌帶、肌肉發(fā)生病變,從而導致復雜多樣的臨床癥狀;臨床上較常見的脊柱疾病主要涉及退行性頸椎病、腰椎病、創(chuàng)傷性脊柱骨折、脊柱畸形等。在臨床工作中整理和存儲患者的各種臨床資料對今后系統(tǒng)性回顧和分析意義重大[1]。新時代信息化突飛猛進的發(fā)展可極大豐富醫(yī)院的信息管理系統(tǒng),診療數(shù)據(jù)不斷轉化為豐富的臨床研究資源,這主要歸功于大量臨床科研數(shù)據(jù)庫的提取與應用[2]。臨床科研數(shù)據(jù)庫在疾病的風險和預后評估、疾病發(fā)展方向的預測、臨床治療決策的支持及醫(yī)療決策管理等各個領域發(fā)揮重要作用[3]。脊柱外科手術患者及支具治療患者具有病因學錯綜復雜、相關的臨床數(shù)據(jù)極其煩瑣、手術風險較高、需連續(xù)的長期隨訪等臨床特點。自2002年起,南京大學醫(yī)學院附屬鼓樓醫(yī)院在國內率先建立脊柱外科支具治療和手術患者臨床數(shù)據(jù)庫系統(tǒng)[1,4]。該系統(tǒng)收集不同病因學所致的脊柱外科手術患者的治療信息,同時亦收集支具治療患者治療過程及治療后隨訪的臨床資料,從而為臨床、科研和教學積累豐富資源,為臨床研究提供便利[1,5]。
1""專病數(shù)據(jù)庫的設計
為適應和滿足科研人員多層面的科研需求,在本研究項目的啟動階段,建立由臨床專家、科室科研人員及醫(yī)院信息科專業(yè)信息工程師組成的特定團隊,討論并設計專病數(shù)據(jù)庫的采集范圍。數(shù)據(jù)庫分8個維度,下分72個域,內含605個數(shù)據(jù)單元,形成專病數(shù)據(jù)庫所具有的“維度-域-數(shù)據(jù)單元”的物理存儲及統(tǒng)計分析層次的明確結構。從數(shù)據(jù)提取的便捷性及可獲取的角度對每個數(shù)據(jù)單元采集點進行整理。每個數(shù)據(jù)單元均支持多重數(shù)據(jù)存儲結構,具有編碼、命名等多項屬性,可最大限度保證數(shù)據(jù)的可追溯性和標識度,見圖1。
2""系統(tǒng)架構
在醫(yī)院臨床數(shù)據(jù)中心的基礎上,專病數(shù)據(jù)庫經(jīng)過后結構化、脫敏安全及質控管理等數(shù)據(jù)處理過程,進一步整合成為病種數(shù)據(jù)庫。分別采用面向服務體系結構的獨立式網(wǎng)絡架構和分布式網(wǎng)絡架構,1臺數(shù)據(jù)庫服務器用于存儲數(shù)據(jù),1臺GPU管理服務器主要用于后結構化等高通量處理,2臺應用服務器可提供單病種分析等擴展應用支持,見圖2。
3""數(shù)據(jù)治理環(huán)節(jié)
3.1""數(shù)據(jù)匯集
本數(shù)據(jù)庫的病種數(shù)據(jù)集源數(shù)據(jù)來源于臨床病房醫(yī)生對患者信息進行針對性采集、門診患者的信息獲取及數(shù)個異構業(yè)務軟件,見圖3。人工采集圖像和放射影像系統(tǒng)數(shù)據(jù)及醫(yī)院信息系統(tǒng)的信息尤為重要。另外,數(shù)據(jù)錄入方式也需要嚴格的標準化。數(shù)據(jù)庫中的數(shù)據(jù)內容自設計之初便具有極強的專業(yè)性,如在脊柱畸形的分型方面,除應用國際上通用的Lenke分型外,國內常用的King分型也被納入數(shù)據(jù)庫中,從而滿足不同研究的需求。此外,根據(jù)目前國內外的最新研究成果不斷修改并完善其他字段。
3.2""后結構化
與臨床病歷系統(tǒng)中患者藥品及手術醫(yī)囑等早已結構化的數(shù)據(jù)不同,患者的臨床信息包括基本信息、診斷、手術信息等,其在采集之后包含大量非結構化的自由文本。后結構化隸屬于數(shù)據(jù)治理的深層次步驟,其精準程度涉及大量病歷資料的便捷利用程度。對病歷系統(tǒng)的主訴、現(xiàn)病史、既往史等文本,在經(jīng)過自然語言處理和知識圖譜的后結構化治理過程后,便可轉化成具有標準結構化數(shù)據(jù)項的字段和鍵值。這種基于機器學習的自然語言處理步驟有利于主動學習、遷移學習的系統(tǒng)性建立。病歷系統(tǒng)中的文本轉化有利于時序邏輯和數(shù)據(jù)耦合的判讀范圍,如患者診斷流程、診斷名稱、手術方式等。在知識圖譜的醫(yī)學分支邏輯的基礎上,采用邏輯回歸、決策樹等算法,建立起分層次、分類別、合并形式等最優(yōu)化模型。
3.3""脫敏安全
信息技術的高速發(fā)展也為互聯(lián)網(wǎng)環(huán)境的安全帶來巨大的威脅,網(wǎng)絡病毒及黑客可通過網(wǎng)絡對各種數(shù)據(jù)庫進行攻擊,從而導致重要數(shù)據(jù)的丟失和泄密。為防止重要數(shù)據(jù)丟失,保證隱私數(shù)據(jù)的存儲和傳輸,在以上過程中需對數(shù)據(jù)進行脫敏處理。
敏感信息不僅包括姓名等明顯隱私項,還包括表面可能無關聯(lián)的、內含風險的數(shù)據(jù)。若沒有將其計算入敏感等級,一旦泄露將帶來一定的損失。另外,研究中心設立專門存儲場所,該服務器與外界形成物理隔離。需要通過特殊的安全通道進行數(shù)據(jù)的導入,這對數(shù)據(jù)安全的保障極為重要。除此之外,安排專人對此數(shù)據(jù)庫進行定期備份,嚴密保存?zhèn)浞葙Y料,防止丟失??紤]到科研及臨床工作的需要,數(shù)據(jù)庫同時提供1個安全的數(shù)據(jù)輸出通道,脊柱外科醫(yī)生在獲得權限后可將數(shù)據(jù)庫內容存儲到指定的移動存儲設備,方便進行數(shù)據(jù)及圖像處理。
3.4""質控管理
數(shù)據(jù)經(jīng)過前述一系列程序加工后,可能依然存在諸如患者信息錄入不全、部分影像學資料缺失等空值情況。因此,需要進行質控處理,見圖4。針對計劃輸入數(shù)據(jù)庫的數(shù)據(jù),首先需要進行人工智能全面質檢策略。根據(jù)質控規(guī)則庫的參考標準,對關鍵指標的單變量約束進行評測,對散在數(shù)據(jù)進行分析和檢測上下文語境聯(lián)動情況,尋找不同內容之間的關系及完整性、臨床信息變化依賴性等情況。其次,人工復核程序也至關重要。質控人員對即將上傳至數(shù)據(jù)庫的患者信息進行隨機抽取篩查。針對業(yè)務軟件中的患者信息內容進行核查,判斷登記處理過程是否與實際信息存在偏差。利用自動檢測和人工核查的結果,總結成質量檢測報告,從而使質控統(tǒng)計指標實現(xiàn)有跡可循;檢測診療程序和圖像信息錄入的變異情況,以達到動態(tài)提示的目的,進一步生成深度質控面板模式。這種測評報告可將發(fā)現(xiàn)的諸多問題一一列舉,根據(jù)具體信息反饋到每一個負責人,從而提高患者信息和圖像獲取的準確性。異常數(shù)據(jù)反饋至信息管理部門,重新生成邏輯規(guī)則,以避免該事件的發(fā)生。在問題改善達到系統(tǒng)要求的評測標準時,最終的數(shù)據(jù)信息可被定義為合格,數(shù)據(jù)將常規(guī)入庫。
4""建設成效
4.1""專病數(shù)據(jù)庫運行情況
4.1.1""良好的人機交互""本數(shù)據(jù)庫在設計時將人機交互界面的友好性作為首要出發(fā)點。此外,本中心數(shù)據(jù)庫的文本資料和影像學資料可在同一界面進行閱讀。采用OLE和超鏈接功能形式,本中心將影像學資料及時保存,這種保存方式以鏈接和嵌插的形式呈現(xiàn)。當需要調閱時,病歷、手術資料及患者的影像學資料等便可在打開的同一個界面內顯示出來。另外,本中心數(shù)據(jù)庫可很好地兼容各種形式的圖片可視化工具軟件及辦公室軟件,因此極大地優(yōu)化后期數(shù)據(jù)庫的升級和影像學資料的進一步處理。
4.1.2""便捷的檢索""基于SQL創(chuàng)建的查詢系統(tǒng)是本數(shù)據(jù)庫的重要特色之一。在檢索出結果后,一方面可進行編輯、存儲和瀏覽,有利于準確高效地完成資料分類、統(tǒng)計和匯總等工作;另一方面,還可將查詢出的結果以Excel、Access等形式導出,方便下一步的統(tǒng)計和編輯等。在該數(shù)據(jù)庫的加持下,脊柱外科醫(yī)生可進行脊柱畸形患者入院前支具治療或保守治療的Cobb角等數(shù)據(jù)的回顧分析,有助于評估患者的自然轉歸和評價支具治療的效果。此外,對患者的術后隨訪資料進行回顧性分析,有助于探討術后并發(fā)癥的發(fā)生率及發(fā)生原因等。
4.2""數(shù)據(jù)入庫與提取
首先,本臨床研究中心建立日常的新增歸檔數(shù)據(jù)入庫流程。由患者的主治醫(yī)生填寫并簽字,之后再由專人核對,科主任核實并在質量檢測報告上簽字,再由數(shù)據(jù)庫負責人核查之后入庫;其次,在數(shù)據(jù)庫建立之初制定完善的科研數(shù)據(jù)提取流程。研究者在科內系統(tǒng)平臺發(fā)起研究課題的數(shù)據(jù)申請,經(jīng)科研指導老師、法定導師、科主任的審核評估簽字和逐級審批之后才能予以授權。研究者按照所批準的篩選范圍,由數(shù)據(jù)庫負責人使用格式化后的專用存儲介質導出符合科研者需要的脫敏數(shù)據(jù)。
4.3""數(shù)據(jù)庫應用
在臨床科研和教學工作中,該數(shù)據(jù)庫具有重要的使用價值。在疾病診斷和治療方面,可通過數(shù)據(jù)庫總結不同脊柱疾病的癥狀、自然史、基因學、組織學、影像學、病理學等臨床特征及手術后療效、并發(fā)癥等,有利于治療策略的改進和手術安全性的提高。在科學研究及論文寫作方面,數(shù)據(jù)庫中的所有資料均為標準化錄入,在進行回顧性研究時,方便導出后進行統(tǒng)計分析;影像學資料也可導出進行編輯,從而減少大量的重復勞動,避免不同測量者之間的偏倚。不僅高效快捷,也為論文的撰寫提供真實、準確的原始數(shù)據(jù)資料。
5""討論
既往關于臨床疾病數(shù)據(jù)庫的建立與應用的研究多集中于脊柱疾病以外的病種。徐磊等[6]報道神經(jīng)內分泌腫瘤臨床數(shù)據(jù)庫管理系統(tǒng)的設計與開發(fā),完成以中國人群為特征的神經(jīng)內分泌腫瘤數(shù)據(jù)庫,科學全面地管理神經(jīng)內分泌腫瘤病例。該數(shù)據(jù)庫采用三層客戶/服務器架構,前端開發(fā)程序采用Microsoft"Visual"Studio"2012開發(fā)環(huán)境下的VB.NET,后臺數(shù)據(jù)庫采用Microsoft"SQL"Server"2012。趙杰等[7]曾提出孔源性視網(wǎng)膜脫離數(shù)據(jù)庫的建立與臨床應用,應用Microsoft"Access"2000數(shù)據(jù)庫軟件,界面開發(fā)采用Powerbulilder8.0,同時結合該類患者的臨床診治特點,建立該??撇“纲Y料數(shù)據(jù)庫及管理系統(tǒng)。在國外,大多數(shù)醫(yī)院系統(tǒng)是圍繞組織運作而非臨床設計需求,數(shù)據(jù)在服務規(guī)劃和調試中缺少臨床醫(yī)生的參與,數(shù)據(jù)質量較差[2]。此外,數(shù)據(jù)庫也需要較強的可操作性和數(shù)據(jù)對接交換能力[8]。為獲得大規(guī)模多元化的數(shù)據(jù)網(wǎng)絡,更好地實現(xiàn)國內外數(shù)據(jù)交換和信息流動,需要采用國際通用的標準數(shù)據(jù)名稱和數(shù)據(jù)庫結構[9]。在此基礎上,本臨床研究中心采用Visual"Basic"6.0開發(fā)環(huán)境創(chuàng)建,利用Access"2000數(shù)據(jù)庫,可于Windows"7等多種操作系統(tǒng)上運行,與Office辦公軟件及各種圖片瀏覽優(yōu)化工具軟件如ACDSEE、Adobe"Photoshop等兼容[1,5,10]。同時,采用國際通用的標準數(shù)據(jù)名稱和數(shù)據(jù)庫結構。友好的人機交互界面主要包括患者的基本信息、診斷資料、矯形手術資料及影像學資料等4部分,覆蓋患者從就診到出院及術后隨訪的全部內容[1,5]。
對臨床科研工作者來說,不同類型的疾病所需要的數(shù)據(jù)庫類型也存在一定差異。除要具備錄入、存儲、查詢、更新等基本項目外,對各個項目的細節(jié)要求也有所不同[11]。以脊柱外科疾病為例,頸椎、腰椎疾病和脊柱畸形的數(shù)據(jù)庫錄入信息也存在差異。頸椎病多側重于患者神經(jīng)功能程度的評估,而脊柱畸形則多注重于術前畸形的特點、術后矯形的評估。當然,疾病之間的錄入項目也存在許多交叉點,因此在設置表單的時候應將脊柱畸形和其他脊柱疾病所需要的項目全部列入表單中。
表單填寫完成后,將由專門的數(shù)據(jù)庫管理人員進行患者信息的錄入。每位患者的資料都會建立一個文件夾,以ID號進行標注。在臨床科研中,患者的隨訪資料是不可或缺的,尤其是長期隨訪信息更加彌足珍貴。因此,針對每一位患者的文件夾,數(shù)據(jù)庫會時時更新。這些留存的電子化資料會再次由專人導入該患者的文件夾中。這有利于為臨床科研提供患者完整的脊柱疾病治療及轉歸資料。截至2024年1月,本中心數(shù)據(jù)庫病例數(shù)已超過34"000例,同時本中心病例數(shù)還在飛速增長中。
數(shù)據(jù)庫基本要求還包括安全性[12]。本研究曾考慮使用互聯(lián)網(wǎng)進行數(shù)據(jù)的讀取,可隨時通過互聯(lián)網(wǎng)進行資料的調閱、查詢和分析。但互聯(lián)網(wǎng)的安全性存在隱患[13]。因此,本研究考慮行數(shù)據(jù)庫的物理隔離,為數(shù)據(jù)庫專門配置一臺計算機,用于進行數(shù)據(jù)存取,從而避免互聯(lián)網(wǎng)可能帶來的數(shù)據(jù)丟失風險。
以上是關于行手術的脊柱疾病患者數(shù)據(jù)庫的基本建設和應用,除此之外,本中心還建有一套脊柱畸形支具治療的門診數(shù)據(jù)系統(tǒng)[14]。對脊柱畸形需要支具治療的患者,初次治療時均會在支具數(shù)據(jù)庫系統(tǒng)登記患者的基本信息及畸形相關參數(shù),生成相應的ID號。每次就診時更新患者相應的基本信息及影像學資料。
樣本量數(shù)據(jù)庫建立的目的:①有利于患者的管理。從初診、手術、復診到后期隨訪,形成患者的閉環(huán)管理,追蹤治療效果[15]。②通過大樣本量數(shù)據(jù)分析,明確手術及保守治療的有效性。③構建各種治療措施的療效應答預測模型,個體化識別和預判不同患者的治療獲益。利用數(shù)據(jù)庫資源,探討各種治療方案的優(yōu)缺點和疾病的發(fā)生發(fā)展及原因等[16]。脊柱疾病患者臨床治療數(shù)據(jù)庫的建立一方面為大樣本的臨床研究提供詳細的原始數(shù)據(jù)及影像學證據(jù),另一方面有利于原始資料的真實性及客觀性。
本研究也存在一定的局限性。首先,脊柱外科疾病種類繁多,且部分罕見病例未曾收治過,該類疾病在數(shù)據(jù)庫中也未有所體現(xiàn)。這需要未來對數(shù)據(jù)庫的不斷完善;其次,對一些疾病的條目還需進一步細化,以便檢索時能更好地獲取所需要的信息。
利益沖突:所有作者均聲明不存在利益沖突。
[參考文獻]
[1] 張林林,"邱勇,"毛賽虎."脊柱外科手術患者臨床數(shù)據(jù)庫系統(tǒng)應用體會[J]."江蘇衛(wèi)生事業(yè)管理,"2015,"26(3):"42–43.
[2] WARDLE"M,"SADLER"M."How"to"set"up"a"clinical"database[J]."Pract"Neurol,"2015,"16(1):"70–74.
[3] 顧大川,"趙艷,"張穎,"等."中國成人心血管外科注冊登記數(shù)據(jù)庫的構建[J]."中國循環(huán)雜志,"2017,"32(10):"1010–1014.
[4] 沈勤."脊柱畸形病人臨床資料管理系統(tǒng)的建立與應用[J]."中華醫(yī)院管理雜志,"2005,"21(8):"552–553.
[5] 朱鋒,"邱勇,"王斌,"等."脊柱畸形計算機多媒體數(shù)據(jù)庫系統(tǒng)的建立與應用[J]."江蘇醫(yī)藥,"2007,"33(11):"1171–1172.
[6] 徐磊,"張川,"孟慶樂,"等."神經(jīng)內分泌腫瘤臨床數(shù)據(jù)庫管理系統(tǒng)的設計與開發(fā)[J]."中國醫(yī)療設備,"2018,"33(10):"127–131.
[7] 趙杰,"張卯年."孔源性視網(wǎng)膜脫離數(shù)據(jù)庫的建立與臨床應用[J]."中國康復理論與實踐,"2005,"11(5):"411.
[8] VAN"DEN"HOVEN"J."Databasenbsp;management"system"and"XML:"Interchange"of"data[J]."ISM,"2002,"19(1):"94–96.
[9] ANDERSON"H"V,"WEINTRAUB"W"S,"RADFORD"M"J,"et"al."Standardized"cardiovascular"data"for"clinical"research,"registries,"and"patient"care:"A"report"from"the"Data"Standards"Workgroup"of"the"National"Cardiovascular"Research"Infrastructure"project[J]."J"Am"Coll"Cardiol,"2013,"61(18):"1835–1846.
[10] 馬禮,"李華玲."基于Web的文檔資料管理系統(tǒng)[J]."電腦開發(fā)與應用,"2003,"16(1):"9–10,"12.