趙 丹,吳宏宇,韓一平*,黃青山,李 強(qiáng)
(1.第二軍醫(yī)大學(xué)長(zhǎng)海醫(yī)院呼吸內(nèi)科,上海 200433;2.復(fù)旦大學(xué)生命科學(xué)院,上海 200433)
肺癌是最常見(jiàn)的腫瘤性疾病,死亡率占各種惡性腫瘤之首[1],相關(guān)數(shù)據(jù)資源十分豐富。為了科學(xué)整理和收集臨床病例資料,便于臨床研究和及時(shí)總結(jié)臨床醫(yī)療工作中的經(jīng)驗(yàn),建立肺癌病例數(shù)據(jù)庫(kù)系統(tǒng)顯得非常重要。當(dāng)前國(guó)內(nèi)已有多家醫(yī)院建立肺癌病例數(shù)據(jù)庫(kù),如北京腫瘤醫(yī)院采用SQL Servers建立底層關(guān)系型數(shù)據(jù)庫(kù),同時(shí)采用Visual C++6.0開(kāi)發(fā)Windows窗口應(yīng)用程序。這使得底層數(shù)據(jù)透明化,可以自如地操縱數(shù)據(jù)庫(kù)[2]。中國(guó)中醫(yī)科學(xué)院西苑醫(yī)院設(shè)計(jì)晚期非小細(xì)胞肺癌臨床病例分析數(shù)據(jù)庫(kù)系統(tǒng)[3]。河北醫(yī)科大學(xué)第四醫(yī)院選用C#2008進(jìn)行程序設(shè)計(jì),后臺(tái)數(shù)據(jù)庫(kù)應(yīng)用Access 2007設(shè)計(jì)和開(kāi)發(fā)非小細(xì)胞肺癌患者數(shù)據(jù)庫(kù),利用該系統(tǒng)可以方便地進(jìn)行信息錄入,為統(tǒng)計(jì)分析提供完整準(zhǔn)確的原始數(shù)據(jù)記錄[4]。這些數(shù)據(jù)庫(kù)系統(tǒng)大多使用的是Windows平臺(tái)下數(shù)據(jù)庫(kù)軟件如SQL Server,Access,采用 C/S(客戶(hù)機(jī)/服務(wù)器)模式開(kāi)發(fā)。限制在Windows平臺(tái)下使用的商業(yè)軟件,存在平臺(tái)依賴(lài)性。而且C/S模式開(kāi)發(fā)的軟件要求每個(gè)使用者都必須安裝本地客戶(hù)端程序,進(jìn)行本地運(yùn)行環(huán)境配置,增加了操作人員的工作量與復(fù)雜度,軟件的維護(hù)與更新繁瑣。最終此類(lèi)數(shù)據(jù)庫(kù)一般只能在小范圍類(lèi)使用,無(wú)法進(jìn)行互聯(lián)網(wǎng)共享操作。建立在線肺癌病例數(shù)據(jù)庫(kù)系統(tǒng)可擴(kuò)展其使用價(jià)值。
1.1 軟件平臺(tái)選擇 為了建立在線數(shù)據(jù)庫(kù),必須采用B/S(瀏覽器/服務(wù)器)模式開(kāi)發(fā)。綜合考慮軟件開(kāi)發(fā)技術(shù)、經(jīng)費(fèi)與軟件平臺(tái)的可擴(kuò)展性等因素后,最終選擇WAMP(Windows+PHP+Apache+MySQL)平臺(tái)作為數(shù)據(jù)庫(kù)系統(tǒng)開(kāi)發(fā)與運(yùn)行平臺(tái)。以配置有PHP(V5.2.13)和MySQL 數(shù)據(jù)庫(kù)(V5.1.40)的 Apache 服務(wù)器(V2.2.14)為后臺(tái),前端使用PHP、HTML、JQuery和CSS技術(shù)實(shí)現(xiàn)。該系統(tǒng)占用系統(tǒng)資源少,效率高,訪問(wèn)權(quán)限安全靈活,可擴(kuò)展性強(qiáng)。建成的在線肺癌病例數(shù)據(jù)庫(kù),可以實(shí)現(xiàn)任何人對(duì)病例數(shù)據(jù)庫(kù)的查詢(xún),授權(quán)用戶(hù)對(duì)病理數(shù)據(jù)的分析,匯總與數(shù)據(jù)管理。
肺癌病例數(shù)據(jù)庫(kù)系統(tǒng)是建立在PHP+Apache+MySQL核心軟件基礎(chǔ)上的,PHP是服務(wù)器端的HTML內(nèi)嵌式計(jì)算機(jī)腳本語(yǔ)言,Apache是Web服務(wù)器,Mysql是以SQL語(yǔ)言為基礎(chǔ)的數(shù)據(jù)庫(kù)。三者均為開(kāi)放源代碼,免費(fèi)且能在Linux和Windows等各種操作系統(tǒng)下跨平臺(tái)開(kāi)發(fā)和運(yùn)行的計(jì)算機(jī)軟件,這使得適合用作研究用途[5,6]。共同構(gòu)成典型的 B/W/D(瀏覽器/Web服務(wù)器/數(shù)據(jù)庫(kù)服務(wù)器)三層體系結(jié)構(gòu)模式??蛻?hù)端通過(guò)瀏覽器提交信息給Web服務(wù)器,Web服務(wù)器再通過(guò)PHP腳本語(yǔ)言與MySQL數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)交換,由標(biāo)準(zhǔn)SQL語(yǔ)言對(duì)數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)操作,最后將處理完畢的數(shù)據(jù)通過(guò)PHP腳本語(yǔ)言返回給客戶(hù)端,形成動(dòng)態(tài)交互式 Web數(shù)據(jù)庫(kù)管理系統(tǒng)[7](圖1)。
圖1 系統(tǒng)流程
1.2 需求分析與數(shù)據(jù)庫(kù)設(shè)計(jì) 對(duì)本院肺癌病例數(shù)據(jù)資源進(jìn)行開(kāi)發(fā),依據(jù)疾病診斷流程與系統(tǒng)使用者的功能訴求進(jìn)行迭代的需求分析,將其轉(zhuǎn)為系統(tǒng)需求,最終確立系統(tǒng)信息表。主要包括患者基本信息、入院診斷信息、檢驗(yàn)信息、影像學(xué)信息、病理診斷信息、臨床治療信息、腫瘤組織及血液樣本信息、臨床評(píng)估信息、毒副反應(yīng)、隨訪資料信息等,對(duì)表中的具體信息進(jìn)行概括、定義,相關(guān)信息間建立關(guān)聯(lián),有多個(gè)數(shù)值的信息按時(shí)間順序加以區(qū)別。
肺癌病例數(shù)據(jù)庫(kù)的功能模式主要由一般臨床資源表、臨床評(píng)估資源表、血清數(shù)據(jù)模板和組織功能模板共同組成。一般臨床資源表包括肺癌患者的基線資料和診斷資料,如年齡、性別、體重指數(shù)、吸煙史、職業(yè)史、家族史、臨床特征,病理資料、影像學(xué)資料、實(shí)驗(yàn)室檢驗(yàn)資料、分子遺傳指標(biāo)、肺癌TNM分期;臨床評(píng)估資源表包括治療方案、隨訪資料、療效預(yù)后監(jiān)測(cè)如近期療效、遠(yuǎn)期療效、毒副反應(yīng)等;血清數(shù)據(jù)模板和組織功能模板,包括已收集編號(hào)存儲(chǔ)于指定空間,并低溫保存的組織標(biāo)本、血清標(biāo)本。
在這些種類(lèi)繁多、數(shù)據(jù)形式復(fù)雜、技術(shù)性強(qiáng)、圖文并茂、隨時(shí)間動(dòng)態(tài)變化的肺癌病例數(shù)據(jù)面前,通過(guò)上述的功能模式進(jìn)行進(jìn)一步的查詢(xún)、分析,對(duì)散在的肺癌病例數(shù)據(jù)分類(lèi)、關(guān)聯(lián)、聚類(lèi)、預(yù)測(cè)、評(píng)估,從而把數(shù)據(jù)的不確定性轉(zhuǎn)化為精準(zhǔn)的肺癌研究結(jié)論,實(shí)現(xiàn)肺癌病例的數(shù)據(jù)挖掘。
1.3 系統(tǒng)功能模塊設(shè)計(jì)與實(shí)現(xiàn) 建立一個(gè)在線肺癌病例數(shù)據(jù)庫(kù)用于輔助肺癌臨床研究,對(duì)不同類(lèi)型的系統(tǒng)使用者有不同的功能需求。一般醫(yī)務(wù)人員最主要的功能需求是信息查詢(xún),以及初步信息分析,高層次的醫(yī)務(wù)研究人員則在此基礎(chǔ)上的數(shù)據(jù)分析功能以及數(shù)據(jù)導(dǎo)出功能,而系統(tǒng)管理人員則需要對(duì)數(shù)據(jù)進(jìn)行錄入,修改和刪除功能。為此將系統(tǒng)劃分為查詢(xún),分析,數(shù)據(jù)管理和系統(tǒng)維護(hù)四個(gè)模塊。為每個(gè)模塊設(shè)置不同的訪問(wèn)權(quán)限。數(shù)據(jù)管理模塊是整個(gè)肺癌病例數(shù)據(jù)系統(tǒng)的核心,包括基本信息管理、檢驗(yàn)診斷信息管理、病理診斷信息管理、影像診斷信息管理、臨床治療信息管理、腫瘤樣本信息管理、臨床評(píng)估信息管理。
1.3.1 基本信息管理 主要是住院號(hào)、年齡、性別、身高、體重、體表面積,其中還包含住院信息如吸煙史、診斷、癥狀、體征、家族史等,并采用最新的UICC 2009第7版肺癌國(guó)際分期標(biāo)準(zhǔn)為依據(jù)進(jìn)行肺癌診斷的TNM分期。
1.3.2 檢驗(yàn)診斷信息管理 包含血液檢測(cè),血液及體液的腫瘤標(biāo)志物檢測(cè)等,如有新增或刪除的檢測(cè)的項(xiàng)目,數(shù)據(jù)庫(kù)也可進(jìn)行有效管理。另外,兼有血液標(biāo)本庫(kù)的信息等。
1.3.3 病理診斷信息管理 包含有組織病理、細(xì)胞病理、免疫組化、靶標(biāo)檢測(cè)的相關(guān)信息,并詳細(xì)定義病理類(lèi)型、淋巴結(jié)轉(zhuǎn)移、胸膜及周?chē)M織侵犯等,尤其免疫組化的檢測(cè)項(xiàng)目非常多,新增的病理分子隨著醫(yī)療技術(shù)的進(jìn)步逐漸運(yùn)用于臨床,數(shù)據(jù)庫(kù)的管理解決這一問(wèn)題。
1.3.4 影像診斷信息管理 包含胸部CT、頭顱MRI、骨ECT、全身PET、超聲及內(nèi)窺鏡檢查信息等,尤其對(duì)于胸部CT的影像變化,在存儲(chǔ)影像圖片的同時(shí)亦結(jié)合本院的PACS系統(tǒng)進(jìn)行專(zhuān)業(yè)的文字描述,如腫塊部位、密度、大小等變化。
1.3.5 臨床治療信息管理 包含有手術(shù)治療方案、化療方案、放療、介入治療、生物靶向治療等,可以按不同的治療方案實(shí)現(xiàn)肺癌病例個(gè)體化、綜合治療的管理。
1.3.6 腫瘤樣本信息管理 即肺癌組織標(biāo)本庫(kù)的相關(guān)信息,按癌組織、癌旁組織分別留存有新鮮組織標(biāo)本為今后的實(shí)驗(yàn)研究提供標(biāo)本信息。
1.3.7 臨床評(píng)估信息管理 包括療RECIST 1.1作為肺癌的療效評(píng)價(jià)標(biāo)準(zhǔn)進(jìn)行近期療效的評(píng)估,WHO抗癌藥物常見(jiàn)毒副反應(yīng)分級(jí)標(biāo)準(zhǔn)評(píng)定不同治療方案的毒副反應(yīng)、癌癥患者生活質(zhì)量測(cè)定量表EORTC QLQ -C30來(lái)測(cè)定肺癌生存者的生命質(zhì)量、評(píng)價(jià)肺癌的治療標(biāo)準(zhǔn),治療結(jié)束后的隨訪資料按時(shí)間順序管理隨訪數(shù)據(jù)。
2.1 建成肺癌病例數(shù)據(jù)庫(kù)管理系統(tǒng) 建成后的肺癌病例數(shù)據(jù)庫(kù)管理系統(tǒng)簡(jiǎn)潔流暢、易于操作、管理,人機(jī)界面友好、存儲(chǔ)數(shù)據(jù)豐富。肺癌病例數(shù)據(jù)庫(kù)主要包含數(shù)據(jù)查詢(xún),數(shù)據(jù)分析,數(shù)據(jù)管理和系統(tǒng)維護(hù)四大模塊,除此之外還有首頁(yè)與系統(tǒng)幫助頁(yè)面,主要用于展示系統(tǒng)信息與輔助用戶(hù)使用系統(tǒng)。肺癌病例數(shù)據(jù)庫(kù)總體反應(yīng)了肺癌病例在發(fā)病、診斷、療效等全方位的功能作用,數(shù)據(jù)形式表現(xiàn)多樣、隨時(shí)間動(dòng)態(tài)變化的各項(xiàng)肺癌信息以動(dòng)態(tài)的網(wǎng)頁(yè)頁(yè)面形式呈現(xiàn)在訪問(wèn)者的面前,從基本信息管理、檢驗(yàn)診斷信息管理、病理診斷信息管理、影像診斷信息管理、臨床治療信息管理、腫瘤樣本信息管理、臨床評(píng)估信息管理七個(gè)方面,綜合歸納肺癌病例數(shù)據(jù)信息。注重統(tǒng)計(jì)不同暴露條件下疾病緩解率、疾病控制率、及抗癌藥物的毒副反應(yīng)的差異。在該數(shù)據(jù)庫(kù)長(zhǎng)期運(yùn)行下,也能跟進(jìn)中位生存時(shí)間、總生存期方面的測(cè)評(píng)。
2.2 肺癌病例數(shù)據(jù)庫(kù)系統(tǒng)的擴(kuò)展功能 通過(guò)PHP+Apache+MySQL核心軟件設(shè)計(jì)建立的肺癌病例數(shù)據(jù)庫(kù)系統(tǒng)能實(shí)現(xiàn)數(shù)據(jù)的導(dǎo)入和導(dǎo)出功能。包含有血清及組織標(biāo)本庫(kù)的綜合性強(qiáng)的肺癌病例數(shù)據(jù)庫(kù)系統(tǒng)。建成后的數(shù)據(jù)庫(kù)在有良好的網(wǎng)絡(luò)安全及訪問(wèn)權(quán)限的設(shè)置前提下,通過(guò)Web技術(shù)發(fā)布于網(wǎng)絡(luò),實(shí)現(xiàn)資源共享。
3.1 新技術(shù)的運(yùn)用和肺癌數(shù)據(jù)庫(kù)發(fā)展方向 信息技術(shù)的飛速發(fā)展使得海量的信息數(shù)據(jù)能安全存儲(chǔ)、便于檢索,通過(guò)對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析有助于挖掘有利的信息資源。如著名的SEER數(shù)據(jù)庫(kù)經(jīng)常發(fā)布權(quán)威數(shù)據(jù)供醫(yī)務(wù)人員及科研工作提供指導(dǎo)[8,9],目前我國(guó)也建成了不少腫瘤數(shù)據(jù)庫(kù)[10,11,12],但對(duì)于肺癌單病種數(shù)據(jù)庫(kù)的建設(shè)還顯不足。將新一代的數(shù)據(jù)庫(kù)技術(shù)運(yùn)用于肺癌病例數(shù)據(jù)資源中,設(shè)計(jì)發(fā)布的肺癌病例數(shù)據(jù)庫(kù)能安全地組織、存儲(chǔ)肺癌病例數(shù)據(jù),使得肺癌病例數(shù)據(jù)資料的研究處理更高效、準(zhǔn)確、安全。在嚴(yán)密保護(hù)肺癌患者隱私情況下還可進(jìn)一步通過(guò)網(wǎng)絡(luò)技術(shù)實(shí)現(xiàn)數(shù)據(jù)共享,從而合理開(kāi)發(fā)利用寶貴有限的數(shù)據(jù)資源。
3.2 數(shù)據(jù)信息及時(shí)更新合理應(yīng)用 隨著肺癌臨床科研的進(jìn)展,建成的肺癌病例數(shù)據(jù)庫(kù)可以在計(jì)算機(jī)專(zhuān)業(yè)人員的幫助下簡(jiǎn)便地增減數(shù)據(jù)表中的項(xiàng)目。不僅僅局限于橫向的肺癌發(fā)病、診斷、治療等信息的比較,隨時(shí)間動(dòng)態(tài)變化的數(shù)據(jù)也記錄在數(shù)據(jù)庫(kù)中,這樣使得醫(yī)院的HIS病歷系統(tǒng)中的信息資源更具有活力。此外,還兼有血液標(biāo)本庫(kù)及組織標(biāo)本庫(kù)的功能,在基礎(chǔ)實(shí)驗(yàn)研究的同時(shí)與臨床資料緊密結(jié)合,得出的研究結(jié)果意義更大、指導(dǎo)性更強(qiáng)。
3.3 網(wǎng)絡(luò)安全 目前我國(guó)腫瘤數(shù)據(jù)庫(kù)的建設(shè)尚在起步階段、未能聯(lián)網(wǎng),盡管本肺癌病例數(shù)據(jù)庫(kù)可以實(shí)現(xiàn)網(wǎng)絡(luò)化,但由于網(wǎng)絡(luò)安全及醫(yī)療信息保密性的問(wèn)題,目前暫時(shí)未能將此項(xiàng)功能展開(kāi)。隨著系統(tǒng)的不斷完善與資源條件的許可,將盡快將建成的肺癌病例數(shù)據(jù)庫(kù)發(fā)布到Internet上,實(shí)現(xiàn)資源共享。同時(shí)隨著研究深入、肺癌病例數(shù)據(jù)庫(kù)影響面的擴(kuò)大,將會(huì)完善其他的各項(xiàng)功能。
[1] Jemal A,Siegel R,Xu J,ect.Cancer Statistics[J].CA Cancer J Clin,2010,60(5):277 -300.
[2] 侯鳳貞,尤渺寧,李紀(jì)虎.肺癌病例資料數(shù)據(jù)庫(kù)系統(tǒng)的建立[J].現(xiàn)代醫(yī)院,2008,8(2):141 -142.
[3] 劉 赟,楊宇飛.綜合治療晚期非小細(xì)胞肺癌數(shù)據(jù)庫(kù)臨床病例分析[J].醫(yī)學(xué)研究雜志,2009,38(5):107-111.
[4] 靳 毅,劉 巍.非小細(xì)胞肺癌患者數(shù)據(jù)庫(kù)的設(shè)計(jì)與建立[J].醫(yī)學(xué)信息學(xué)雜志,2010,31(5):22-24.
[5] Roy S,Saha K.Development of Media Search Engine & its Optimization[J].Journal of Information and Computing Science,2011,6(4):255 -260.
[6] Laverty J P,Wood D,Turchek J.Implementing a Dynamic Database - Driven Course Using LAMP[J].Information Systems Education Journal,2011,9(7):33 -40.
[7] Jin P Y,Peng C.The Development of Online Examination System Based on B/S Structure [J].Key Engineering Materials,2011:474 -476,265 -270.
[8] Bhaskarla A,Tang PC,et al.Analysis of second primary lung cancer in the SEERdatabase[J]JSurg Res,2010,162(1):1 - 6.
[9] Martinez SR,Chen SL,Bilchik AJ.Treatment disparities in Hispanic rectal cancer patient cancer patient:aSEER database study[J]Am Surg.2006,72(10):906 -8.
[10]陳育德.中國(guó)腫瘤防治信息系統(tǒng)的建設(shè)和開(kāi)發(fā)利用的思考[J].中國(guó)腫瘤,2002,11(4):212 -214.
[11]鮑萍萍,鄭 螢,王春芳,等.上海市腫瘤病人數(shù)據(jù)庫(kù)的建立和利用[J].中國(guó)腫瘤,2005,14(8):514-516.
[12]陳嘉寶,吳兆紅.肺癌病例數(shù)據(jù)庫(kù)系統(tǒng)的研究進(jìn)展[J].國(guó)際醫(yī)藥衛(wèi)生導(dǎo)報(bào),2011,17(18):2220 -2223.