李月云,聶剛,王海波,曲慧利,張東峰,王新剛
(青島大學(xué)醫(yī)學(xué)院,山東青島 266003 1 附屬醫(yī)院乳腺科; 2 公共衛(wèi)生系)
乳癌病人資料數(shù)據(jù)庫(kù)構(gòu)建與應(yīng)用
李月云1,聶剛1,王海波1,曲慧利1,張東峰2,王新剛1
(青島大學(xué)醫(yī)學(xué)院,山東青島 266003 1 附屬醫(yī)院乳腺科; 2 公共衛(wèi)生系)
目的構(gòu)建能組織、存儲(chǔ)、管理乳癌病人資料的乳癌單病數(shù)據(jù)庫(kù),以實(shí)現(xiàn)信息的快速統(tǒng)計(jì)分析。方法整合腫瘤標(biāo)本數(shù)據(jù)和病人病歷資料,應(yīng)用EpiData軟件構(gòu)建乳癌資料數(shù)據(jù)庫(kù),選取2011年8月1日—2012年8月1日住院617例乳癌病人信息錄入數(shù)據(jù)庫(kù)。結(jié)果EpiData乳癌數(shù)據(jù)庫(kù)數(shù)據(jù)結(jié)構(gòu)合理,實(shí)用性強(qiáng),短期內(nèi)實(shí)現(xiàn)了大規(guī)模乳癌資料的電子化和統(tǒng)計(jì)分析。結(jié)論EpiData乳癌數(shù)據(jù)庫(kù)功能完善,對(duì)相關(guān)數(shù)據(jù)具備較強(qiáng)的的管理、統(tǒng)計(jì)分析能力,值得在臨床科研中進(jìn)一步推廣。
乳房腫瘤;醫(yī)學(xué)信息學(xué);數(shù)據(jù)庫(kù)
乳癌發(fā)病率居女性各類腫瘤首位,且發(fā)病呈上升趨勢(shì)[1],了解其病因、發(fā)病機(jī)制對(duì)降低乳癌發(fā)生具有重要意義。對(duì)乳癌病人的臨床病歷資料實(shí)行系統(tǒng)、規(guī)范、準(zhǔn)確、便捷的管理,可更好地開(kāi)展臨床、教學(xué)和科研工作。目前國(guó)外尚未見(jiàn)乳癌單病數(shù)據(jù)庫(kù)的報(bào)道,國(guó)內(nèi)雖已有單位利用數(shù)據(jù)庫(kù)收集、儲(chǔ)存、整理乳癌病人資料,但尚不成熟。本研究應(yīng)用EpiData構(gòu)建專業(yè)化乳癌單病數(shù)據(jù)庫(kù),對(duì)病人資料進(jìn)行管理、分析,對(duì)病例進(jìn)行隨訪追蹤,以評(píng)估乳癌治療效果,為臨床科研工作提供專業(yè)資源。
1.1 資料來(lái)源
2011年8月1日—2012年8月1日,選取我科收治的617例初發(fā)乳癌病人的臨床資料。納入標(biāo)準(zhǔn):①經(jīng)組織病理學(xué)檢查確診為乳癌病人;②不影響病理科取材情況下能獲得足夠的標(biāo)本;③取得病人及其家屬的知情同意并簽字;④符合醫(yī)學(xué)倫理學(xué)規(guī)定,并通過(guò)醫(yī)院醫(yī)學(xué)倫理委員會(huì)審批。排除標(biāo)準(zhǔn):①其他器官腫瘤轉(zhuǎn)移到乳房的病人;②非初次診斷乳癌的病人。
1.2 乳癌數(shù)據(jù)庫(kù)構(gòu)建
通過(guò)系統(tǒng)分析將乳癌原始數(shù)據(jù)表劃分為臨床信息和病理標(biāo)本庫(kù)兩大板塊。其中病理標(biāo)本由專業(yè)人員收集,數(shù)據(jù)庫(kù)錄入相應(yīng)的病理編號(hào)。參考乳房疾病相關(guān)資料[2-4],將臨床信息部分設(shè)計(jì)為8個(gè)板塊,每個(gè)板塊包含幾十個(gè)小的部分:病案號(hào),姓名,身份證號(hào),性別,入院日期,初步診斷,影像學(xué)編號(hào),最后診斷,手術(shù)方式,輔助治療方法,病理診斷,TNM分期,雌、孕激素受體和HER-2表達(dá)狀態(tài),病理標(biāo)本編號(hào),隨訪結(jié)果,備注等(圖1)。
運(yùn)行EpiData軟件,根據(jù)上述字段設(shè)計(jì)建立數(shù)據(jù)庫(kù)結(jié)構(gòu)文件(QES文件),在QES文件基礎(chǔ)上創(chuàng)建數(shù)據(jù)庫(kù)(REC文件);編寫(xiě)CHK文件對(duì)錄入數(shù)據(jù)進(jìn)行控制。
2.1 數(shù)據(jù)庫(kù)的實(shí)際應(yīng)用
2.1.1 數(shù)據(jù)查找 可應(yīng)用任意字段如姓名、住院號(hào)等搜索病人的記錄,進(jìn)行內(nèi)容的瀏覽和修改,方便、快捷,實(shí)現(xiàn)了臨床資料的電子化管理(圖2)。
2.1.2 可擴(kuò)展性的統(tǒng)計(jì)分析 基于EpiData軟件的乳癌數(shù)據(jù)庫(kù)自身帶有分析模塊,包括一些常用的數(shù)據(jù)瀏覽、作圖和描述性分析、相關(guān)回歸分析、可靠性檢驗(yàn)、一致性檢驗(yàn)等,操作簡(jiǎn)單,實(shí)用性強(qiáng)。同時(shí),還具有較強(qiáng)的數(shù)據(jù)轉(zhuǎn)換功能,可輸出和讀取多種格式的數(shù)據(jù)文件,如Excel、SPSS、SAS、Stata、dBasa等,便于使用其他統(tǒng)計(jì)分析軟件進(jìn)一步分析研究。見(jiàn)圖3。
2.2 數(shù)據(jù)錄入及驗(yàn)證
對(duì)617例初發(fā)乳癌病人的病例資料及病理標(biāo)本進(jìn)行統(tǒng)計(jì),結(jié)果見(jiàn)表1。
乳癌發(fā)病率呈上升趨勢(shì),全世界每年新發(fā)現(xiàn)乳癌病人約150萬(wàn),每年死于乳癌者有57萬(wàn)人[5]。乳癌發(fā)病率已超過(guò)宮頸癌,躍居女姓惡性腫瘤的第一位[6]。我國(guó)缺乏統(tǒng)一的乳癌發(fā)病資料。目前乳癌的治療指南大都是參考西方發(fā)達(dá)國(guó)家的數(shù)據(jù)制訂的,但由于東西方國(guó)家在乳癌發(fā)病率、發(fā)病年齡、病理類型等方面不盡相同,歐美國(guó)家的治療指南并不完全適合于我國(guó)。因此,十分有必要建立一個(gè)實(shí)用性強(qiáng),能滿足全國(guó)多中心和大樣本錄入需求,內(nèi)容豐富、前沿的乳癌單病數(shù)據(jù)庫(kù)。
雖然近幾年國(guó)外有關(guān)臨床單病數(shù)據(jù)庫(kù)建立、應(yīng)用的文獻(xiàn)報(bào)道不少[7-13],但關(guān)于乳癌專題數(shù)據(jù)庫(kù)的報(bào)道卻鮮見(jiàn)。國(guó)內(nèi)雖有應(yīng)用數(shù)據(jù)庫(kù)建立的綜合性腫瘤隨訪系統(tǒng),但對(duì)乳癌信息隨訪過(guò)于簡(jiǎn)單。盡管目前已有單位應(yīng)用Excel軟件或其他軟件構(gòu)建數(shù)據(jù)庫(kù),收集、儲(chǔ)存、整理乳癌病人資料,但軟件本身的局限性使其在錄入質(zhì)控、存儲(chǔ)量、交互操作等方面存在缺陷。本研究利用EpiData軟件建立了國(guó)內(nèi)首個(gè)基于全面信息化理念管理的乳癌病人綜合注冊(cè)系統(tǒng),該系統(tǒng)為乳癌標(biāo)本庫(kù)與病人隨訪數(shù)據(jù)庫(kù)的有效結(jié)合提供了先進(jìn)和高效的平臺(tái)。本數(shù)據(jù)庫(kù)的優(yōu)點(diǎn)主要有以下幾個(gè)方面。
3.1 可靠性
數(shù)據(jù)錄入過(guò)程難免會(huì)出現(xiàn)錯(cuò)誤,尤其是大批量數(shù)據(jù)錄入過(guò)程,長(zhǎng)時(shí)間錄入可能導(dǎo)致錯(cuò)誤率的上升。本數(shù)據(jù)庫(kù)數(shù)據(jù)核查功能強(qiáng)大且實(shí)現(xiàn)簡(jiǎn)便,在編制數(shù)據(jù)文件時(shí)可以對(duì)數(shù)據(jù)取值范圍、是否重復(fù)錄入、是否必須錄入、自動(dòng)編碼和跳轉(zhuǎn)到指定字段等進(jìn)行設(shè)定,保證了數(shù)據(jù)的高效錄入。此外,本數(shù)據(jù)庫(kù)的雙錄入核查功能支持同一錄入文件的數(shù)據(jù)核對(duì),并提供了對(duì)6個(gè)相同數(shù)據(jù)文件的檢查功能。為保證數(shù)據(jù)錄入的可靠性,將乳癌數(shù)據(jù)REC文件拷貝復(fù)制,由兩組數(shù)據(jù)錄入人員分別錄入各自的REC文件,然后將兩組錄入數(shù)據(jù)進(jìn)行比較、核對(duì)。兩組數(shù)據(jù)雙錄入完成后,可以用“數(shù)據(jù)處理”下的“一致性檢驗(yàn)”選項(xiàng)進(jìn)行數(shù)據(jù)比較核對(duì),在彈出的窗口中,選擇兩組雙錄入核對(duì)的數(shù)據(jù)文件,完成對(duì)雙錄入核對(duì)設(shè)置后,根據(jù)報(bào)告核對(duì)原始數(shù)據(jù)(圖4),從而能夠有效保證原始數(shù)據(jù)的準(zhǔn)確性。
3.2 與調(diào)查表形式一致的可視數(shù)據(jù)錄入界面
可將書(shū)面形式的調(diào)查表計(jì)算機(jī)化,建立與書(shū)面調(diào)查表形式一致的可視界面進(jìn)行數(shù)據(jù)錄入,在一定程度上使數(shù)據(jù)錄入更為方便,也有助于減少數(shù)據(jù)錄入錯(cuò)誤(圖5)。
3.3 內(nèi)容完備性
數(shù)據(jù)庫(kù)首次將病理標(biāo)本庫(kù)納入乳癌醫(yī)學(xué)數(shù)據(jù)庫(kù),使其內(nèi)資料更加完整,科研價(jià)值更高:不但能夠完成普通數(shù)據(jù)庫(kù)所開(kāi)展的短期生存分析和多因素分析等工作,還能夠利用數(shù)據(jù)庫(kù)中的病理、影像、??撇轶w資料等信息對(duì)乳癌的影像學(xué)表現(xiàn)、肉眼觀察與病理學(xué)分型、基因表達(dá)之間的潛在關(guān)系等展開(kāi)分析,以支持對(duì)乳癌的發(fā)病機(jī)制開(kāi)展深入研究,尋求治療乳癌的新方法。
該數(shù)據(jù)庫(kù)不僅具備控制異常數(shù)據(jù)錄入和可移植性、交互性與通用性、兼容性等優(yōu)點(diǎn),且內(nèi)容更全面,涵蓋了臨床、影像、病理、信息4個(gè)方面的全面數(shù)字化管理,能更有效地管理乳癌病人資料,為循證醫(yī)學(xué)提供客觀的臨床證據(jù),為探明乳癌的病因和發(fā)病機(jī)制,尋求最佳的治療方案,降低乳癌的發(fā)病率及死亡率提供可靠的資源。
[1]何健榮,高曦,任澤舫.全球女性乳癌和卵巢癌最新發(fā)病分布特征[J].中國(guó)腫瘤,2009,18(3):169-172.
[2]劉洪,張漢祥,李相林,等.影響乳癌根治術(shù)后病人預(yù)后的因素分析[J].青島大學(xué)醫(yī)學(xué)院學(xué)報(bào),2000,3(2):125-127.
[3]方圣,曹明智,王群.STK15在乳癌組織中的表達(dá)[J].齊魯醫(yī)學(xué)雜志,2011,26(6):484-488.
[4]陳耀坤,馬杰,方世寧,等.影響乳癌預(yù)后的因素分析[J].齊魯醫(yī)學(xué)雜志,2000,15(4):255-256.
[5]SIEGEL R,NAISHADHAM D,JEMAL A.Cancer statistics, 2012[J].CA:a Cancer Journal for Clinicians,2010,62(1):10-29.
[6]余江,卿三華,黃祥成,等.大腸癌Access數(shù)據(jù)庫(kù)的建立及其應(yīng)用[J].第一軍醫(yī)大學(xué)學(xué)報(bào),2003,23(1):78-79.
[7]HAMBEK M,ADUNKA O,BAGHI M,et al.Ad Onco:a database for clinical and scientific documentation of head and neck oncology[J].Annals of Otology,Rhinology,&Laryngology,2006,115(2):144-149.
[8]TAKAI K,SAWAZAKI M,TOMARI S,et al.Development of a new data entry system suitable for the Japan Adult Cardiovascular Surgery Database[J].General Thoracic and Cardiovascular Surgery,2009,57(4):192-196.
[9]EL-HAYES K,HARRITY C,ABU ZEINEH T.A novel management database in obstetrics and gynaecology to introduce the electronic healthcare record and improve the clinical audit process[J].Studies in Health Technology and Informatics,2006,121:266-275.
[10]BOUSQUET P J,DEMOLY P,ROMANO A,et al.Pharmacovigilance of drug allergy and hypersensitivity using the ENDA-DAHD database and the GALEN platform.The Galenda project[J].Allergy,2009,64(2):194-203.
[11]YEUNG M J,SERPELL J W.Development of a parathyroid database in Melbourne and review of the last 50 cases[J].ANZ Journal of Surgery,2004,74(9):741-744.
[12]XU L Z,MARESH G A,GIARDINA J,et al.Comparison of different microarray data analysis programs and description of a database for microarray data management[J].DNA and Cell Biology,2004,23(10):643-651.
[13]BENJAMIN I,NOUMOFF J S,CARLSON J A J R,et al.Database management for a gynecologic oncology service[J].Gynecologic Oncology,1990,38(3):431-436.
(本文編輯 黃建鄉(xiāng))
CONSTRUCTION AND APPLICATION OF DATABASE OF THE BREAST CANCER
LI Yueyun,NIE Gang,WANG Haibo,QU Huili,ZHANG Dongfeng,WANG Xin′gang (Department of Breast Surgery,The Affiliated Hospital of Qingdao University Medical College,Qingdao 266003,China)
ObjectiveTo develop a clinical database system that can organize,store and supervise the data of patients with breast cancer and realize rapid statistical analysis of the information.MethodsData of tumor specimens and patients with breast cancer were coordinated,a database of breast cancer was then created by using EpiData software with the information of selected 617 breast cancer patients hospitalized from 2011.08.01 to 2012.08.01.ResultsThe created EpiData breast cancer database had a reasonable data construction and reliably practical,which accomplished large-scale electronic and statistical analysis for breast cancer information in a short time.ConclusionThe EpiData breast cancer database has a flawless function with a stronger capability of management and analysis for the related data,which is worth further extending use in clinical research.
breast neoplasms;medical informatics;databases
R737.9
A
1008-0341(2013)04-0296-03
10.11712/qlyx201304005
2013-03-19;
2013-06-13
山東省教育廳科研基金資助項(xiàng)目(JIILF05),青島市市南區(qū)科技局發(fā)展計(jì)劃(2011-5-004-YY)
李月云(1987-),女,碩士研究生。
王海波(1966-),男,博士,主任醫(yī)師,碩士生導(dǎo)師。