吳靜云, 米悅, 劉義, 馬帥, 李作峰, 施雅慧, 李俊博, 魏娟, 王霄英
·腹部影像學·
泌尿系結石患者手術方式的選擇:“臨床信息+CT特征”的預測效能
吳靜云, 米悅, 劉義, 馬帥, 李作峰, 施雅慧, 李俊博, 魏娟, 王霄英
目的探討泌尿系結石手術前的臨床信息(癥狀、體征等)和CT報告與手術方式的相關性。方法選取因泌尿系結石住院治療的患者的病例資料,導出有完整術前資料的患者文檔,以自然語言處理(NLP)技術對文檔進行分析,提取加工其中的關鍵信息,研究術前關鍵信息與手術方式的相關性。結果收集連續(xù)患者資料371例,行輸尿鏡碎石術(URL)患者190例,行經(jīng)皮腎鏡碎石取石術(PNL)患者142例,行輸尿管軟鏡碎石術(RIRS)患者39例。利用NLP比較臨床信息、CT報告與手術方式的相關性,單純“CT報告”分類符合率為0.456,ROC曲線下面積為0.608;“CT報告+臨床信息”分類符合率為0.461,ROC曲線下面積為0.618。增加臨床信息后,NLP模型的分類符合率未見明顯變化,但決策樹路徑變長,節(jié)點變多,規(guī)則復雜,不利于臨床使用。結論對于擬行手術的泌尿系結石患者,手術前的CT報告與手術方式具有相關性,可為手術方式的臨床決策提供直接有效的信息。增加癥狀和體征的臨床信息,不能提高預測手術方式的符合率。
自然語言處理; 臨床決策; 泌尿系統(tǒng)結石; 影像信息學
泌尿系結石是泌尿系統(tǒng)的常見病和多發(fā)病,在結石患者就診過程中,通常在先有臨床癥狀(以血尿、腹痛為主),有時可有查體的陽性發(fā)現(xiàn),在此基礎上行CT檢查可做出結石的確定診斷,同時提供指導治療的信息[1]。本研究按照泌尿系結石患者最終進行的手術方式進行分類,利用自然語言處理(natural language processing,NLP)決策樹方法來探究患者的臨床信息(癥狀、體征)和CT報告內(nèi)容與手術方式的相關性,研究各種信息在臨床醫(yī)生決策過程中的價值。
材料與方法
1.研究對象
選取住院病例系統(tǒng)中診斷為“泌尿系結石”、并行手術治療的連續(xù)病例,均有完整的癥狀、體征、CT報告資料。將上述資料導出為Excel文件,存儲并匯總后進行NLP分析。
2.NLP分析
首先進行文檔預處理,手工修正有錯誤、缺失信息的數(shù)據(jù),對不能用于分析的文檔刪除,形成raw_text格式。
然后進行CT特征的提取和加工,分詞、形成向量,統(tǒng)計詞頻、以高頻詞匯構建特征向量,進行語義分析,最終得到描述CT特征的關鍵詞。
再進行臨床信息的提取和加工,從出院小結中刪除包含最終手術方案部分的描述,利用正則表達式識別“入院后”“行XX術”等關鍵詞,將“出院小結”部分拆分成手術前臨床信息描述部分和手術方案部分。手術方案部分的描述不進入詞袋模型的構建過程。
patterns = [u'[^。;]*收入我[科室院]([^。;])', u'[^。;]*[/d-]+[^,。前。,]+術[^后]', u'[^。;]*入院后', u'[^。;]*完善.{,3}檢查', u'[^。;]*檢查基本完善', u'[^。;]*手術.{,5}順利', u'[^。;]*行[^、,。]+術']
對上述拆分出的CT報告內(nèi)容和臨床信息構建ngram信息,用于決策樹的構建與評價。
3.統(tǒng)計學方法
以十折交叉驗證方法驗證僅用“CT報告”、“CT報告+臨床信息”時,NLP模型預測手術方案的分類符合率。
結果
371例患者的連續(xù)資料入組,其中行輸尿鏡碎石術(ureteroscopic lithotripsy,URL)190例,行經(jīng)皮腎鏡碎石取石術(percutaneous nephrolithotripsy,PNL)142例,行輸尿管軟鏡碎石術(retrograde intrarenal surgery,RIRS)39例。
從“CT報告+臨床信息”中提取的信息,構建決策樹見圖1。
比較“CT報告”、“CT+臨床信息”NLP的驗證結果(表1)。從表1所示的具體評價指標可以看出,僅用“CT報告”的模型對各個分類的識別性能與“CT報告+臨床信息”相似。在已有CT報告的基礎上,增加臨床信息對于手術方案的決策并未提供更多的幫助,但此時的決策樹路徑更長,節(jié)點多,規(guī)則復雜。從實際工作的角度考慮,與“CT報告+臨床信息”比較,僅使用“CT報告”中的內(nèi)容對于決策提供的信息更加直接有效,相比之下決策樹更小、決策路徑更短。
表1 不同NLP模型決策樹的驗證結果
討論
泌尿系結石的常見臨床表現(xiàn)為:腰腹部絞痛、脹痛、血尿,偶伴惡心、睪丸疼痛、膀胱刺激癥狀[2]等,不僅影響患者生活質量,而且其引起的泌尿系梗阻可危害腎功能甚至繼發(fā)嚴重感染。多排螺旋CT檢查是泌尿系結石首選的影像檢查方法,可清晰顯示結石數(shù)量、位置、大小、CT值、與周圍組織的關系及腎積水情況等,增強CT還可進一步評價腎臟功能。所以CT既有確診結石的作用,又有指導結石治療的價值[3-4]。目前結石治療以微創(chuàng)腔內(nèi)手術為主,臨床醫(yī)生選擇手式方式時,需綜合考慮患者的全身狀況和結石具體情況[5]。
本研究利用NLP技術,探索使用基于決策樹的數(shù)據(jù)挖掘技術是否可對臨床手術決策起到提示作用。前期本團隊已初步驗證了NLP可提取CT報告中的關鍵特征,與專家提取的關鍵特征具有可比性。另外,NLP提取的特征,在經(jīng)過優(yōu)化后可模擬臨床醫(yī)生的決策,CT報告中結石、炎癥和輸尿管形態(tài)的描述與手術方式的選擇有一定的相關性。在以上前期工作的基礎上,本研究試圖探索增加臨床信息后,可否進一步提高NLP對手術方式的預測效能。但結果顯示,增加臨床信息不能提高對手術方式的預測符合率,考慮其原因,可能有以下兩個方面:
①增加臨床信息后,NLP的數(shù)據(jù)質量下降,降低了決策效能。本研究對比了“CT報告”、“CT報告+臨床信息”對臨床決策的價值,結果顯示單純使用“CT報告”決策符合率為0.456,使用“CT報告+臨床信息”符合率為0.461。十折交叉驗證結果顯示,兩種模型對各個分類的識別性能相近,只在數(shù)字上有細微的差異。從模型結構分析中可以看出,使用臨床信息時的決策樹決策路徑更長,節(jié)點更多,規(guī)則更加復雜。將CT報告、臨床信息兩部分內(nèi)容整合之后,由于報告內(nèi)容的具體表述不完全一致,導致詞頻矩陣更加稀疏,使得模型的預測能力有所降低。因此,僅CT報告中的內(nèi)容可為臨床決策提供更加直接有效的信息,且決策樹計算規(guī)則相對簡化。
②臨床信息的實際價值主要在入院選擇和預后評估,而對手術方式的選擇價值明顯低于CT信息。在常規(guī)實際工作中,泌尿系結石治療決策的制定需要考慮到患者的所有信息例如患者的基礎疾病、目前的臨床癥狀和體征等臨床信息、泌尿系統(tǒng)的解剖結構、結石的影像征象、患者的訴求等復雜因素,最終由醫(yī)患雙方協(xié)商決定。但臨床醫(yī)生做出決策時,各部分信息的權重并不相同。本研究收集的病例均為住院手術的結石患者,這些患者術前已排除了手術禁忌癥,例如全身感染、發(fā)熱等,即已經(jīng)決定選擇手術治療了。那么進一步確定手術方案時,則主要依靠CT征象。CT的診斷價值首先是除外非結石性的血尿病因,特別是腫瘤性病變[6];其次是描述結石的關鍵特征,大多數(shù)情況下這些關鍵特征是選擇術式的主要依據(jù)[7]。本研究以NLP的客觀數(shù)據(jù),提出了術式選擇過程以CT信息為主、增加臨床信息不改變術式選擇的推論,揭示了本疾病在日常臨床工作決策過程中可能的規(guī)律,當然這一推論尚需大量實驗反復驗證。實際上,在疾病的診治過程中,這種情況并不少見,如:疾病影像診斷明確,以微創(chuàng)術式為主,手術整體難度不大、手術對患者全身情況要求不高時,病灶的局部信息對術式的選擇更重要[8]。需注意的是,手術方式的選擇僅是結石患者診治全過程中的一個環(huán)節(jié),臨床信息在其他環(huán)節(jié)的決策應有重要價值,今后應進一步研究。
圖1 “CT+臨床信息”的決策樹。
“CT報告+臨床信息”有望用于區(qū)分門診與住院治療。上尿路結石是泌尿外科常見疾病,治療方案較多,常用治療方案包括保守治療、藥物治療、體外沖擊波碎石、輸尿管鏡取石術、經(jīng)皮腎鏡取石術及開放手術。隨著微創(chuàng)術式的普及,泌尿外科醫(yī)師在結石治療時面臨多重選擇。治療前根據(jù)影像資料準確判斷結石的相關信息,可以幫助臨床醫(yī)生制定更加詳實可靠的治療方案[9]。泌尿系CT報告可以提供結石的位置、大小、成分等信息,有利于臨床優(yōu)化現(xiàn)有的治療方案,制定一個標準的診斷治療流程。但CT報告中不能反映患者的病史、全身情況,而這些對選擇治療方案也是非常重要的[10]。最近人工研究的結果已顯示,因急性腎絞痛就診的患者,CT報告結石較大、密度較高、位于近端的,合并寒戰(zhàn)、發(fā)熱和白細胞升高的患者預測其行有創(chuàng)治療的可能性較高[11]。所以,將來可使用大量數(shù)據(jù),以NLP研究“CT報告+臨床信息”對選擇入院手術治療的患者是否具有指導作用。
“CT報告+臨床信息”有望用于評價結石的復發(fā)和預后。結石形成的危險因素主要有代謝異常、尿路梗阻、感染、異物等局部因素以及引起結石的藥物因素。結石成因可以用于評估治療方案及預后,它影響結石的復發(fā)幾率[12]。泌尿系結石的常見成分為含鈣結石、磷酸鎂銨結石(鳥糞石)、尿酸結石及胱氨酸結石,通常是混合成分結石,雙能量CT可分析結石成分[13]。所以,將來可以NLP研究“CT報告+臨床信息+隨訪信息”,對患者的術后并發(fā)癥、結石復發(fā)和預后做出評估[14]。目前已有研究已證明,影像資料對患者的預后有明確的提示作用[15],與臨床資料結合,形成“影像組學 (radiomics)”、“影像基因組學(radiogenomics)”數(shù)據(jù)[16],是一種重要的影像信息學研究方法,用于預后評價的作用已經(jīng)獲得一些證據(jù)的支持,是影像與臨床信息整合的重要價值之一。
本研究的結果雖然沒有接受最初的研究假設,增加臨床信息后未能提高CT對手術方式的預測效能,但其提示意義仍然非常重要:在影像信息學研究過程中,首先應定義明確的任務,其次應以高質量的數(shù)據(jù)進行研究,最后IT研究人員應與醫(yī)務人員緊密合作,充分挖掘有效數(shù)據(jù),才能為臨床決策提供有力的幫助。更加重要的是,疾病的種類千差萬別,即使是同一種疾病在不同的決策階段,各類信息的輔助決策價值也是不同的。所以,臨床醫(yī)學中的信息化進程不可能一蹴而就,研究者必須有足夠的耐心,細致地逐個解決問題,才有可能把信息學工具真正用于臨床工作中。
[1] Pearle MS,Goldfarb DS,Assimos DG,et al.American urological assocation.Medical management of kidney stones:AUA guideline[J].J Urol,2014,192(2):316-324.
[2] Heller MT,Tublin ME.In search of a consensus:evaluation of the patient with hematuria in an era of cost containment[J].AJR,2014,202(6):1179-1186.
[3] Bosmans JML,Weyler JJ,De Schepper AM,et al.The radiology report as seen by radiologists and referring clinicians:results of the COVER and ROVER surveys[J].Radiology,2011,259(1):184-195.
[4] Nazim SM,Ather MH,Khan N.Measurement of ureteric stone diameter in different planes on multi-detector computed tomography:impact on the clinical decision making[J].Urology,2014,83(2):288-292.
[5] Cheng PM,Moin P,Dunn MD,et al.What the radiologist needs to know about urolithiasis:Part 2-CT findings,reporting,and treatment[J].AJR,2012,198(6):W548-W554.
[6] Moloney F,Murphy KP,Twomey M,et al.Haematuria:an imaging guide[J].Adv Urol,2014:1-9.doi:10.1155/2014/414125.
[7] Fulgham PF,Assimos DG,Pearle MS,et al.Clinical effectiveness protocols for imaging in the management of ureteral calculous disease:AUA technology assessment[J].J Urol,2013,189(4):1203-1213.
[8] Bultitude M,Rees J.Management of renal colic[J].BMJ,2012,345:e5499.doi:10.1136/bmj.e5499.
[9] Sahin C,Eryildirim B,Kafkasli A,et al.Predictive parameters for medical expulsive therapy in ureteral stones:a critical evaluation[J].Urolithiasis,2015,43(3):271-275.
[10] Choi T,Yoo KH,Choi SK,et al.Analysis of factors affecting spontaneous expulsion of ureteral stones that may predict unfavorable outcomes during watchful waiting periods:what is the influence of diabetes mellitus on the ureter[J].Korean J Urol,2015,56(6):455-460.
[11] Lotan E,Weissman O,Guranda L,et al.Can unenhanced CT findings predict interventional versus conservative treatment in acute renal colic[J].AJ R,2016,207(5):1016-1021.
[12] Scales CD Jr,Smith AC,Hanley JM,et al.Prevalence of kidney stones in the united states[J].Eur Urol,2012,62(1):160-165.
[13] 范兵,邱建星,王霄英,等.雙能CT對離體泌尿系尿酸結石的診斷價值[J].放射學實踐,2012,27(3):268-270.
[14] Tonolini M,Villa F,Ippolito S,et al.Cross-sectional imaging of iatrogenic complications after extracorporeal and endourological treatment of urolithiasis[J].Insights Into Imaging,2014,5(6):677-689.
[15] Huber J,Winkler A,Jakobi H,et al.Preoperative decision making for renal cell carcinoma:cystic morphology in cross-sectional imaging might predict lower malignant potential[J].Urol Oncol,2014,32(1):37.
[16] Lambin P,Rios-Velazquez E,Leijenaar R,et al.Radiomics:extracting more information from medical images using advanced feature analysis[J].Eur J Cancer,2012,48(4):441-446.
Correlationbetweenclinicalinformation,CTsignsandsurgicalproceduresofurinarycalculus:naturallanguageprocessingresearch
WU Jing-yun,MI Yue,LIU Yi,et al.
Department of Radiology,Peking University First Hospital,Beijing 100034,China
Objective:To explore the value of clinical information (symptom+sign) and CT findings of urinary calculus in clinical decision-making of surgical procedures.MethodsMedical recording documents were retrospectively archived from HIS for patients who had CT examination for urinary calculus and surgical procedures in the hospital.By using different types of NLP model,all the imaging and clinical data were extracted and processed for searching the descriptors of CT features,symptoms and signs.The correlation of the descriptors with surgical methods was studied.Results371 consecutive data were collected (142 percutaneous nephrolithotripsy,190 ureteroscopic lithotripsy,and 39 retrograde intrarenal surgery,respectively).The precision of quot;CT reportquot; was 0.456 (AUC 0.608).The precision of quot;CT report+clinical informationquot; was 0.464 (AUC 0.618).With additional information of clinical data,the classification accuracy of NLP was not improved,but leading to longer path of decision tree,more nodes and more complex rules.ConclusionThe content of CT report can provide direct and effective information for clinical decision-making of surgical procedure.
Natural language processing; Clinical decision-making; Urinary calculus; Imaging informatics
100034 北京,北京大學第一醫(yī)院醫(yī)學影像科(吳靜云、劉義、馬帥、王霄英),泌尿外科(米悅);200233 上海,飛利浦中國研究院(李作峰、施雅慧、李俊博、魏娟)
吳靜云(1985-),女,廣西桂林人,博士,主治醫(yī)師,主要從事腎臟功能MR成像、對比劑研究及醫(yī)學數(shù)據(jù)庫研究。
王霄英,E-mail: cjr.wangxiaoying@vip.163.com
R814.42; R693.4
A
1000-0313(2017)11-1183-04
10.13609/j.cnki.1000-0313.2017.11.018
2016-11-10)