申海洋,彭祥煒,王興,李廣欣,黎功,袁克虹
1.北京清華長庚醫(yī)院放療科,北京 102200;2.清華大學(xué)深圳國際研究生院,廣東深圳 518000
據(jù)2018年GLOBOCAN 數(shù)據(jù)顯示,全球新發(fā)肝癌病例約79 萬例,死亡率居各類惡性腫瘤第2 位[1]。我國是肝癌大國,原發(fā)性肝癌是我國第4位常見惡性腫瘤[2],發(fā)病人數(shù)占全球的55%[3]。2017年,在我國因病早逝的人群中因患肝癌去世的人群排名第5位,死亡率高達(dá)30/10 萬人[4],嚴(yán)重威脅著人們的健康。手術(shù)切除是治療早期原發(fā)性肝癌的首選方法[5],在精準(zhǔn)肝切除理念的指導(dǎo)下,以肝臟的解剖結(jié)構(gòu)和功能分段為基礎(chǔ),借助數(shù)字外科技術(shù)平臺,通過精確的定量分析和手術(shù)規(guī)劃,以達(dá)到徹底清除病灶、最大限度地保留殘余肝臟的結(jié)構(gòu)完整和功能代償、降低手術(shù)創(chuàng)傷的目的。精準(zhǔn)肝切除的發(fā)展極大地提高了肝癌的治療有效率。然而,我國肝癌患者的手術(shù)切除率僅為20%~30%,多數(shù)患者發(fā)現(xiàn)時已達(dá)中晚期[6],錯過手術(shù)治療時間,只能選擇非手術(shù)治療。原發(fā)性肝癌對放射治療敏感,其敏感性與低分化鱗癌相當(dāng)[7]。美國國立綜合癌癥網(wǎng)絡(luò)2018年肝膽腫瘤臨床實(shí)踐指南指出,對于肝癌,任何位置的腫瘤都可以采用放療手段進(jìn)行局部治療,并強(qiáng)烈推薦使用圖像引導(dǎo)下的放射治療[8]。
隨著科技的發(fā)展,放療技術(shù)不斷進(jìn)步,醫(yī)生可以使用三維適形及調(diào)強(qiáng)放射治療等新型放療技術(shù)向靶區(qū)輸送高輻射劑量藥劑,且不會影響肝部的整體功能,使肝癌的放療日趨精準(zhǔn)[9]。盡管如此,放療仍然是一種“有損傷性”的治療方式,其產(chǎn)生的損傷與受照射組織的體積、劑量有關(guān)。一般來說,肝臟受照射的體積越大,其最大的耐受劑量越小,越容易發(fā)生放射性肝損傷[10]。現(xiàn)有放射治療未考慮肝臟的解剖分段與腫瘤靶區(qū)的空間位置關(guān)系,并非真正意義上實(shí)現(xiàn)精準(zhǔn)放療,容易對不同肝段進(jìn)行高劑量輻射轉(zhuǎn)送,無法對肝段進(jìn)行功能性保護(hù),從而增加肝臟功能損傷,造成不良預(yù)后[11]。
借鑒精準(zhǔn)肝切除的理念,依托人工智能系統(tǒng),將腫瘤靶區(qū)與肝分段解剖及脈管系統(tǒng)的位置關(guān)系納入放療計劃設(shè)計、優(yōu)化中考量,最大限度地降低放療對其他肝段的影響,確保剩余肝臟結(jié)構(gòu)完整和功能代償[12-14],將在一定程度上降低放療對正常肝臟組織的損害,進(jìn)而提高放療在肝癌中的治療效果[15]。在構(gòu)建人工智能系統(tǒng)的過程中,數(shù)據(jù)是必需的關(guān)鍵基礎(chǔ)設(shè)施,在很大程度上決定人工智能系統(tǒng)的性能、公平性、穩(wěn)健性、安全性和可擴(kuò)展性[16]?;诖耍狙芯刻岢鲆环N基于肝分段和肝癌輪廓融合的放療靶區(qū)數(shù)據(jù)庫建立方法,進(jìn)而為肝臟正常組織精準(zhǔn)勾畫以及精準(zhǔn)放療的發(fā)展提供數(shù)據(jù)支撐。
放療是以圖像信息為基礎(chǔ)的治療方式,肝癌的放療一般需要經(jīng)過醫(yī)生看診、計算機(jī)斷層掃描(CT)模擬定位、磁共振成像(MRI)、靶區(qū)勾畫、計劃設(shè)計、驗(yàn)證及治療實(shí)施7個步驟。定位階段獲取病灶的圖像信息,同時明確放療實(shí)施部位并標(biāo)記。計劃階段則主要參考患者CT圖像對病灶進(jìn)行靶區(qū)勾畫,經(jīng)過周密的計算和規(guī)劃制定放療處方,盡可能保護(hù)危及器官。當(dāng)前,在靶區(qū)勾畫和計劃階段主要以平面圖像為基準(zhǔn)進(jìn)行,缺乏病灶與肝段的位置關(guān)系,使實(shí)現(xiàn)基于精準(zhǔn)肝切除理念的放療成為難點(diǎn)。因此,為實(shí)現(xiàn)真正意義上的精準(zhǔn)化肝癌放療,必須將具有肝分段與靶區(qū)勾畫的圖像進(jìn)行融合,創(chuàng)建融合圖像數(shù)據(jù)庫。在融合圖像數(shù)據(jù)庫的指導(dǎo)下,放療計劃設(shè)計和實(shí)施可以精確到肝段內(nèi),盡可能保護(hù)剩余肝臟的完整解剖結(jié)構(gòu),使得肝癌放療更加精準(zhǔn)。
此外,當(dāng)前已有不少機(jī)構(gòu)研發(fā)放療自動靶區(qū)勾畫的軟件,但目前尚缺乏統(tǒng)一的結(jié)果檢驗(yàn)標(biāo)準(zhǔn),尤其針對某一器官組織,從而為自動勾畫軟件的推廣增加了很多難度。融合圖像數(shù)據(jù)庫為軟件的測試標(biāo)準(zhǔn)提供了一種參考,可以用來測試現(xiàn)有肝部放療自動靶區(qū)勾畫軟件,驗(yàn)證其勾畫質(zhì)量及勾畫效果,使實(shí)現(xiàn)放療靶區(qū)勾畫的自動化成為可能[17]。因此,非常有必要構(gòu)建肝分段及靶區(qū)勾畫融合的數(shù)據(jù)庫推動智慧化放療和精準(zhǔn)放療的發(fā)展。
本數(shù)據(jù)庫參照人工智能醫(yī)療器械數(shù)據(jù)集質(zhì)量相關(guān)的基礎(chǔ)標(biāo)準(zhǔn),綜合參考醫(yī)療器械、信息技術(shù)、衛(wèi)生數(shù)據(jù)管理、臨床數(shù)據(jù)管理等相關(guān)領(lǐng)域的數(shù)據(jù)質(zhì)量要求與評價方式,根據(jù)人工智能醫(yī)療器械技術(shù)特點(diǎn)而進(jìn)行數(shù)據(jù)庫的建設(shè)[18]。
為了確保既能作為人工智能數(shù)據(jù)庫訓(xùn)練的使用,同時也能作為未來的行業(yè)驗(yàn)證標(biāo)準(zhǔn)和規(guī)范的數(shù)據(jù)庫,本數(shù)據(jù)庫參照多種相關(guān)的規(guī)范,主要包括YY/T 0287-2017《醫(yī)療器械質(zhì)量管理體系用于法規(guī)的要求》、YY/T 0316-2016《醫(yī)療器械風(fēng)險管理對醫(yī)療器械的應(yīng)用》、國家食品藥品監(jiān)督管理總局《深度學(xué)習(xí)輔助決策醫(yī)療器械軟件審評要點(diǎn)(2019年第7 號)》、GB/T 36344-2018《信息技術(shù)數(shù)據(jù)質(zhì)量評價指標(biāo)》、GB/T 34960.5-2018《信息技術(shù):服務(wù)治理第5部分:數(shù)據(jù)治理規(guī)范》、GB/T 25000.12-2017《系統(tǒng)與軟件工程:系統(tǒng)與軟件質(zhì)量要求和評價(SQuaRE)第12 部分:數(shù)據(jù)質(zhì)量模型》等[19]。
醫(yī)學(xué)影像數(shù)據(jù)庫是利用數(shù)據(jù)庫系統(tǒng)將醫(yī)學(xué)影像數(shù)據(jù)信息以匯聚形式展現(xiàn),根據(jù)數(shù)據(jù)結(jié)構(gòu)對影像數(shù)據(jù)或數(shù)據(jù)集進(jìn)行組織、存儲和管理。標(biāo)準(zhǔn)數(shù)據(jù)庫建立在良好的數(shù)據(jù)基礎(chǔ)上,要求數(shù)據(jù)具有真實(shí)性、準(zhǔn)確性、完整性及可塑性。數(shù)據(jù)庫的建立是一個全生命周期的管理過程,需經(jīng)過數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)標(biāo)注及數(shù)據(jù)集構(gòu)建等過程,同時在全過程中保證持續(xù)的數(shù)據(jù)質(zhì)量管理。圖1給出了整個數(shù)據(jù)庫入庫及使用的流程圖。
數(shù)據(jù)采集過程依賴臨床機(jī)構(gòu)實(shí)際的病例數(shù)據(jù)。入選病例圖像為肝癌患者的腹部CT 影像資料,作為原始圖像,在醫(yī)學(xué)影像系統(tǒng)篩選肝癌患者的上述圖像,將數(shù)據(jù)批量導(dǎo)出。導(dǎo)出時對原始圖像數(shù)據(jù)進(jìn)行脫敏處理,隱去所有涉及患者隱私的個人信息,確保數(shù)據(jù)的采集過程符合倫理要求,最終將所采集的圖像數(shù)據(jù)匯聚形成初始數(shù)據(jù)儲存庫留待處理[20]。在之后的流程中,將會分別對同一張原始圖像做帶有肝臟放療靶區(qū)勾畫和分區(qū)分段輪廓標(biāo)注工作,最后將兩者圖像融合,實(shí)現(xiàn)精準(zhǔn)肝切除理念下放療優(yōu)化。
數(shù)據(jù)預(yù)處理過程是保證數(shù)據(jù)庫準(zhǔn)確性的基礎(chǔ),在這一過程中需對數(shù)據(jù)進(jìn)行清洗篩選,刪減質(zhì)量較差、診斷存疑及診斷不符的圖像,留存清晰、典型的高質(zhì)量圖像,進(jìn)而形成基礎(chǔ)數(shù)據(jù)庫。
2.3.1 肝癌放療靶區(qū)勾畫在患者的腹部CT 圖像上完成肝癌的放療靶區(qū)標(biāo)注,標(biāo)注內(nèi)容包括肝癌病灶的大體靶區(qū)(GTV)、臨床靶區(qū)(CTV)、計劃靶區(qū)(PTV)和危及器官等,標(biāo)注工作由具有5年以上工作經(jīng)驗(yàn)且經(jīng)統(tǒng)一培訓(xùn)的放療科醫(yī)師完成。標(biāo)注規(guī)則以肝癌放射治療指南為基礎(chǔ),由放療領(lǐng)域?qū)<抑贫?。隨后,在最大限度保護(hù)危及器官的前提下,由物理師進(jìn)行放療計劃設(shè)計,再由醫(yī)師進(jìn)行最終審核,確保無誤后方可納入數(shù)據(jù)庫形成靶區(qū)勾畫標(biāo)注數(shù)據(jù)庫。
2.3.2 肝臟分區(qū)分段標(biāo)注在肝臟三維重建圖像上根據(jù)肝臟血管膽管樹的走形進(jìn)行肝臟分區(qū)分段的標(biāo)注。標(biāo)注規(guī)則以肝臟解剖學(xué)為基礎(chǔ),由肝臟外科領(lǐng)域?qū)<抑贫?,?biāo)注過程在肝臟外科醫(yī)生的指導(dǎo)下進(jìn)行,核對無誤后形成肝臟解剖分區(qū)分段輪廓數(shù)據(jù)庫。在標(biāo)注過程中,每1 例圖像均由兩位醫(yī)師標(biāo)注,并通過雙重審核保證標(biāo)注結(jié)果的質(zhì)量。
在輪廓融合階段,通過算法將相互匹配的放療靶區(qū)勾畫圖像(圖2)與肝臟解剖分段圖像進(jìn)行輪廓融合,使得肝臟的分區(qū)分段及放療計劃靶區(qū)在一個圖像中同時存在(圖3),得到原發(fā)性肝癌輪廓融合圖像(圖4),進(jìn)而實(shí)現(xiàn)精準(zhǔn)肝切除理念下的肝臟放療優(yōu)化。
2.5.1 數(shù)據(jù)集的劃分運(yùn)用以上方法建立原發(fā)性肝癌輪廓融合圖像標(biāo)準(zhǔn)數(shù)據(jù)庫后,可以為肝癌圖像處理任務(wù)提供有效的支撐數(shù)據(jù)集。例如做靶向肝分割任務(wù)時,可以將數(shù)據(jù)庫按照3:1:1 的比例劃分為訓(xùn)練集、驗(yàn)證集、測試集。為了保證數(shù)據(jù)集劃分的科學(xué)性和準(zhǔn)確性,3 個數(shù)據(jù)集中的病人性別、年齡、GTV、CTV、PTV、肝臟體積等數(shù)據(jù)統(tǒng)計均值盡可能保持一致。訓(xùn)練集用于最初的算法訓(xùn)練與制定,讓模型擬合數(shù)據(jù)樣本;驗(yàn)證集用于驗(yàn)證當(dāng)前模型的泛化能力,并對模型優(yōu)化更新;測試集用于評估最終模型的泛化能力,進(jìn)而滿足算法模型的解釋性、準(zhǔn)確性及魯棒性要求[21]。
除了上述劃分?jǐn)?shù)據(jù)集的方法外,還可以用交叉驗(yàn)證法使用數(shù)據(jù)集完成醫(yī)學(xué)圖像處理相關(guān)任務(wù)。交叉驗(yàn)證法的做法是將肝癌數(shù)據(jù)集劃為均等但不相交的K份,每一份數(shù)據(jù)集中病人性別、年齡、GTV、CTV、PTV、肝臟體積等數(shù)據(jù)統(tǒng)計均值盡可能保持均等。之后將K-1份數(shù)據(jù)集作為訓(xùn)練集,將另外一份數(shù)據(jù)集作為測試集,將算法執(zhí)行K次[22]。
2.5.2 數(shù)據(jù)集的使用本文構(gòu)建的肝癌數(shù)據(jù)庫可以用于基于深度學(xué)習(xí)的肝分割訓(xùn)練和測試任務(wù)[17]。Unet是著名的醫(yī)學(xué)圖像分割網(wǎng)絡(luò),運(yùn)用本文數(shù)據(jù)集可以訓(xùn)練Unet 網(wǎng)絡(luò)以得到精準(zhǔn)肝分割模型。具體流程是:向網(wǎng)絡(luò)輸入肝癌圖像,Unet 網(wǎng)絡(luò)會將圖像編碼(降采樣)、圖像解碼(升采樣),最后將圖像像素級融合以輸出分割結(jié)果,可以計算每一次分割結(jié)果與原圖MASK 的Dice 系數(shù)作為損失函數(shù),之后反向傳播逐步優(yōu)化模型[23]。訓(xùn)練結(jié)束后,可以用測試集評估該模型的最終泛化能力,評價指標(biāo)可以用Dice 系數(shù)或者分割結(jié)果與原圖MASK 的交并比(IOU)。在肝癌圖像輸入到網(wǎng)絡(luò)前,可以使用拉普拉斯算子(Laplace)將圖像濾波,以增強(qiáng)圖像的邊緣信息,這樣可以提高訓(xùn)練網(wǎng)絡(luò)模型對肝癌圖像的分割精度[24]。如圖5所示,展示使用Unet深度學(xué)習(xí)分割網(wǎng)絡(luò)和拉普拉斯算子進(jìn)行的靶點(diǎn)分割實(shí)際效果。
標(biāo)準(zhǔn)數(shù)據(jù)庫的建立除要求對數(shù)據(jù)進(jìn)行精確處理外,還需要完善的管理支撐體系保障數(shù)據(jù)庫的正常運(yùn)行[25]。數(shù)據(jù)管理支撐體系包括數(shù)據(jù)質(zhì)量系統(tǒng)、數(shù)據(jù)運(yùn)維系統(tǒng)及數(shù)據(jù)安全系統(tǒng)。
數(shù)據(jù)的數(shù)量和質(zhì)量是決定人工智能應(yīng)用效果的基礎(chǔ),對人工智能產(chǎn)品性能起著決定作用,因此數(shù)據(jù)庫建立過程中對數(shù)據(jù)的質(zhì)量有嚴(yán)格要求。數(shù)據(jù)質(zhì)量系統(tǒng)即運(yùn)用系統(tǒng)方式對數(shù)據(jù)的質(zhì)量進(jìn)行嚴(yán)格控制,以保證數(shù)據(jù)庫的標(biāo)準(zhǔn)性。標(biāo)準(zhǔn)數(shù)據(jù)庫建立后,需要依賴數(shù)據(jù)運(yùn)維系統(tǒng)進(jìn)行日常的運(yùn)行及維護(hù),以確保數(shù)據(jù)庫的正常運(yùn)轉(zhuǎn)[26]。此外,信息安全是網(wǎng)絡(luò)時代越來越受重視的領(lǐng)域,標(biāo)準(zhǔn)數(shù)據(jù)庫中蘊(yùn)藏著海量的信息,因此需依托一套完善的數(shù)據(jù)安全系統(tǒng)來保障數(shù)據(jù)的安全性。經(jīng)過上述流程,本文所構(gòu)建的肝癌放療靶區(qū)CT影像數(shù)據(jù)庫概況見表1。
表1 肝癌放療靶區(qū)CT影像數(shù)據(jù)庫建立概況Table 1 Brief introduction of CT image database of radiotherapy target areas in patients with liver cancer
本文基于精準(zhǔn)肝切除理念提出一種肝癌放療靶區(qū)數(shù)據(jù)庫的建立方法,通過圖像融合技術(shù)使肝癌的放射治療精確到肝段,最大限度地減少放療對肝臟正常組織的影響,進(jìn)而提高患者預(yù)后。該數(shù)據(jù)庫已實(shí)現(xiàn)框架的建立,后續(xù)會逐步更新更多的肝癌數(shù)據(jù)。該肝癌數(shù)據(jù)庫可以用于基于深度學(xué)習(xí)的肝分割訓(xùn)練和測試任務(wù),進(jìn)而得到可以準(zhǔn)確進(jìn)行肝分割的算法模型以實(shí)現(xiàn)肝部精準(zhǔn)放療。
本文所提出的數(shù)據(jù)庫建立方法在實(shí)際運(yùn)行中仍存在一些難點(diǎn),如在標(biāo)定規(guī)則的認(rèn)可度方面,不同的醫(yī)院和專家之間可能存在個性化的差異,因此如何提高標(biāo)注規(guī)則的認(rèn)可度,使其得到公認(rèn)是實(shí)際操作過程中應(yīng)該重點(diǎn)關(guān)注的環(huán)節(jié)。另外,在醫(yī)生來源方面,不同醫(yī)生的準(zhǔn)確性存在差異,因此在標(biāo)注結(jié)果的一致性上需要進(jìn)行質(zhì)量控制,如通過對一個圖像進(jìn)行雙標(biāo)注,提高準(zhǔn)確性和一致性。而對于數(shù)據(jù)庫的標(biāo)準(zhǔn)性,需要經(jīng)過多次自我測試和第三方測試進(jìn)行調(diào)試和優(yōu)化,以提高數(shù)據(jù)庫的普適性。待數(shù)據(jù)庫可以保證準(zhǔn)確性、一致性、普適性后會公開,可為肝癌數(shù)據(jù)研究提供資源。我國的數(shù)據(jù)庫建設(shè)尚處于滯后狀態(tài),無論是從社會資源投入方面還是數(shù)據(jù)共享方面,較發(fā)達(dá)國家均存在較大差距。因此,需集中力量加快數(shù)據(jù)庫的建設(shè)、統(tǒng)一標(biāo)準(zhǔn)、提高質(zhì)量,為精準(zhǔn)放療的發(fā)展提供有力的支持。