楊光
近日,百度研究院發(fā)表論文提出一種名為“神經(jīng)條件隨機(jī)場”的全新病理切片分析算法,將腫瘤識別定位準(zhǔn)確率大幅提高。在公開數(shù)據(jù)集 Camelyon 16大賽測試集上,該算法的腫瘤定位 FROC 分?jǐn)?shù)達(dá)到0.8096,超過專業(yè)病理醫(yī)生水平及由哈佛和麻省理工學(xué)院聯(lián)合團(tuán)隊(duì)保持的最好成績。
病理切片分析是癌癥診斷中的黃金標(biāo)準(zhǔn),但病理切片的閱片流程十分困難復(fù)雜。一張被放大40倍的電子化病理切片通常由超過十億個(gè)像素點(diǎn)組成,磁盤空間大小超過1GB。然而淋巴結(jié)附近微轉(zhuǎn)移腫瘤細(xì)胞群可能最小只有不到1000像素的直徑。而一旦發(fā)現(xiàn)微轉(zhuǎn)移腫瘤細(xì)胞群,病人的治療方案和預(yù)后可能就會有極大差別。因此,詳盡的閱讀病理切片,且不漏掉任何一處具有臨床價(jià)值的病灶,如同大海撈針,是一項(xiàng)十分復(fù)雜和耗時(shí)的任務(wù)。
百度研究院提出一種全新的深度學(xué)習(xí)算法,一次性輸入一組3x3的圖塊,并聯(lián)合預(yù)測每張圖塊是否有腫瘤區(qū)域。圖塊間的空間關(guān)系可通過一種名為“條件隨機(jī)場”的概率圖模型來模擬。整套算法框架可在 GPU 上進(jìn)行端到端的訓(xùn)練,而不需任何后處理的步驟。由于考慮到了相鄰圖塊之間的空間關(guān)系,該算法讓假陽性得以大大降低,算法預(yù)測的腫瘤區(qū)域也更加平滑。對比之前的算法,該算法除了真實(shí)腫瘤區(qū)域外,幾乎沒有引入任何其他假陽性區(qū)域。
同時(shí),百度研究院也在 Github 上開源了整套算法代碼,以便其他研究人員在此基礎(chǔ)上進(jìn)行更深入的研究,促進(jìn)人工智能在醫(yī)學(xué)圖像分析領(lǐng)域取得更加長足的發(fā)展。