湯永飛,胡繼昌,黃亞冰,袁靜萍
R語言作為一種開源的統(tǒng)計分析語言,其提供了豐富的數(shù)據(jù)統(tǒng)計和字符串處理功能,將其運用于病理科的臨床信息分析,將幫助我們更好的服務臨床。本實驗運用R語言可對乳腺癌中HER-2免疫組化染色進行質(zhì)量控制,以便進一步提高病理診斷準確率。
1.1 研究對象收集武漢大學人民醫(yī)院病理科2015年6月~2018年3月臨床病理信息庫中行HER-2免疫組化或FISH檢測的所有乳腺癌病例。合計1 192例乳腺癌HER-2免疫組化檢測結(jié)果與977例FISH檢測結(jié)果,其中857例同時進行了免疫組化和FISH檢測,有24例HER-2(2+)缺少FISH檢測記錄。由于857例乳腺癌標本均進行FISH的全檢測模式,因此入組病例并不具有特定的選擇性。
1.2 檢測方法及判讀標準乳腺癌HER-2免疫組化檢測采用羅氏公司BenchMark GX全自動免疫組化染色系統(tǒng),一抗、二抗、DAB顯色系統(tǒng)均由羅氏公司提供。乳腺癌HER-2的FISH檢測采用安必平公司HER-2探針。判讀標準采用中國乳腺癌檢測指南(2013版)。
1.3 統(tǒng)計學方法及過程病理科的檢測報告含有大量的文本信息,如何將這些文本信息提取出來,便于統(tǒng)計學分析一直是個問題。文本提取是將文本信息中的所需要的信息進行提取。R語言的stringr包為我們進行文本提取提供了巨大的幫助。
下面簡單介紹本實驗使用R語言進行文本提取的一個例子(圖1)。
圖1 乳腺癌HER-2 FISH檢測數(shù)據(jù)庫
(1)首先保證Execl表中每例患者的信息一一對應。
library(stringr)
library(dplyr)
fish1=read.csv(“C:UsersasusDesktopfish1.3.csv”)
fish6<-fish1[“診斷意見”]
%>%unlist()%>%substr(1,13)%>%str_split(“”)%>%unlist()%>%grep(pattern=“HER-2基因”,value=T)
......
用上述的方法即可提取出文本所需的字符串。
(2)對提取的信息進行基本的數(shù)據(jù)分析。
(3)找出異常點:
①異常點1<-subset(HER4,her12==“0”& Freq>=“3”)
#免疫組化HER-2結(jié)果為0,出現(xiàn)的頻數(shù)≥3
②異常點2<-subset(HER4,her12==“3+”& Freq>=“3”)
#免疫組化HER-2結(jié)果為3+,出現(xiàn)的頻數(shù)≥3
③異常點3<-subset(HER,her12==“3+”&癌的分型15==“乳腺黏液癌”)
#免疫組化HER-2結(jié)果為3+,乳腺癌的組織學分型為乳腺黏液癌
④異常點4<-subset(HER,her12==“3+”&癌的分型15==“乳腺浸潤性小葉癌”)
#免疫組化HER-2結(jié)果為3+,乳腺癌的組織學分型為乳腺浸潤性小葉癌
⑤異常點5<-subset(HER,her12==“3+”&癌的分型15==“乳腺浸潤性小管癌”)
#免疫組化HER-2結(jié)果為3+,乳腺癌的組織學分型為乳腺浸潤性小管癌
⑥異常點6<-subset(HER,her12==“3+”&癌的分型15==“乳腺浸潤性篩狀癌”)
#免疫組化HER-2結(jié)果為3+,乳腺癌的組織學分型為乳腺浸潤性篩狀癌
⑦異常點7<-subset(HER,her12==“3+”&癌的分型15==“乳腺化生性癌”)
#免疫組化HER-2結(jié)果為3+,乳腺癌的組織學分型為乳腺浸潤性化生性癌
⑧異常點8<-subset(HER,her12==“3+”&癌的分型15==“乳腺浸潤性髓樣癌”)
#免疫組化HER-2結(jié)果為3+,乳腺癌的組織學分型為乳腺浸潤性髓樣癌
⑨異常點9<-subset(THER30,her12==“0”&fish6==“HER-2基因擴增”)
#免疫組化HER-2結(jié)果為0,F(xiàn)ISH結(jié)果為HER-2基因擴增
⑩異常點10<-subset(THER30,her12==“1+”&fish6==“HER-2基因擴增”)
#免疫組化HER-2結(jié)果為1+,F(xiàn)ISH結(jié)果為HER-2基因擴增
#免疫組化HER-2結(jié)果為3+,F(xiàn)ISH結(jié)果為HER-2基因無擴增)。
(4)描述異常點:利用ggplot2作圖,將失控的點描繪在圖形上,進行可視化處理。本文對失控風險進行分級:①當每日檢查報告HER-2(0)或HER-2(3+)的頻數(shù)>3時,認為當日免疫組化HER-2失控的可能性為低風險。②當出現(xiàn)病理組織學與免疫組化不符時,認為當日免疫組化HER-2失控的可能性為中風險。③當出現(xiàn)免疫組化HER-2(0、1+),而FISH檢測為陽性時,認為當日免疫組化HER-2失控的可能性為高風險。④當出現(xiàn)免疫組化HER-2(3+),而FISH檢測為陰性時,認為當日免疫組化HER-2失控的可能性為極高風險。
2.1 乳腺癌中HER-2分布情況免疫組化檢測結(jié)果的分布情況:HER-2(0)313例,HER-2(1+)313例,HER-2(2+)234例,HER-2(3+)303例。FISH檢測結(jié)果的分布情況:HER-2基因無擴增661例,HER-2基因擴增295例,HER-2基因擴增不確定20例,HER-2基因是否擴增存在爭議1例。綜上可得總的HER-2陽性率為29.7%,HER-2陰性率為68.7%,HER-2不確定率為1.6%(圖2)。免疫組化HER-2(2+)病例中FISH陽性率為21.4%,免疫組化(3+)與FISH的一致率為98%。
圖2 乳腺癌中總的HER-2分布情況
2.2 乳腺癌病理組織分型的FISH分布乳腺浸潤性導管癌HER-2陽性率為30.7%,HER-2陰性率為67.2%,不確定率為2.1%。乳腺導管原位癌+微小浸潤的陽性率為73.7%,陰性率為26.3%。乳腺浸潤性微乳頭癌陽性率為53.3%,陰性率為46.7%(圖3)。
2.3 失控風險與檢測時間的關系基于上述R語言已對HER-2免疫組化結(jié)果失控風險進行高、中、低風險分級并結(jié)果系統(tǒng)記錄的報告時間,從而得出失控風險與檢測時間的關系圖(圖4)。例如,圖4中相鄰的兩日(2017.12.18、2017.12.19)都出現(xiàn)了可能失控的警示(紅色亮點),提示這幾日可能已失控。在尋找免疫組化HER-2(3+)與乳腺癌組織病理分型異常點的過程中僅發(fā)現(xiàn)乳腺浸潤性小葉癌存在異常,出現(xiàn)3例HER-2(3+)。
大數(shù)據(jù)時代的到來,使得各行各業(yè)均面臨著巨大的機遇與挑戰(zhàn),尤其是醫(yī)療衛(wèi)生領域。R語言幫助我們進行文本處理,起到事半功倍的作用,同時還具有統(tǒng)計學和作圖功能,近年來在生物醫(yī)學領域得到廣泛的關注和應用,如利用R語言對門診用藥進行大數(shù)據(jù)分析指導合理用藥[1]、基于R語言的影像組學預測乳腺癌雌激素受體表達的情況[2]等。然而,關于利用R語言對病理信息進行質(zhì)量控制還鮮有報道。本文運用R語言對HER-2免疫組化染色進行質(zhì)量控制,以便進一步提高病理診斷準確率。
文獻描述HER-2的總陽性率為22.3%~38%[3-4]。本組HER-2總的陽性率為29.7%,與文獻報道一致。乳腺癌HER-2基因擴增及其蛋白表達常出現(xiàn)不一致[5],文獻報道免疫組化HER-2(3+)與FISH檢測的一致率為79%~100%[6-7],免疫組化(2+)的FISH檢測陽性率為12%~36%[8-9]。本組免疫組化和FISH檢測的一致率為98%,陽性率為21.4%,與文獻報道一致。
圖3 乳腺癌病理組織分型的FISH分布情況
圖4 免疫組化失控風險與時間的關系
乳腺癌病理組織分型的FISH分布情況,可以發(fā)現(xiàn)乳腺原位癌+微小浸潤的陽性率較高,可能是因為往往伴有微小浸潤都是高級原位癌。這些微小浸潤可能或多或少保持著高級原位癌的某些特征,從而導致微小浸潤的陽性率較高。本實驗發(fā)現(xiàn)乳腺浸潤性小葉癌有3例HER-2陽性,其中1例為多形性浸潤性小葉癌,其余為乳腺經(jīng)典型浸潤性小葉癌(陰性率為90%)。本實驗發(fā)現(xiàn)乳腺浸潤性微乳頭癌的陽性率為53.3%,要高于其它組織亞型的乳腺癌,與趙偉志和葉曉霞[10]報道的陽性率(18.18%)并不一致,但兩項研究的病例都不過20例,仍需積累大樣本病例進一步研究。本組1例乳腺化生性癌免疫組化為HER-2(2+),其中浸潤性導管癌成分約占60%,鱗狀細胞癌成分約占40%,鱗狀細胞癌部分為點狀擴增。乳腺富于淋巴細胞的浸潤性導管癌有3例FISH檢測陽性,陽性率為75%,但病例過少,尚不能明確該亞型的陽性率。
羅氏公司BenchMark GX全自動免疫組化染色儀獨特的油膜覆蓋技術有時候也給我們帶來困惑。在我們實際工作中,尤其是夜間運行的免疫組化染色,偶爾會出現(xiàn)全為“陰性”的現(xiàn)象。因此我們在質(zhì)控中設置當日的免疫組化結(jié)果出現(xiàn)3個(0),或3個(3+)時考慮存在失控的低風險,需檢查對應設備的運行日志排除失控。
乳腺癌病理組織分型中乳腺小葉癌、乳腺篩狀癌、乳腺小管癌、乳腺髓樣癌等,90%以上的HER-2為陰性。因此將這些特殊的乳腺癌分型可用于免疫組化的質(zhì)控,當出現(xiàn)HER-2陽性時,提示免疫組化可能出現(xiàn)了失控中風險。
文獻報道免疫組化HER-2(0),F(xiàn)ISH檢測陽性率為4.1%;免疫組化HER-2(1+),F(xiàn)ISH檢測陽性率為7.4%[9]??梢娒庖呓M化HER-2(0、1+),而FISH檢測陽性出現(xiàn)的可能性很低,可用于質(zhì)量控制。當出現(xiàn)免疫組化HER-2(0、1+),F(xiàn)ISH檢測為陽性的情況,提示免疫組化可能失控的風險高。
當出現(xiàn)免疫組化染色HER-2(3+),而FISH檢測為陰性時,可能造成醫(yī)療事故,導致患者錯誤的治療。故提示免疫組化可能失控的風險極高。此時應檢查內(nèi)對照的情況,如無內(nèi)對照,正常乳腺腺體出現(xiàn)強的免疫組化HER-2(3+)同樣提示免疫組化染色過強,已經(jīng)失控。若相鄰的兩日都出現(xiàn)了可能失控的警示,提示這幾日可能已失控,在實際工作中設備的故障和新抗體的試用容易出現(xiàn),需要進一步排除。
總之,我們運用R語言,從免疫組化總的陽性率,免疫組化HER-2(2+)的FISH檢測,免疫組化與乳腺癌的組織病理分析,免疫組化與FISH檢測的一致性四個方面對免疫組化染色進行質(zhì)量控制,尋找可能的失控點,以便查找原因,杜絕失控。