亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        FCM 數(shù)據(jù)細(xì)胞亞群分類和標(biāo)注的自動(dòng)化研究

        2024-04-08 05:28:06擺文麗農(nóng)衛(wèi)霞李智偉郭玉娟張向輝芮東升
        醫(yī)學(xué)信息 2024年6期
        關(guān)鍵詞:分類監(jiān)督模型

        擺文麗,農(nóng)衛(wèi)霞,李智偉,雷 偉,郭玉娟,張向輝,芮東升,王 奎

        (1.石河子大學(xué)醫(yī)學(xué)院預(yù)防醫(yī)學(xué)系,新疆 石河子 832000;2.石河子大學(xué)醫(yī)學(xué)院第一附屬醫(yī)院血液風(fēng)濕科,新疆 石河子 832000;3.新疆維吾爾自治區(qū)人民醫(yī)院臨床檢驗(yàn)中心,新疆 烏魯木齊 830001)

        流式細(xì)胞術(shù)(flow cytometry,F(xiàn)CM)是一種能夠精確、快速地對(duì)生物細(xì)胞或微粒的理化特性和生物學(xué)特性進(jìn)行定量分析的技術(shù)[1]。隨著精準(zhǔn)醫(yī)療和基因生物學(xué)的發(fā)展,F(xiàn)CM 已經(jīng)成為惡性血液病診斷的重要依據(jù)[2]。FCM 數(shù)據(jù)在人工分析中最關(guān)鍵和最耗時(shí)的步驟是識(shí)別數(shù)據(jù)中的同質(zhì)細(xì)胞群,這個(gè)過程為“設(shè)門”[3]。數(shù)據(jù)傳統(tǒng)的分析方法是通過不同參數(shù)組合進(jìn)行人工設(shè)門,隨著檢測(cè)參數(shù)成倍增加,產(chǎn)生了多組合、高維度的流式數(shù)據(jù),而FCM 數(shù)據(jù)分析成為FCM 中最具挑戰(zhàn)性和最耗時(shí)的診斷步驟[4-7]。自動(dòng)設(shè)門是基于細(xì)胞群熒光強(qiáng)度分布的數(shù)學(xué)建模,可以使用有監(jiān)督和無監(jiān)督的方法來執(zhí)行,用于解決人工設(shè)門所面臨的問題。目前常見的自動(dòng)化分析方法包括FlowMeans[8]、SPADE[9]、Citrus[10]、FlowSOM[11]以及PCA[12]等,其中最常用的是FlowMeans,其是一種無監(jiān)督聚類方法,通過合并多個(gè)聚類以獲得最終細(xì)胞亞群[13,14],但只能將FCM 數(shù)據(jù)中相似的細(xì)胞聚成亞群[15,16],不能實(shí)現(xiàn)亞群的標(biāo)注,因此需要工作人員去一一識(shí)別,存在一定局限性?;诖?,本研究旨在分析FlowSOM 與有監(jiān)督分類模型[17](混合正態(tài)分布模型)聯(lián)合應(yīng)用于FCM 數(shù)據(jù)自動(dòng)化分析中的效果,現(xiàn)報(bào)道如下。

        1 資料與方法

        1.1 數(shù)據(jù)來源 數(shù)據(jù)來源于實(shí)驗(yàn)室2021 年1 月-12 月同一面板急性白血病骨髓檢測(cè)數(shù)據(jù),共528例,包括412 例正常人、68 例AML、9 例T-ALL 以及39例B-AL。本研究經(jīng)當(dāng)?shù)卣畟惱砦瘑T會(huì)批準(zhǔn)。

        1.2 數(shù)據(jù)分析 FCM 數(shù)據(jù)細(xì)胞亞群的自動(dòng)分類和自動(dòng)標(biāo)注可以分成4 個(gè)階段進(jìn)行:①預(yù)處理:通過讀取數(shù)據(jù)、補(bǔ)償和轉(zhuǎn)換、去粘連完成FCM 數(shù)據(jù)預(yù)處理;②細(xì)胞聚類:使用FlowSOM 方法對(duì)預(yù)處理的數(shù)據(jù)進(jìn)行細(xì)胞聚類,聚類的結(jié)果以宏細(xì)胞的方式可視化;③亞群分類:利用混合正態(tài)分布模型,訓(xùn)練有監(jiān)督分類模型對(duì)細(xì)胞亞群進(jìn)行分類;④亞群標(biāo)準(zhǔn):對(duì)③得到的有限個(gè)數(shù)的細(xì)胞亞群類進(jìn)行識(shí)別和標(biāo)注建立多對(duì)多映射,完成細(xì)胞亞群的標(biāo)注。

        1.2.1 數(shù)據(jù)預(yù)處理 通過補(bǔ)償、轉(zhuǎn)換和去粘連完成FCM 數(shù)據(jù)的預(yù)處理。①首先應(yīng)用補(bǔ)償矩陣對(duì)數(shù)據(jù)進(jìn)行補(bǔ)償,補(bǔ)償矩陣采用流式fcs 格式數(shù)據(jù)自帶的補(bǔ)償矩陣,通過讀取熒光抗體名稱與提取熒光通道的數(shù)據(jù)矩陣,對(duì)熒光抗體做補(bǔ)償[5];②接著對(duì)FCM 數(shù)據(jù)做轉(zhuǎn)換,對(duì)前向散射光FSC 進(jìn)行線性變換(除以100 k),側(cè)向散射光SSC 進(jìn)行Log10對(duì)數(shù)轉(zhuǎn)換,對(duì)抗體做雙指數(shù)變換;③最后使用百分位法在FSC-A 和FSC-H 平面對(duì)數(shù)據(jù)做去粘連處理,具體步驟如下:首先選取FSC-H 大于0.5 且FSC-A 小于2 的細(xì)胞子集,計(jì)算其在全體細(xì)胞中的占比;當(dāng)子集占比小于等于0.75 時(shí),使用子集計(jì)算變量FSC-A 與FSC-H的百分位點(diǎn)P5和P75,否則計(jì)算P5和P90;以兩個(gè)對(duì)子為端點(diǎn)做基準(zhǔn)線段,將連線垂直上移和下移0.225單位做兩條平行線;兩條平行線之外的點(diǎn)即為粘連細(xì)胞;FSC-H 小于0.2 的點(diǎn)對(duì)應(yīng)于細(xì)胞碎片,其余的為進(jìn)入后續(xù)分析的細(xì)胞,包括正常細(xì)胞和凋亡細(xì)胞。上述切割點(diǎn)的選擇用試錯(cuò)法確定。

        1.2.2 細(xì)胞聚類 細(xì)胞聚類采用無監(jiān)督分析方法,在操作中不需要任何標(biāo)簽,任何預(yù)定義的類作為引用。聚類算法識(shí)別同一聚類中的事件,將相似的細(xì)胞保留在同一個(gè)集群中,不同的細(xì)胞保留在不同的集群中。FlowSOM 具有節(jié)點(diǎn)網(wǎng)格,每個(gè)節(jié)點(diǎn)代表多維空間中的點(diǎn)[17]。自組織映射(the self-organizing map,SOM)將數(shù)據(jù)中的單元格分配給最近的節(jié)點(diǎn),該節(jié)點(diǎn)以及周圍的節(jié)點(diǎn)向新單元格更新,以此類推,節(jié)點(diǎn)被分配到數(shù)據(jù)空間中的高密度區(qū)域,節(jié)點(diǎn)網(wǎng)格中相近的節(jié)點(diǎn)比較遠(yuǎn)的節(jié)點(diǎn)更相似[18]。因此,所有的單元格將會(huì)分配到距離他們最近的節(jié)點(diǎn),從而將FCM 數(shù)據(jù)中相同的細(xì)胞聚類在一起形成細(xì)胞亞群。為便于觀察聚類結(jié)果,F(xiàn)lowSOM 聚類結(jié)果以亞群中心點(diǎn)展示,下文中把亞群中心點(diǎn)稱為宏細(xì)胞。聚類的目標(biāo)是將FCM 數(shù)據(jù)分為若干個(gè)類群,并保證類群內(nèi)的樣本盡可能密集,不同類群之間盡可能離散。FlowSOM將FCM 數(shù)據(jù)中相似的節(jié)點(diǎn)聚在一起形成無標(biāo)簽的細(xì)胞亞群,以宏細(xì)胞的形式展示。當(dāng)比較5×5、10×10和15×15 網(wǎng)格時(shí),發(fā)現(xiàn)節(jié)點(diǎn)數(shù)量越多對(duì)應(yīng)的純度越高,但是聚類結(jié)果很混亂;根據(jù)經(jīng)驗(yàn),前4 管使用12×12 網(wǎng)格,第5 管使用10×10 網(wǎng)格,因此前4 管的每管有144 個(gè)宏細(xì)胞,第5 管有100 個(gè)宏細(xì)胞。

        1.2.3 亞群分類 聚類分析后得到細(xì)胞聚類結(jié)果,但由于FlowSOM 是無監(jiān)督學(xué)習(xí)方法,不同抗體組合的樣本得到的亞群構(gòu)成不一致,導(dǎo)致亞群次序混亂缺乏統(tǒng)一標(biāo)簽,需要對(duì)細(xì)胞亞群進(jìn)行分類[19]。把標(biāo)本分為訓(xùn)練集和測(cè)試集,訓(xùn)練基于混合正態(tài)分布的有監(jiān)督分類模型對(duì)所有的宏細(xì)胞進(jìn)行分類,也就是對(duì)細(xì)胞亞群進(jìn)行統(tǒng)一分類,混合正態(tài)分布模型的類別數(shù)設(shè)置為20。有監(jiān)督的混合正態(tài)分布模型對(duì)FlowSOM生成的宏細(xì)胞結(jié)果進(jìn)行分類。具體步驟如下:為了避免數(shù)據(jù)過少導(dǎo)致訓(xùn)練集分類結(jié)果代表性差,選擇60%~70%的數(shù)據(jù)作為訓(xùn)練集,30%~40%作為驗(yàn)證集,因此從AML、T-ALL、B-ALL 數(shù)據(jù)中分別隨機(jī)挑選41、9、39 例數(shù)據(jù)作為訓(xùn)練集;正常人數(shù)據(jù)有412例,如果隨機(jī)選擇60%的數(shù)據(jù)作為訓(xùn)練集,這樣使得訓(xùn)練集中正常人數(shù)據(jù)遠(yuǎn)遠(yuǎn)多于患者數(shù)據(jù),正常人細(xì)胞亞群特征覆蓋異常細(xì)胞亞群,造成分類不準(zhǔn)確,因此選擇100 例正常數(shù)據(jù)作為訓(xùn)練集。訓(xùn)練集170 例數(shù)據(jù),共97 920 個(gè)宏細(xì)胞;測(cè)試集358 例數(shù)據(jù),共206 208 個(gè)宏細(xì)胞,為了使分類結(jié)果清晰明了,從兩個(gè)數(shù)據(jù)中隨機(jī)選取25 000 個(gè)宏細(xì)胞來顯示。

        1.2.4 亞群標(biāo)注 為使細(xì)胞亞群分類更加精確,分類模型中亞群數(shù)目的設(shè)置通常高于常規(guī)使用的細(xì)胞類型數(shù)。因此在亞群標(biāo)注過程中,通過提取細(xì)胞聚類信息以及各類細(xì)胞的細(xì)胞數(shù),將宏細(xì)胞映射到9 個(gè)細(xì)胞類別并進(jìn)行命名標(biāo)注。

        2 結(jié)果

        2.1 粘連細(xì)胞的識(shí)別去除 以FSC-A 和FSC-H 為坐標(biāo)繪制散點(diǎn)圖,基準(zhǔn)線上下移動(dòng)0.225 個(gè)單位產(chǎn)生兩條平行線將粘連細(xì)胞去除,見圖1,經(jīng)檢查去粘連結(jié)果,發(fā)現(xiàn)粘連細(xì)胞劃分均合理。

        圖1 預(yù)處理結(jié)果

        2.2 聚類分析 各類細(xì)胞的宏細(xì)胞分布是有規(guī)律可循,服從特定的概率分布,見圖2。

        圖2 FlowSOM 聚類結(jié)果

        2.3 亞群分類與標(biāo)注 共有20 個(gè)類別,且各類宏細(xì)胞位置合理,未見異常,見圖3;另對(duì)20 個(gè)細(xì)胞類別進(jìn)行一一識(shí)別和標(biāo)注,得到9 種已知細(xì)胞類,分別是淋巴細(xì)胞、單核細(xì)胞、中性粒細(xì)胞、嗜酸粒細(xì)胞、原始細(xì)胞、幼稚細(xì)胞、有核紅細(xì)胞、凋亡細(xì)胞、其他細(xì)胞,見圖4。

        圖4 細(xì)胞亞群標(biāo)注前后比較

        3 討論

        由于FCM 具有高通量、高靈敏度、高精確度以及多參數(shù)檢驗(yàn)的特點(diǎn)[20],被廣泛的應(yīng)用于生物學(xué)研究及臨床診斷中[21-23],同時(shí)會(huì)產(chǎn)生高維度、多組合的FCM 數(shù)據(jù)。而傳統(tǒng)人工分析具有分析效率低、主觀性高的問題。近年來不斷有學(xué)者提出FCM 數(shù)據(jù)的分析需要自動(dòng)化分析方法的幫助[5,24]。

        針對(duì)以上問題,本研究提出無監(jiān)督聚類方法與有監(jiān)督分類方法共同用于FCM 數(shù)據(jù)分析,模擬人工分析過程,獲取臨床流式實(shí)驗(yàn)室的原始檢測(cè)數(shù)據(jù),預(yù)處理過程通過補(bǔ)償、轉(zhuǎn)換、粘連細(xì)胞以及細(xì)胞碎片的去除,使得FCM 數(shù)據(jù)規(guī)范化,檢查發(fā)現(xiàn)每例數(shù)據(jù)的粘連細(xì)胞去除均合理;之后將無監(jiān)督聚類方法與有監(jiān)督分類方法結(jié)合起來用于FCM 數(shù)據(jù)聚類、亞群分類與標(biāo)注,顯著優(yōu)點(diǎn)是其既能夠快速分類又能夠提高分類數(shù)目的準(zhǔn)確度。

        無監(jiān)督聚類方法FlowSOM 作為分析的起點(diǎn),將FCM 數(shù)據(jù)中相似的細(xì)胞聚在一起形成無標(biāo)簽的細(xì)胞亞群,通過設(shè)定的參數(shù),F(xiàn)lowSOM 將FCM 數(shù)據(jù)中相似的細(xì)胞聚在一起形成無標(biāo)簽的細(xì)胞亞群,以宏細(xì)胞的形式展示。從聚類結(jié)果看出,F(xiàn)lowSOM 具有良好的性能以及快速的運(yùn)行時(shí)間,是對(duì)FCM 數(shù)據(jù)進(jìn)行快速探索性分析的理想工具。但是將宏細(xì)胞進(jìn)一步聚類時(shí)會(huì)出現(xiàn)不同細(xì)胞類型合并的現(xiàn)象,不能通過FlowSOM 模型的元聚類對(duì)亞群進(jìn)一步聚類與特征提取。因此,使用有監(jiān)督分類模型混合正態(tài)分布模型對(duì)FlowSOM 生成的宏細(xì)胞進(jìn)行分類,有監(jiān)督學(xué)習(xí)算法可以達(dá)到這樣一種狀態(tài):在提供足夠的信息數(shù)據(jù)前提下,它能夠預(yù)測(cè)未見數(shù)據(jù)的正確標(biāo)簽;混合正態(tài)分布模型對(duì)亞群進(jìn)行分類時(shí),首先將數(shù)據(jù)集分為訓(xùn)練集和測(cè)試集,使用訓(xùn)練集訓(xùn)練有監(jiān)督分類模型過程中,對(duì)亞群類別參數(shù)進(jìn)行設(shè)定,發(fā)現(xiàn)隨著亞群數(shù)的增加,分類精確度會(huì)提高,但是不利于對(duì)亞群進(jìn)行標(biāo)注;反之,亞群數(shù)減少,精確度降低,但是會(huì)出現(xiàn)將不同細(xì)胞亞群分到一起的現(xiàn)象。故根據(jù)經(jīng)驗(yàn),將細(xì)胞亞群設(shè)置為20 個(gè),接下來使用測(cè)試集對(duì)模型進(jìn)行測(cè)試,檢查訓(xùn)練集與測(cè)試集的分類結(jié)果,未見異常,可以認(rèn)為有監(jiān)督分類模型能夠準(zhǔn)確地對(duì)訓(xùn)練集和測(cè)試集進(jìn)行分類。最后通過設(shè)定標(biāo)簽的形式將20 個(gè)類別依次識(shí)別并用已知的細(xì)胞類別進(jìn)行標(biāo)注,即將宏細(xì)胞映射到9 個(gè)細(xì)胞類別,對(duì)這9 個(gè)細(xì)胞類別進(jìn)行命名標(biāo)注,檢查所有數(shù)據(jù)標(biāo)注前與標(biāo)注后的可視化結(jié)果圖,亞群標(biāo)注結(jié)果清晰,未見異常。

        總之,通過將基于本研究方法的亞群分類與標(biāo)注結(jié)果與傳統(tǒng)人工分析結(jié)果進(jìn)行對(duì)比,成功驗(yàn)證了自動(dòng)化分析方法在FCM 數(shù)據(jù)分類與標(biāo)注中的可行性和高準(zhǔn)確性,具有較好的應(yīng)用前景,可以為下游FCM 數(shù)據(jù)自動(dòng)化診斷提供參考,并且能夠保留原始數(shù)據(jù)更多的特征信息,為下游診斷結(jié)果的質(zhì)量控制提供依據(jù)。本研究也有不足之處:作為流式數(shù)據(jù)全程自動(dòng)化分析的重要組成,而且分類結(jié)果較難用評(píng)價(jià)指標(biāo)進(jìn)行評(píng)價(jià),因此利用分類結(jié)果進(jìn)行特征提取和疾病診斷,診斷結(jié)果與專家人工分類結(jié)果基本相同,從而反推證明本研究提出的FCM 數(shù)據(jù)自動(dòng)化分類方法可靠;自動(dòng)化分析FCM 數(shù)據(jù)時(shí)假設(shè)流式實(shí)驗(yàn)室在樣本準(zhǔn)備、熒光染色、儀器校準(zhǔn)和調(diào)整階段均正常,在實(shí)際情況中,可能出現(xiàn)數(shù)據(jù)大幅度偏移,建立在分布規(guī)律基礎(chǔ)上的亞群標(biāo)注結(jié)果可能會(huì)出現(xiàn)偏差。目前,本研究提出的自動(dòng)化分析方法已經(jīng)在公共數(shù)據(jù)庫Flowrepository.orgAML 項(xiàng)目提供的數(shù)據(jù)以及本地實(shí)驗(yàn)室急性白血病骨髓檢測(cè)數(shù)據(jù)進(jìn)行過測(cè)試,效果良好。

        猜你喜歡
        分類監(jiān)督模型
        一半模型
        分類算一算
        重要模型『一線三等角』
        突出“四個(gè)注重” 預(yù)算監(jiān)督顯實(shí)效
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        監(jiān)督見成效 舊貌換新顏
        夯實(shí)監(jiān)督之基
        国产一区二区三区在线观看完整版| 亚洲国产精品久久久久久网站 | 亚洲成AV人久久| av一区二区三区观看| 新婚人妻不戴套国产精品| 日本理伦片午夜理伦片| YW亚洲AV无码乱码在线观看| 久久久精品国产亚洲av网不卡| 综合色免费在线精品视频| 国产女人高潮叫床视频| 精品视频入口| 粗大挺进孕妇人妻在线| 日本一区二区三区免费精品| 吃奶摸下激烈床震视频试看| 久久精品国产亚洲AV高清特级| 中文字幕中文字幕人妻黑丝| 99e99精选视频在线观看| 国产成人精品电影在线观看| 欧美人成在线播放网站免费| 亚洲一区二区岛国高清| 神马影院午夜dy888| 人妻少妇被猛烈进入中文字幕| 在线观看国产精品91| 久久精品亚洲一区二区三区画质 | 亚洲av蜜桃永久无码精品| 国产精品流白浆喷水| 亚洲一区二区三区高清视频| 夜夜爽夜夜叫夜夜高潮| 久久久精品人妻一区二区三区蜜桃| 欧美日韩中文亚洲另类春色| 国产av一级二级三级| 国产太嫩了在线观看| 亚洲人成网站免费播放| 午夜日本精品一区二区| 亚洲男人天堂一区二区| a级毛片无码免费真人| 精品91精品91精品国产片| 蜜桃精品视频一二三区| 国产熟妇另类久久久久| 九九免费在线视频| 久久精品国产亚洲av网在|