單春宇 徐梅
【摘 要】目的:探討基于KNN(K-Nearest Neighbors, KNN)核函數(shù)聚類方法在乙肝病毒分類診斷中的臨床醫(yī)學(xué)意義和其他疾病診斷的適用性。方法:將收集來(lái)自于醫(yī)院的93例乙肝患病采用基于KNN核函數(shù)分類算法進(jìn)行聚類,通過(guò)SPSS數(shù)據(jù)初處理和MATLAB編程實(shí)現(xiàn)。揭示基于K近鄰核函數(shù)在乙肝病毒分類診斷中有重大的意義。結(jié)果:通過(guò)核函數(shù)聚類方法將93例乙肝患者聚成四類,不僅劃分出急性乙肝和慢性乙肝,而且發(fā)現(xiàn)HBC IGM也是劃分急慢性乙肝的一個(gè)不可缺少的參數(shù)。結(jié)論:基于K近鄰核函數(shù)的分類方法,在診斷對(duì)急慢性乙肝疾病劃分有一定幫助,對(duì)后期實(shí)現(xiàn)計(jì)算機(jī)輔助分類診斷具有一定的意義。
【關(guān)鍵詞】核函數(shù);非參數(shù)聚類;K近鄰算法;聚類;乙肝病毒
中圖分類號(hào): R512.62;R735.7 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào):2095-2457(2018)05-0027-003
【Abstract】Objective: To explore the clinical significance of KNN (K-Nearest Neighbors, KNN) clustering method in the diagnosis of hepatitis B virus classification and the applicability of other disease diagnosis. Methods: The collection of 93 patients with hepatitis B from the hospital was clustered based on KNN kernel function classification algorithm. The data was processed by SPSS data processing and MATLAB programming. It is of great significance to reveal the classification diagnosis of hepatitis B virus based on K-nearest neighbor kernel function. Results: 93 cases of hepatitis B patients were clustered into four groups by kernel function clustering method. Not only acute hepatitis B and chronic hepatitis B were classified, but also HBC IGM was found to be an indispensable parameter for the classification of acute and chronic hepatitis B. Conclusion: The classification method based on the K-nearest neighbor kernel function is helpful in the diagnosis of acute and chronic hepatitis B disease, and it has certain significance for the later computer-assisted classification diagnosis.
【Key words】Kernel function; Non-parametric clustering; K-nearest neighbor algorithm; Clustering; Hepatitis B virus
乙肝病毒是一種DNA病毒,非遺傳疾病,主要通過(guò)血液和母液等傳播,其中免疫低的人群易被感染。乙肝病毒是我國(guó)高發(fā)的感染疾病之一,僅次于我國(guó)的排名第一的肺結(jié)核疾病,死亡率位于狂犬病、艾滋病、肺結(jié)核排名位于第四。我國(guó)因乙肝導(dǎo)致的肝硬化、肝癌死亡人數(shù)約為1.2萬(wàn),占全球每年新增乙肝病例人數(shù)的一半左右。患有乙肝的患者,沒(méi)有特定的藥物治療,增加了家庭的經(jīng)濟(jì)的負(fù)擔(dān),在生活中易受到歧視。本文的研究主要使用基于K近鄰核函數(shù)聚類,對(duì)乙肝患者進(jìn)行分類,此次分類不僅判斷是否有患有乙肝疾病,還能進(jìn)一步的對(duì)急性乙肝和慢性乙肝進(jìn)行劃分,并且對(duì)后期的乙肝病毒醫(yī)學(xué)研究提供了許多有用的信息。
1 資料來(lái)源
1.1 研究對(duì)象
收集于2012年12月之2016年12月某三甲醫(yī)院就診含有乙肝病毒93列患者的數(shù)據(jù)資料。
1.2 檢測(cè)指標(biāo)
抽出患者靜脈血液通過(guò)分離血清來(lái)檢測(cè),檢測(cè)血液中乙肝病毒的血清學(xué)標(biāo)志,包括乙肝表面抗原(HBSAg)、乙肝表面抗體(HBSAb/抗HBs)、e抗原(HBeAg)、e抗體(HBeAb/抗-HBe)、核心抗體(HBcAb/抗-HBc)。其中的乙肝表面抗原(HBSAg)采用ELISA檢測(cè)法,檢測(cè)儀為瑞士公司生產(chǎn)的,選用上??迫A生物有限公司生產(chǎn)的試劑。
2 方法
2.1 原始數(shù)據(jù)處理
研究對(duì)象的數(shù)據(jù)來(lái)自于臨床醫(yī)學(xué)人工統(tǒng)計(jì)的并非電子版本,存在人為的信息登記錯(cuò)誤導(dǎo)致的或者,以及檢驗(yàn)過(guò)程判斷不夠精準(zhǔn)度的地方,為讓最終分析的結(jié)果有意義,確保實(shí)驗(yàn)的準(zhǔn)確性,要進(jìn)行必要的采用科學(xué)的方法進(jìn)行初步預(yù)處理。預(yù)處理包含查錯(cuò)糾錯(cuò)、標(biāo)志數(shù)據(jù)中的異常案例、轉(zhuǎn)換、填補(bǔ)缺失值等。
2.2 SPSS具體操作流程如下
2.2.1 對(duì)數(shù)據(jù)進(jìn)行無(wú)量綱化的處理
因?yàn)閿?shù)據(jù)量綱不同將影響聚類分析的結(jié)果,所以在分析之前要對(duì)數(shù)據(jù)進(jìn)行無(wú)量綱化處理,無(wú)量綱化處理的方法有很多種,我們可以根據(jù)自己的實(shí)際需要進(jìn)行選擇。