于佳,祝麗娜,李絢璇,王冬梅青島海慈醫(yī)療集團(tuán)功能檢查科,山東青島 266033
統(tǒng)計(jì)分析在甲狀腺超聲診斷數(shù)字化管理系統(tǒng)中的應(yīng)用
于佳,祝麗娜,李絢璇,王冬梅
青島海慈醫(yī)療集團(tuán)功能檢查科,山東青島266033
近年來,隨著超聲數(shù)字化水平、存儲(chǔ)技術(shù)、計(jì)算機(jī)技術(shù)等關(guān)聯(lián)技術(shù)的發(fā)展,許多醫(yī)院開始著手構(gòu)建超聲診斷數(shù)字化管理系統(tǒng),以輔助疾病管理。甲狀腺疾病是臨床常見病,超聲是甲狀腺疾病篩查、診斷、療效評(píng)估等重要技術(shù),獲取信息十分豐富,這些數(shù)據(jù)具有較大挖掘價(jià)值,在甲狀腺疾病超聲智能診斷、流行病學(xué)分析、病因與發(fā)病機(jī)制等研究中具有較高的價(jià)值。統(tǒng)計(jì)分析在甲狀腺超聲診斷數(shù)字化管理系統(tǒng)中發(fā)揮關(guān)鍵作用,可供選擇的數(shù)據(jù)挖掘方法包括關(guān)聯(lián)規(guī)則、集對(duì)分析、粗糙集理論、聚類分析等,可供選擇的統(tǒng)計(jì)學(xué)方法包括Logistic回歸分析、因子分析與主成分分析、典型相關(guān)分析、結(jié)構(gòu)方程模型、線性混合模型、最大似然判別,目前我國醫(yī)學(xué)統(tǒng)計(jì)學(xué)仍處于較低水平,數(shù)據(jù)挖掘利用水平遠(yuǎn)遠(yuǎn)不足,衛(wèi)生工作者應(yīng)努力掌握更加專業(yè)的統(tǒng)計(jì)學(xué)理論、方法,提高自身統(tǒng)計(jì)應(yīng)用水平。
甲狀腺疾?。唤y(tǒng)計(jì)學(xué)分析;超聲診斷數(shù)字化管理系統(tǒng)
[Abstract]In recent years,with the development of ultrasound digital level,storage technology,computer technology and other correlation technology,many hospitals begin to build ultrasound diagnosis digital management system in order to assist disease management,the thyroid disease is the common disease in clinic,and the ultrasound is the important technology of screening,diagnosis and curative effect evaluation of thyroid disease,and it can obtain rich information,and the data are of biggermining value and are of higher value in intelligent diagnosis of thyroid ultrasound,analysis of epidemiology and research of pathogeny and pathogenesis,and the statistical analysis is vital to the thyroid ultrasound diagnosis digital management system,the available datamining methods include correlation rule,setpair analysis,rough set theory and cluster analysis,the available statistical methods include Logistic regression analysis,factor analysis,principal component analysis,canonical correlation analysis,structural equation model,linear mixed model and maximum likelihood discriminant.At present,the medical statistics of our country is still at a lower level,the datamining use level remains far from adequate,and the health workers should make an effort to master more specified statistical theory and method and improve their own math application level.
[Key words]Thyroid disease;Statistical analysis;Ultrasound diagnosis digital management system
甲狀腺疾病是臨床常見病,發(fā)病率高達(dá)4%,其中絕大多數(shù)都需要經(jīng)超聲診斷。近年來,甲狀腺癌、甲狀腺腫發(fā)病率逐年上升。超聲醫(yī)學(xué)是物理學(xué)、醫(yī)學(xué)與電子工程技術(shù)相結(jié)合的一門學(xué)科,在甲狀腺等疾病診斷中具有重要價(jià)值,定性診斷甲狀腺良惡性疾病符合率約為80%~90%,近年來彈性超聲、高頻超聲等技術(shù)的應(yīng)用,極大地提高超聲診斷效用,在甲狀腺疾病篩查、診斷中的價(jià)值無可替代[1]。邁入21世紀(jì),數(shù)字化、信息與計(jì)算機(jī)飛速發(fā)展,并在醫(yī)院信息管理領(lǐng)域得到廣泛的應(yīng)用。超聲診斷數(shù)字化信息十分龐大,信息管理需求加強(qiáng),超聲診斷數(shù)字化管理系統(tǒng)便是在這種背景下孕育而生,在流行病學(xué)管理、超聲智能診斷等領(lǐng)域發(fā)揮關(guān)鍵作用,給臨床工作帶來巨大的便利,但遺憾的是許多醫(yī)學(xué)工作者統(tǒng)計(jì)學(xué)分析能力欠佳,導(dǎo)致發(fā)表的文獻(xiàn)錯(cuò)用誤用統(tǒng)計(jì)學(xué)方法等許多問題[2]。數(shù)據(jù)挖掘是超聲診斷數(shù)字化管理系統(tǒng)運(yùn)用的基本工作,其中大量應(yīng)用醫(yī)學(xué)統(tǒng)計(jì)分析,該研究就此進(jìn)行概述,總結(jié)統(tǒng)計(jì)學(xué)分析在甲狀腺超聲診斷數(shù)字化管理系統(tǒng)中的應(yīng)用價(jià)值與方法。
超聲診斷甲狀腺疾病數(shù)字信息十分龐大,特別是近年來超聲診斷技術(shù)飛速發(fā)展,不僅二維超聲、彩色多普勒超聲等常規(guī)超聲技術(shù)不斷發(fā)展進(jìn)步,彈性顯像、高頻超聲等技術(shù)也得到廣泛應(yīng)用,圖像由二維圖像向三維、四維圖像轉(zhuǎn)變,這些技術(shù)也都已應(yīng)用于甲狀腺疾病診斷。鑒于甲狀腺疾病高發(fā),醫(yī)院甲狀腺超聲診斷信息十分驚人。甲狀腺超聲診斷基本信息包括:①形態(tài)學(xué)信息結(jié)節(jié)形態(tài)、邊界、包膜、縱橫比、邊緣光滑程度等,部分醫(yī)院利用計(jì)算機(jī)輔助診斷系統(tǒng)中還可能有圓形度、平均方向數(shù)、歸一化徑向長度標(biāo)準(zhǔn)差、粗糙度等信息;②衰減信息特征,后部回聲是超聲診斷甲狀腺結(jié)節(jié)的重要依據(jù),衰減系數(shù)是超聲診斷基本的信息;③紋理特征信息,根據(jù)數(shù)據(jù)計(jì)算方式,數(shù)據(jù)的形式、內(nèi)容繁多;④其他信息,如血流流速、頻譜等信息,組織彈性應(yīng)變值等。
2.1統(tǒng)計(jì)分析在數(shù)據(jù)挖掘中的應(yīng)用
甲狀腺超聲診斷信息龐大,呈現(xiàn)多模式特征,一定程度上增加了數(shù)據(jù)挖掘難度,部分信息體現(xiàn)出的客觀不完整、描述疾病主觀不確切,進(jìn)一步增加了信息的復(fù)雜性。數(shù)據(jù)挖掘的意義在于從數(shù)據(jù)中發(fā)現(xiàn)有意義的知識(shí),以總結(jié)甲狀腺超聲特征信息,或用于預(yù)測(cè)未來趨勢(shì),進(jìn)行前瞻性的決策。不同醫(yī)院超聲診斷數(shù)字化管理系統(tǒng)收集信息受醫(yī)院需求、設(shè)計(jì)者設(shè)計(jì)思路影響,統(tǒng)計(jì)學(xué)處理的軟件以SPSS系列為主,目前可供應(yīng)用的數(shù)據(jù)挖掘方法包括關(guān)聯(lián)規(guī)則、集對(duì)分析、粗糙集理論、聚類分析等。
2.1.1關(guān)聯(lián)規(guī)則 關(guān)聯(lián)規(guī)則是最常用的研究方法,側(cè)重于數(shù)據(jù)中不同領(lǐng)域的關(guān)系研究,滿足給定條件下的多個(gè)域間的依賴關(guān)系,如甲狀腺腫疾病形態(tài)學(xué)信息之間的關(guān)系,根據(jù)一個(gè)事物中某些數(shù)據(jù)項(xiàng)可以導(dǎo)出另一些數(shù)據(jù)項(xiàng)。在甲狀腺超聲診斷中,大量出現(xiàn)的形態(tài)學(xué)、組織學(xué)、物理學(xué)相關(guān)信息十分復(fù)雜,關(guān)聯(lián)規(guī)則可找出相關(guān)聯(lián)的各個(gè)數(shù)據(jù),但某個(gè)信息總是同時(shí)出現(xiàn)時(shí),可以找出某種疾病的規(guī)律,甚至是疾病發(fā)生進(jìn)展規(guī)律[3]。當(dāng)然,關(guān)聯(lián)規(guī)則可能并不能反映臨床實(shí)際情況,兩組信息存在關(guān)聯(lián)但并不代表這種關(guān)聯(lián)具有臨床意義。
2.1.2集對(duì)分析與粗糙理論 不確定性是自然界與人類社會(huì)普遍存在的一種客觀現(xiàn)象,對(duì)于超聲診斷更是如此,超聲診斷并不是診斷“金標(biāo)準(zhǔn)”,不可避免存在誤漏診。集對(duì)分析可作為統(tǒng)一處理模糊、隨機(jī)、中介和信息不完全所致的不確定性。其對(duì)不確定性的處理思路簡(jiǎn)要概括可分為“客觀承認(rèn)、系統(tǒng)描述、定量刻畫、具體分析”,借助對(duì)系統(tǒng)中不確定性與確定性相互關(guān)系,以及一定條件下相互轉(zhuǎn)化的過程描述,處理不確定性在具體條件下的取值規(guī)律。如針對(duì)甲狀腺彈性應(yīng)變值,受掃查切面、儀器性能等因素影響,取均值也不能保證完整真實(shí)可靠,某些超聲主觀評(píng)價(jià)結(jié)果較模糊或不一致。集對(duì)分析職能在系統(tǒng)層次上,可與解決精確問題方法相結(jié)合,揚(yáng)長避短。粗糙集理論為研究不精確數(shù)據(jù)分析、推理、挖掘數(shù)據(jù)間的關(guān)系,發(fā)現(xiàn)潛在的關(guān)聯(lián)性提供了行之有效的工具,將其引入到超聲診斷,可為智能化診斷提供一種方法,通過以患者一般情況、癥狀、超聲信息,建立信息表,采用差別矩陣法等獲得上下近似集,抽取確定規(guī)則、可能規(guī)則,以輔助診斷,避免可臨床醫(yī)師主觀性、片面性[4]。
2.1.3聚類分析 聚類分析是超聲診斷系統(tǒng)信息管理最常用的數(shù)據(jù)挖掘策略,通過分析變量之間的線性關(guān)系,按照相似程度進(jìn)行歸類,將具有共線性關(guān)系的變量聚類分析到一類,從而達(dá)到降維目的。聚類分析應(yīng)用于甲狀腺超聲診斷信息,有助于尋找某一個(gè)給定條件下,具有共性特征的超聲信息特征,如惡性甲狀腺腫瘤超聲特征群。
2.2統(tǒng)計(jì)方法
2.2.1Logistic回歸分析Logistic回歸分析可分為非條件與有條件兩種,前者適用于隊(duì)列研究、成組病例對(duì)照組資料分析,后者適用于配比設(shè)計(jì)病例對(duì)照組研究資料分析[5]。甲狀腺超聲診斷信息十分龐大,其中可供對(duì)照研究的信息包括性別組、年齡組、良惡性組等,通過進(jìn)行對(duì)照、隊(duì)列研究,利用標(biāo)準(zhǔn)偏回歸分析絕對(duì)值可了解各自變量對(duì)甲狀腺疾病的影響。通過大量的回顧性分析超聲診斷信息,可采用判別分析、回歸分析建立超聲診斷信息與“病種”之間的判別函數(shù),以達(dá)到篩查、診斷目的。Logistic逐步歸因分析考慮每一個(gè)變量與診斷樹每一個(gè)樹杈對(duì)“病種”的貢獻(xiàn),符合臨床邏輯思維過程,更接近臨床實(shí)際。
2.2.2因子分析與主成分分析 因子分析是對(duì)多個(gè)指標(biāo)變量,用少數(shù)幾個(gè)潛在指標(biāo)的線性組合表示,綜合反映全部變量的大部分信息,雖然這些變量原始變量少,但包含的信息量可占原始信息的85%以上,且這些新變量可信度仍較高,而且這些新變量彼此之間并不相干,可消除多重共線性[6]。R型因子分析是指指標(biāo)變量做的因子分析,對(duì)觀測(cè)的個(gè)案所做的因子分析叫做Q型因子分析,兩者結(jié)合得到對(duì)應(yīng)分析,可同時(shí)揭示觀測(cè)對(duì)象、指標(biāo)變量兩方面的結(jié)果。通過隨機(jī)調(diào)查足夠足量的甲狀腺超聲診斷信息,利用SPSS軟件建立數(shù)據(jù)模型,進(jìn)行實(shí)性因子分析(CFA),結(jié)果經(jīng)2-n因子分析,其中某n個(gè)因子分析可與臨床實(shí)際(甲狀腺主要病種)相符,根據(jù)結(jié)果排序,以標(biāo)準(zhǔn)回歸系數(shù)作為疾病的界值,可劃分不同甲狀腺疾病超聲診斷信息群。
2.2.3典型相關(guān)分析 典型相關(guān)分析是研究兩組變量相關(guān)關(guān)系的一種多元統(tǒng)計(jì)方法,應(yīng)用于甲狀腺超聲診斷信息處理,可揭示病種實(shí)質(zhì),通過希望了解的病種與客觀指標(biāo)的相關(guān)關(guān)系,利用典型相關(guān)分析,可將病種作為一組變量,某一個(gè)超聲診斷信息作為一組變量,分析疾病信息與超聲診斷信息相關(guān)性,了解推測(cè)客觀指標(biāo)變化情況。
2.2.4結(jié)構(gòu)方程模型 甲狀腺惡性特征并非一個(gè)可以準(zhǔn)確的、直接測(cè)量的變量,這種變量可稱為潛變量,通過對(duì)縱橫比等外顯指標(biāo),間接測(cè)量這些潛變量,結(jié)構(gòu)方程模型可分析潛變量復(fù)雜關(guān)系,用來尋找各種疾病相應(yīng)的主要超聲診斷信息[7]。
2.2.5線性混合模型線性模型主要包括線性回歸模型、方差分析模型、協(xié)方差分析模型、方差分量模型等。方差分量模型不同于其他固定效應(yīng)模型,其中含有部分效應(yīng)為隨機(jī)變量?;旌夏P偷囊环N表示形式為:Y=Xβ+ Zu+e,Y是n×1的觀測(cè)向量,β為p×1的非隨機(jī)未知參數(shù)向量,成為固定效應(yīng),X、Z分別為n×p和n×q已知的設(shè)計(jì)矩陣,u和e分別為q×1、n×1隨機(jī)向量,u為隨機(jī)效應(yīng),e為通常意義上的誤差。通過隨機(jī)抽取甲狀腺超聲診斷信息,所有信息并非這些個(gè)體本身的特征,而是整個(gè)甲狀腺超聲診斷綜合體特征,將單個(gè)甲狀腺超聲診斷信息產(chǎn)生的個(gè)體效應(yīng)看作隨機(jī)而引入模型,可提高模型的精度。線性混合模型在超聲輔助診斷、目標(biāo)預(yù)測(cè)中具有較高的價(jià)值,如以某一個(gè)時(shí)間段發(fā)病人數(shù)作為Y,既往任何一種甲狀腺疾病、不同時(shí)間段診斷人數(shù)作為自變量,可構(gòu)建線性混合模型,以預(yù)測(cè)未來某一個(gè)時(shí)間段就診人數(shù)值域。
2.2.6最大似然判別 最大似然判別法最好用于計(jì)數(shù)資料的判別分析,用于甲狀腺超聲診斷數(shù)字化信息處理,基本原理是,計(jì)算某一種甲狀腺疾病各相關(guān)超聲計(jì)量信息的條件概率,再將條件概率轉(zhuǎn)化為指數(shù)值,按照相對(duì)指數(shù)值大小對(duì)相關(guān)因素進(jìn)行賦分,其與因素回歸分析主要差別在于因變量不是定量的。在獲得新的一組自變量(超聲診斷客觀信息)后,依據(jù)方程組計(jì)算概率值,判斷該組數(shù)據(jù)來自于哪一個(gè)類別的概率最大,從而判斷該組數(shù)據(jù)來自于哪一類。最大似然判別特別適用于病例樣本較大的數(shù)據(jù),得出的數(shù)據(jù)頻率較穩(wěn)定,作為目標(biāo)指標(biāo)評(píng)價(jià)指標(biāo)要多,則判斷而定準(zhǔn)確率越高。最大似然判別法可與計(jì)量學(xué)中概率換算法進(jìn)行結(jié)合。
統(tǒng)計(jì)研究是衛(wèi)生領(lǐng)域作用工作內(nèi)容,有報(bào)告顯示全世界約80%的數(shù)字信息是醫(yī)學(xué)信息。我國人口眾多,醫(yī)學(xué)信息十分龐大,一方面為開展醫(yī)學(xué)統(tǒng)計(jì)學(xué)工作提供了更豐富的材料;另一方面對(duì)統(tǒng)計(jì)工作者業(yè)務(wù)能力提出了更高的要求[8]。醫(yī)學(xué)統(tǒng)計(jì)在公共衛(wèi)生、臨床等領(lǐng)域發(fā)揮重要作用,衛(wèi)生工作者應(yīng)努力提升自身的統(tǒng)計(jì)學(xué)知識(shí)水平,以提升挖掘數(shù)據(jù)、處理數(shù)據(jù),提升自身科研能力。
[1]詹維偉.甲狀腺結(jié)節(jié)的超聲診斷進(jìn)展[J].中華醫(yī)學(xué)超聲雜志,2011,8(6):1170-1179.
[2]何慶勇.臨床論著中常見統(tǒng)計(jì)學(xué)錯(cuò)誤辨析[J].中國中醫(yī)基礎(chǔ)醫(yī)學(xué)雜志,2011,15(7):552-553.
[3]王華,胡學(xué)鋼.基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘在臨床上的應(yīng)用[J].安徽大學(xué)學(xué)報(bào):自然科學(xué)版,2006(30):21-25.
[4]張文修,吳偉志.粗糙集理論與方法[M].北京:科學(xué)出版社,2003:22-23.
[5]王濟(jì)川,郭志剛.Logistic回歸模型—方法與應(yīng)用[M].北京:高等教育出版社,2001:9.
[6]王芳.主成分分析與因子分析的異同比較及應(yīng)用[J].統(tǒng)計(jì)教育,2003(5):14.
[7]侯杰泰,溫忠麟,成子娟.結(jié)構(gòu)方程模型及其應(yīng)用[M].北京:教育科學(xué)出版社,2004:13-14.
[8]趙耐青.醫(yī)學(xué)統(tǒng)計(jì)學(xué)[M].高等教育出版社,2004:1.
Application of Statistical Analysis in the Thyroid Ultrasound Diagnosis Digital Management System
YU Jia,ZHU Li-na,LI Xuan-xuan,WANG Dong-mei
Functional Inspection Department,Qingdao Haici Medical Group,Qingdao,Shandong Province,266033 China
R73
A
1672-5654(2016)05(a)-0178-03
于佳(1982.1-),女,山東青島人,本科,住院醫(yī)師,主要從事超聲診斷方面的工作。
王冬梅(1983.12-),女,山東青島人,本科,住院醫(yī)師,主要研究方向:超聲診斷,E-mail:wangdongmei1108@163.com。
2016-02-04)