翁雪
[摘要]流行病生態(tài)學(xué)研究是生態(tài)學(xué)與流行病學(xué)的有效融合,旨在從環(huán)境變化與生態(tài)變化的層面探索疾病的發(fā)生在地域、時間與人群上的分布規(guī)律,從而通過生態(tài)學(xué)指標參數(shù)盡早預(yù)測相關(guān)疾病發(fā)生的可能性,以更加科學(xué)的依據(jù)積極主動地預(yù)防疾病的流行。本文對流行病生態(tài)學(xué)研究的統(tǒng)計分析方法進行闡述并分析,以供參考。
[關(guān)鍵詞]流行病學(xué);生態(tài)學(xué);研究;統(tǒng)計分析方法
數(shù)千年來,人類一直面臨著疾病為何出現(xiàn)和如何防治等重大問題。在缺乏生物學(xué)實驗技術(shù)的年代,上述問題的解答僅能通過基于多個對象的觀察所獲得的經(jīng)驗性結(jié)論。此為流行病學(xué)研究方法的雛形,此種方法下,生物現(xiàn)象的或然性問題不能得到有效的解決,兩個事物之間的復(fù)雜因果關(guān)聯(lián)與伴隨現(xiàn)象即很難辨別,因而很容易出現(xiàn)錯誤的判斷。在流行病生態(tài)學(xué)研究的發(fā)展過程中,廣義因果律(概率論下的因果觀)的出現(xiàn)、邏輯學(xué)理論的完善、數(shù)理統(tǒng)計學(xué)的發(fā)展以及辯證唯物主義科學(xué)技術(shù)方法論的形成,為流行病生態(tài)學(xué)研究方法的形成提供了廣泛的理論基礎(chǔ)。在此背景下,一套探討疾病發(fā)生的因果關(guān)系、了解疾病的分布規(guī)律的研究方法逐漸出現(xiàn),使得以人群為基礎(chǔ)的流行病生態(tài)學(xué)研究結(jié)果更具科學(xué)性與說服力。以下筆者就流行病生態(tài)學(xué)的概念與流行病生態(tài)學(xué)研究的統(tǒng)計分析方法進行探討。
一、流行病生態(tài)學(xué)概述
流行病生態(tài)學(xué)研究是一種描述性的研究,以群體為觀察、分析的基本單位,進而在群體水平上研究與疾病發(fā)生有關(guān)的因素,以及該因素與疾病之間的關(guān)系。一般而言,暴露因素與疾病之間的關(guān)系能夠通過描述不同人群該因素的暴露情況與疾病情況進行分析。在流行病生態(tài)學(xué)研究過程中,結(jié)合常規(guī)資料與數(shù)據(jù)庫等信息,可以在較短的時間內(nèi)獲得分析結(jié)果,進而節(jié)省人力、物力與時間。20世紀中期,為了適應(yīng)多病因論的需求,流行病研究方法有了突飛猛進的發(fā)展。如今,流行病學(xué)的群體研究方法在醫(yī)學(xué)的各個領(lǐng)域得到了較為廣泛的應(yīng)用,并成為醫(yī)學(xué)相關(guān)學(xué)科不可或缺的研究方法。
在流行病生態(tài)學(xué)研究中,生態(tài)學(xué)研究能夠為病因未明的疾病提供重要的病因線索,進而對該疾病進行深入的研究,此為生態(tài)學(xué)研究的顯著優(yōu)點。針對待研究暴露因素在某一人群中變異程度較小的情況,疾病與待研究暴露因素之間的關(guān)系的測量存在較大的難度,此時采用多個人群比較的生態(tài)學(xué)研究方式則能夠取得較為有效的研究結(jié)果。因此,在疾病監(jiān)測工作中,借助生態(tài)學(xué)研究方法,能夠較好的評估疾病的發(fā)展趨勢,從而為預(yù)防、控制策略的制定提供重要的依據(jù)。但流行病生態(tài)學(xué)研究也存在一定的缺陷,即生態(tài)學(xué)謬誤。生態(tài)學(xué)謬誤是因研究群體由各個情況不同的個體集合而成,加之其中存在的混雜因素,而導(dǎo)致的研究結(jié)果與真實情況之間的差異。
二、流行病生態(tài)學(xué)研究的發(fā)展
在當代流行病生態(tài)學(xué)研究中,自然環(huán)境與人類社會之間的關(guān)系被納入研究的范疇,以社會一經(jīng)濟一自然的復(fù)合生態(tài)系統(tǒng)觀點研究流行病學(xué)面臨的問題。因此,生態(tài)學(xué)研究越加注重個體與群體的結(jié)合,以及社會發(fā)展與生活實際需求的結(jié)合。在生態(tài)學(xué)研究中,以群體為研究與觀察的單位,對兩個變量進行相關(guān)性分析或回歸分析,其疾病測量的準確性或暴露水平相對較低,且其間的時序關(guān)系很難確定,因而研究的結(jié)果并不能直接作為因果關(guān)系的有力證據(jù)。
就流行病生態(tài)學(xué)研究手段與研究設(shè)施來看,除了一些可準確獲取信息的手段與技術(shù)在流行病生態(tài)研究中得到有效應(yīng)用外,部分數(shù)學(xué)模型與模擬方法也在大尺度、多因素的研究中得到了重視?;谛畔⒓夹g(shù)與網(wǎng)絡(luò)技術(shù)的應(yīng)用,流行病生態(tài)學(xué)的研究對象與研究任務(wù)也發(fā)生了一些變化。在傳統(tǒng)的生態(tài)學(xué)研究中,多是在一個相對孤立的局部地區(qū)的研究的基礎(chǔ)之上逐步擴大,而繼SARS之后,我國的疾病控制信息系統(tǒng)已在全國范圍內(nèi)建立,這對流行病生態(tài)學(xué)研究具有實質(zhì)性意義。
三、流行病生態(tài)學(xué)研究的統(tǒng)計分析方法
在流行病生態(tài)學(xué)研究中,為保證研究結(jié)果的準確性,一般數(shù)據(jù)總量是巨大的,與之對應(yīng)的數(shù)據(jù)分析處理方法也相對較多。就統(tǒng)計分析方法的分類來看,大致可分為傳統(tǒng)統(tǒng)計方法與空間統(tǒng)計分析方法。以下分別進行探討。
(一)傳統(tǒng)統(tǒng)計分析方法
傳統(tǒng)分析方法建立在大樣本容量與樣本獨立兩項基本假設(shè)之上,根據(jù)待分析危險因素的數(shù)量可細分為單因素分析與多因素分析兩類。生態(tài)學(xué)研究的觀察與分析單位是由不同情況的個體組成的群體,如縣區(qū)等。在群體層面監(jiān)測或者收集與流行疾病發(fā)病、危險因素、傷殘、死亡等信息,常見的危險因素如氣象指標、空氣污染指標、群體經(jīng)濟水平、其他基礎(chǔ)疾病等,在此基礎(chǔ)上構(gòu)建危險因素與疾病發(fā)病之間的關(guān)聯(lián)。
在單因素分析中,常見的統(tǒng)計分析方法有相關(guān)分析、t檢驗、F檢驗與Mann-Whitney檢驗等。相關(guān)分析是對總體中確定存在聯(lián)系的標志進行分析的過程,以描述客觀事物之間的關(guān)系,同時選用適當?shù)慕y(tǒng)計指標進行展示。在統(tǒng)計分析過程中,為了明確兩個變量之間的關(guān)系,需要收集成對的數(shù)據(jù),而后通過散點圖等方式進行呈現(xiàn),以便分析二者之間的關(guān)系。在流行病生態(tài)學(xué)研究中,相關(guān)分析旨在分析單個危險因素與疾病發(fā)生之間的關(guān)系,即獨立危險因素。t檢驗又稱studentt檢驗,主要用于小樣本、總體標準差盯未知的正太分布分析,借助t分布理論推導(dǎo)差異發(fā)生的概率,從而比較兩個平均數(shù)之間是否具有顯著性差異。t檢驗是流行病生態(tài)學(xué)研究中較為常用的一種統(tǒng)計分析方法,能夠有效構(gòu)建疾病發(fā)生與危險因素之間的關(guān)系。F檢驗又稱方差比率檢驗、聯(lián)合假設(shè)檢驗、方差齊性檢驗,是一種基于零假設(shè)之下統(tǒng)計值服從F-分布的檢驗方法。F檢驗對數(shù)據(jù)的正態(tài)性具有較高的敏感性,常用于分析模型中部分參數(shù)或全體是否適合母體的估計,也可用于三組或者多組數(shù)據(jù)之間的均值比較,但當顯著性水平較低時,數(shù)據(jù)的穩(wěn)健性將出現(xiàn)大幅降低。Mann-Whitney檢驗又稱曼-惠特尼u檢驗,旨在檢驗兩個總體的均值之間是否存在顯著性差異。此種檢驗方法基于兩個樣本分別來自除了總體均值以外完全相同的兩個總體這一假設(shè),明確地考慮了每一個樣本中各測定值所排的秩,所使用的信息相對較多。
在多因素分析中,常見的統(tǒng)計分析方法有對應(yīng)分析、回歸分析、主成分分析、聚類分析等。對應(yīng)分析主要用于分析二維數(shù)據(jù)矩陣中行、列因素之間的關(guān)系,又稱相應(yīng)分析,其基本原理為通過二維數(shù)據(jù)矩陣的對應(yīng)變換,分析矩陣的行因素與列因素之間的關(guān)系。對應(yīng)分析是近年發(fā)展起來的一種新的多元相依變量統(tǒng)計分析方法,基于定性變量構(gòu)成的交互匯總表,揭示變量之間的聯(lián)系。在流行病生態(tài)學(xué)研究中,采用對應(yīng)分析,可借由視覺化的表示方式,將多組看不出任何聯(lián)系的暴露因素進行展現(xiàn)?;貧w分析旨在處理與分析多個變量之間的線性依存關(guān)系,在流行病生態(tài)學(xué)研究中,多為多重線性回歸模型,即多個自變量對1個因變量的變化關(guān)系的研究。聚類分析又稱點群分析,是一種多元統(tǒng)計分析方法。在聚類分析中,通過相應(yīng)的類別劃分方法(性質(zhì)相近的歸為一類)進行“聚類”,并對各類事物進行直接比較。聚類分析的原則為不同類中的個體差異相對較大,借助相應(yīng)的聚類方法(模糊聚類、系統(tǒng)聚類、最優(yōu)分割法、動態(tài)聚類),實現(xiàn)待研究變量之間的相異性研究。主成分分析是借助多變量之間的線性變換選出其中的重要變量,以實現(xiàn)變量壓縮的一種統(tǒng)計分析方法。在流行病生態(tài)學(xué)研究中,為了滿足全面分析相關(guān)危險因素與疾病發(fā)生之間的關(guān)系的要求,常常需要提出較多的危險因素。但就實際的研究過程來看,過多的變量將會急劇增加問題分析的難度與復(fù)雜度。此外,兩個變量在解釋同一問題時可能存在重疊部分,提示變量存在壓縮的可能性?;诖?,主成分分析的統(tǒng)計分析方法得到重視并逐漸用于流行病生態(tài)學(xué)分析。
(二)空間統(tǒng)計分析方法
針對空間數(shù)據(jù),多數(shù)空間數(shù)據(jù)樣本并不獨立,使得傳統(tǒng)的統(tǒng)計分析方法的兩項基本假設(shè)難以滿足。針對流行病生態(tài)學(xué)研究,各種空間統(tǒng)計分析方法的應(yīng)用,為流行病影響因素的探索、空間聚集性的分析以及防治控制策略的制定提供了重要工具。
空間統(tǒng)計分析又稱地理統(tǒng)計分析,以區(qū)域化變量理論為基礎(chǔ),研究分布于空間中呈現(xiàn)出一定的隨機性、結(jié)構(gòu)性的自然現(xiàn)象。常見的空間統(tǒng)計分析方法包括空間自相關(guān)分析、空間分類分析、多變量統(tǒng)計分析、空間模擬等??臻g自相關(guān)分析建立在現(xiàn)象或食物具有對空間位置的依賴關(guān)系的理論之上,其計算方法可細分為全局性與局部性。全局空間自相關(guān)分析常用于整個研究區(qū)域下空間對象某一屬性取值的空間分布狀態(tài)的描述,從而判斷其在空間上的聚集性。全局性計算方法忽略了空間異質(zhì)性,以此為基礎(chǔ),局部空間自相關(guān)分析方法出現(xiàn)??臻g插值分析是通過一組分區(qū)數(shù)據(jù)或離散數(shù)據(jù)推求未知區(qū)域的數(shù)據(jù)的分析過程,主要包括變換函數(shù)插值、邊界內(nèi)插值、樣條函數(shù)插值、距離倒數(shù)插值等方法。流行病學(xué)標點地圖法是一種較為常用的流行病生態(tài)學(xué)研究方法,可細分為以密度為基礎(chǔ)、以距離為基礎(chǔ)與以疾病分布熱點為基礎(chǔ)的流行病學(xué)標點地圖的空間推斷方法。
四、結(jié)語
在流行病學(xué)研究中,傳統(tǒng)統(tǒng)計分析方法的應(yīng)用較為成熟,空間統(tǒng)計分析方法仍存在較大的進步空間。因此,在實踐應(yīng)用中,應(yīng)當加強空間統(tǒng)計分析方法的應(yīng)用分析,從而為流行病學(xué)的理論研究提供重要的支持。