張曉云,周蘭姝
(第二軍醫(yī)大學 護理學院,上海 200433)
衛(wèi)生與健康領(lǐng)域科學研究在不斷的進步和深入,因此,對實驗設(shè)計、數(shù)據(jù)質(zhì)量、統(tǒng)計學方法及工具軟件也提出了更高的要求。工具軟件的應(yīng)用對研究數(shù)據(jù)管理和數(shù)據(jù)分析具有重要的意義?,F(xiàn)有的流行病學和統(tǒng)計軟件可分為2類:商業(yè)性軟件和開放源代碼軟件。商業(yè)性軟件包括SPSS、SAS和STATA;開放源代碼軟件即免費軟件,包括EpiData entry,EpiData analysis,Epiinfo和 Windows等[1]。其中,EpiData數(shù)據(jù)管理軟件作為免費軟件自2000年研發(fā)第1版以來,以其小巧實用、使用便捷、功能齊全和免費獲取等特點,得到了越來越多公共衛(wèi)生、醫(yī)學、管理學等領(lǐng)域研究者的青睞。EpiData數(shù)據(jù)管理軟件的功能有何優(yōu)勢?目前在國內(nèi)外科學研究中的應(yīng)用情況如何?應(yīng)用領(lǐng)域有哪些?對我國護理科研工作者有何幫助和啟示?本文將對以上問題做一綜述。
1.1 研發(fā)背景 EpiData是由丹麥的非盈利組織EpiData Association組織開發(fā)的一個免費的數(shù)據(jù)錄入和數(shù)據(jù)管理軟件,該軟件的最新版本為2006年發(fā)布的EpiData 3.1,并有成熟的漢化版,可直接從EpiData 網(wǎng) 站 (網(wǎng) 址:http://www.epidata.dk/download.php)免費下載安裝。
1.2 功能組成 最新版的EpiData數(shù)據(jù)管理軟件包括了EpiData entry和EpiData analysis兩個模塊[2]。EpiData entry模塊的主要功能是建立數(shù)據(jù)庫并進行質(zhì)量控制。一個典型的EpiData數(shù)據(jù)庫主要包含3個文件:調(diào)查表文件(QES文件)、數(shù)據(jù)庫文件(REC文件)和核查文件(CHK文件),并依次用QES、REC、CHK代表其文件擴展名。數(shù)據(jù)庫建立的基本步驟是:通過簡單的文本來定義數(shù)據(jù)庫結(jié)構(gòu)(QES文件),然后將其轉(zhuǎn)化為錄入界面(REC文件),最后通過對錄入設(shè)置嚴格的條件(CHK文件)來進行質(zhì)量控制。軟件對建立數(shù)據(jù)庫的基本操作流程專設(shè)了流程欄引導,以方便用戶使用。Analysis模塊的統(tǒng)計分析功能有限,但對Entry模塊在數(shù)據(jù)整理和數(shù)據(jù)核查方面的功能有較多補充。
1.3 軟件特點
1.3.1 獲取和運行便捷 EpiData數(shù)據(jù)管理軟件的漢化版和漢化的幫助手冊都可免費直接從EpiData網(wǎng)站下載。作為“綠色”軟件,無需安裝,不修改注冊表,安裝、運行不依賴系統(tǒng)文件夾中的任何文件,可以通過下載setup.exe在計算機中安裝,也可以直接拷貝運行[3]。
1.3.2 數(shù)據(jù)錄入直觀 EpiData數(shù)據(jù)管理軟件具有良好的資料錄入界面和簡捷的鍵盤操作系統(tǒng),與調(diào)查表形式一致的可視數(shù)據(jù)錄入界面可將書面形式的調(diào)查表計算機化,在一定程度上使數(shù)據(jù)錄入更為方便,也有助于減少數(shù)據(jù)錄入錯誤[4]。此外,EpiData數(shù)據(jù)管理軟件可識別Word文檔等形式的文本內(nèi)容,因此,可直接將 Word編輯的文本內(nèi)容拷貝使用,無需再次對調(diào)查表文本內(nèi)容進行輸入。
1.3.3 數(shù)據(jù)建庫高效 數(shù)據(jù)核查文件EpiData.CHK具有獨特的數(shù)據(jù)屬性設(shè)置,通過對字段數(shù)據(jù)屬性的定義,可有效提高錄入的效率及減少最終數(shù)據(jù)庫的修改與整理,尤其對變量較多、變量性質(zhì)偏向于計量資料的大樣本量資料,可極大地節(jié)省建庫時間[5]。
1.3.4 數(shù)據(jù)核查功能強大 EpiData數(shù)據(jù)管理軟件擁有數(shù)據(jù)雙錄入的實時檢驗及一致性檢驗,數(shù)據(jù)錄入核查功能強大,可以在較大程度上有效減少數(shù)據(jù)錄入錯誤。
1.3.5 數(shù)據(jù)庫兼容性強 EpiData數(shù)據(jù)管理軟件不僅可以多種格式輸出文件,如:SPSS、SAS、Stata、dBase III、Excel以及文本格式等,還可以直接讀入dBase、文本以及Stata等格式的數(shù)據(jù)文件,與其他軟件具有較好的兼容性,可供多種數(shù)據(jù)管理和統(tǒng)計分析軟件使用。
1.4 應(yīng)用評價 EpiData數(shù)據(jù)管理軟件以其強大的功能和簡單的操作逐漸被重視,并應(yīng)用于新藥及疫苗臨床試驗、社會調(diào)查、疾病預防控制系統(tǒng)等衛(wèi)生領(lǐng)域的數(shù)據(jù)管理工作[6]。Yu等[7]報道,EpiData數(shù)據(jù)管理軟件目前已廣泛應(yīng)用于全世界的公共衛(wèi)生部門,特別是在發(fā)展中國家,可降低數(shù)據(jù)管理的成本。Singh[1]也報道,EpiData entry和 EpiData analysis在低資金資助的研究項目和學生開展的科學研究中具有應(yīng)用優(yōu)勢。EpiData數(shù)據(jù)管理軟件也開始應(yīng)用于政府研究項目中。我國衛(wèi)生部2003年組織的第3次衛(wèi)生服務(wù)調(diào)查后期的數(shù)據(jù)錄入中,EpiData數(shù)據(jù)管理軟件已得到了專家們的認可[8]。加拿大公共衛(wèi)生署也應(yīng)用EpiData數(shù)據(jù)管理軟件開展了流行病學項目研究,并于2007年組織了對EpiData數(shù)據(jù)管理軟件應(yīng)用的評價和再開發(fā)[9]。但是,EpiData數(shù)據(jù)管理軟件的應(yīng)用也有一定的局限性。首先,其數(shù)據(jù)處理功能相對簡單,尚不能實現(xiàn)對數(shù)據(jù)的復雜統(tǒng)計分析。Singh[1]報道,EpiData analysis只能對樣本量小于5000的變量進行相關(guān)和回歸分析。其次,對數(shù)據(jù)量較?。颖玖浚?00,變量數(shù)<30)的數(shù)據(jù)資料,使用EpiData數(shù)據(jù)管理軟件雖然能提高錄入質(zhì)量,但不一定能提高工作效率,此時可考慮使用EXCEL來錄入數(shù)據(jù)[8]。此外,Gao等[10]提出,根據(jù)2005年WHO發(fā)表的《臨床試驗管理規(guī)范指南(GCP)》的要求,EpiData數(shù)據(jù)管理軟件的系統(tǒng)安全性低,任何人可登入數(shù)據(jù)庫,對數(shù)據(jù)修改沒有記錄,對確保數(shù)據(jù)的真實準確有影響。
2.1 EpiData數(shù)據(jù)管理軟件在國外科研中的應(yīng)用以EpiData為英文檢索詞,文獻檢索時間限定為2012年12月之前,檢索Elsevier、Pubmed數(shù)據(jù)庫,從文獻計量的角度分析EpiData數(shù)據(jù)管理軟件在國際范圍內(nèi)的應(yīng)用和發(fā)展情況。經(jīng)檢索共獲得期刊論文400篇,分析如下。
2.1.1 論文年代分布 與EpiData數(shù)據(jù)管理軟件應(yīng)用相關(guān)的理論研究和實證研究論文,按年代分布如表1所示。2011年來,與EpiData數(shù)據(jù)管理軟件應(yīng)用相關(guān)的研究文獻數(shù)量一直處于上升態(tài)勢,說明EpiData數(shù)據(jù)管理軟件已越來越受到科研工作者的重視,其應(yīng)用的探索面在不斷擴大和深化。檢索發(fā)現(xiàn),最早的相關(guān)文獻于2002年發(fā)表于《The Lancet》,由英國和愛爾蘭學者應(yīng)用于一項醫(yī)學回顧性隊列研究中,表明EpiData數(shù)據(jù)管理軟件在問世后2年即得到了醫(yī)學研究者和權(quán)威雜志的認可[11]。
2.1.2 論文期刊分布 發(fā)表EpiData數(shù)據(jù)管理軟件相關(guān)文章5篇及以上的期刊有16種,共發(fā)表論文168篇,占總發(fā)表論文量的42%;期刊涉及學科領(lǐng)域包括熱帶醫(yī)學、婦產(chǎn)科學、生物醫(yī)學和環(huán)境科學、預防醫(yī)學、公共衛(wèi)生和流行病學、傳染病學、社會科學等多領(lǐng)域;發(fā)表論文數(shù)最多的是《Transactions ofthe Royal Society of Tropical Medicine and Hygiene》,發(fā)表論文26篇;《The Lancet》發(fā)表論文11篇。具體見表2。對刊載期刊進行分析,發(fā)現(xiàn)Epi-Data數(shù)據(jù)管理軟件應(yīng)用于研究中的科學性已得到多學科多領(lǐng)域的權(quán)威認證,其應(yīng)用學科研究領(lǐng)域也較廣泛。分析《The Lancet》刊載的11篇相關(guān)論文,發(fā)現(xiàn)EpiData數(shù)據(jù)管理軟件多被應(yīng)用于調(diào)查性或?qū)嶒炐缘亩嘀行难芯浚?2-15],從一定層面上說明其在多中心的合作性研究中具有應(yīng)用優(yōu)勢,可能與其免費獲取、簡便易操作的特點有關(guān),便于不同研究單位人員掌握和使用,以實現(xiàn)數(shù)據(jù)的統(tǒng)一。
表1 國外刊出EpiData應(yīng)用研究論文的年代分布
表2 國外發(fā)表論文5篇及以上期刊分布
2.1.3 論文作者分布 對2012年發(fā)表的99篇EpiData數(shù)據(jù)管理軟件應(yīng)用的相關(guān)論文作者進行分析,發(fā)現(xiàn)其中35篇論文由中國作者完成,占刊載論文量的35.4%,研究學科領(lǐng)域涵蓋公共衛(wèi)生和流行病學、婦產(chǎn)科學、神經(jīng)和精神病學、傳染病學、藥學,未見護理學科領(lǐng)域的相關(guān)論文發(fā)表。分析數(shù)據(jù)可知,EpiData數(shù)據(jù)管理軟件的應(yīng)用已受到我國醫(yī)學科研工作者的重視,但相關(guān)應(yīng)用在護理研究中尚未見報道。而中國作者發(fā)表的論文比重最高,也與Singh[1]的觀點相符,證實EpiData數(shù)據(jù)管理軟件在發(fā)展中國家或低資金資助研究項目中具有應(yīng)用優(yōu)勢。
2.2 EpiData數(shù)據(jù)管理軟件在國內(nèi)科研中的應(yīng)用以中文科技期刊數(shù)據(jù)庫VIP為數(shù)據(jù)來源,對2012年12月以前收錄的國內(nèi)期刊公開發(fā)表文獻,任意字段含“EpiData”為檢索條件,定量分析其年代分布、應(yīng)用研究領(lǐng)域等,分析EpiData數(shù)據(jù)管理軟件在我國科研中的應(yīng)用和發(fā)展情況,經(jīng)檢索共獲得期刊論文713篇,排除圖書出版信息和重復論文5篇,得到與EpiData數(shù)據(jù)管理軟件應(yīng)用相關(guān)論文708篇,分析如下。
2.2.1 論文年代分布 國內(nèi)與EpiData數(shù)據(jù)管理軟件應(yīng)用相關(guān)的理論研究和實證研究論文,按年代分布如表3所示。與表1數(shù)據(jù)相比較,我國同期發(fā)表文獻量均高于同年國外刊出相關(guān)文獻量,進一步說明我國科研工作者對該軟件的認識和應(yīng)用水平。經(jīng)文獻資料分析,我國最早將EpiData應(yīng)用于科研中的報道是由南京醫(yī)科大學李春平等[16]開展的一項腫瘤防治的調(diào)查性研究。至2010年以后,EpiData相關(guān)文獻刊出量已達到年均100篇以上。
2.2.2 應(yīng)用學科領(lǐng)域分布 對2012年國內(nèi)發(fā)表的102篇EpiData數(shù)據(jù)管理軟件應(yīng)用相關(guān)論文的應(yīng)用學科領(lǐng)域進行分析,其中預防醫(yī)學與衛(wèi)生學59篇,中醫(yī)學10篇,心理學6篇,藥學5篇,其他學科還包括口腔醫(yī)學、臨床診斷學、內(nèi)科學、外科學、婦產(chǎn)科學、兒科學、特種醫(yī)學、教育學等;護理學發(fā)表相關(guān)論文僅1篇。分析數(shù)據(jù)可知,EpiData數(shù)據(jù)管理軟件在我國預防醫(yī)學和衛(wèi)生學領(lǐng)域的研究應(yīng)用非常廣泛,特別是在流行病學、社會醫(yī)學、衛(wèi)生學和健康教育學范疇內(nèi)的應(yīng)用較多。EpiData數(shù)據(jù)管理軟件開發(fā)的初衷是為流行病學調(diào)查而設(shè)計,因此其特點尤其適用于流行病學的觀察性研究數(shù)據(jù)管理,但也有越來越多的臨床醫(yī)學研究者將其應(yīng)用于臨床實驗性研究中。
表3 國內(nèi)刊出EpiData應(yīng)用研究論文的年代分布
2.2.3 在護理科研中的應(yīng)用 以任意字段“EpiData+護理”進行檢索,得到論文20篇,排除非護理學領(lǐng)域研究文獻,得到論文14篇。對該14篇文獻全文數(shù)據(jù)進行手工統(tǒng)計分析,結(jié)果顯示,EpiData數(shù)據(jù)管理軟件在我國護理研究中應(yīng)用最早的文獻報道是2005年由謝日華等[17]開展的產(chǎn)后抑郁癥及其社會心理因素的調(diào)查性研究。2009年后相關(guān)論文發(fā)表10篇,表明EpiData數(shù)據(jù)管理軟件在近年已得到一些護理研究者的認識與應(yīng)用,但仍不為廣大護理研究者所熟識。對論文作者進行分析,學歷為碩士或職稱為副主任護師及以上者9篇,占64.3%;8篇作者單位為高等院校,占57.1%;6篇論文的合著作者中有統(tǒng)計或公共衛(wèi)生背景,占42.9%;以上數(shù)據(jù)說明,高等院校成為EpiData數(shù)據(jù)管理軟件在護理研究領(lǐng)域中應(yīng)用的開路先鋒,與其研究環(huán)境和有力的統(tǒng)計或公共衛(wèi)生背景支持有關(guān)。對刊載論文期刊進行分析,6篇論文發(fā)表于護理學科期刊,占42.9%,14篇論文中的2篇軟件應(yīng)用技術(shù)和經(jīng)驗介紹文章均發(fā)表于護理學期刊,說明護理學術(shù)期刊對新知識和新技術(shù)的應(yīng)用有著較高的敏感性,在一定程度上起到了介紹和推廣的作用[5,18]。對研究內(nèi)容進行分析,14篇論文中,EpiData數(shù)據(jù)管理軟件應(yīng)用于調(diào)查性研究9篇,實驗性研究3篇,軟件應(yīng)用經(jīng)驗介紹2篇;獲省部級科研項目資金資助5篇;研究主題涵蓋護理管理、社區(qū)護理、內(nèi)科護理、健康教育、護理心理等領(lǐng)域,說明EpiData數(shù)據(jù)管理軟件在護理研究中的應(yīng)用范圍較廣,可為不同護理研究方法和研究領(lǐng)域所應(yīng)用。
在商業(yè)數(shù)據(jù)管理和統(tǒng)計軟件占壟斷地位的今天,免費數(shù)據(jù)管理軟件EpiData已得到了國內(nèi)外多研究領(lǐng)域的廣泛應(yīng)用,滿足了解決現(xiàn)實問題的需要。作為一款在數(shù)據(jù)錄入方面極具優(yōu)勢的軟件,EpiData數(shù)據(jù)管理軟件針對性強,其方便的數(shù)據(jù)處理功能可以滿足一般科研數(shù)據(jù)管理的需要。EpiData數(shù)據(jù)管理軟件對護理學科科學研究的開展也極有裨益:首先,其免費獲取的特點,解決了護理科研工作者由于科研經(jīng)費不足無法購買正版統(tǒng)計軟件而在研究成果發(fā)表過程中遭遇的版權(quán)尷尬;其次,其簡便易上手且直觀的特性,滿足了不同層次不同教育背景和環(huán)境下的護理人員開展科研的需要,消除了其對研究數(shù)據(jù)處理的神秘感和畏難情緒;再次,其強大的數(shù)據(jù)核查功能,有助于提升護理科研數(shù)據(jù)管理的科學性和有效性,提高科研質(zhì)量;最后,EpiData數(shù)據(jù)管理軟件與SPSS、SAS等的高兼容性也方便護理科研工作者與統(tǒng)計或其他多學科研究者進行合作,實現(xiàn)研究的最優(yōu)結(jié)果??梢韵嘈?,EpiData數(shù)據(jù)管理軟件將得到更多的護理科研工作者的認識與應(yīng)用,也將對我國護理科學研究的推進起到一定的幫助作用。
[1]Singh S.Review of epidata entry and analysis freewares[J].Indian J Community Med,2009,34(1):76-77.
[2]Epidata D K.Denmark,EpiData Association,2000-2013[EB/OL].[2013-01-23].http://www.epidata.dk/download/php.
[3]Kafatos G,Verlander N Q,Gelb D,et al.A comparison of public domain software for outbreak investigations:Epi Info and EpiData[J].Euro Surveill,2007,12(1):E070111.4.
[4]Bohigas P A,Lauritsen J L.EpiData:The natural heir to EpiInfo 6?[J].Gac Sanit,2007,21(3):264-266.
[5]孫路路,梁濤.如何利用中文版EpiData3.1軟件高效建立數(shù)據(jù)庫[J].中華護理教育,2010,7(11):522-524.
[6]鄭文新,汪文新.EpiData數(shù)據(jù)管理軟件在流行病學調(diào)查中建立數(shù)據(jù)庫的應(yīng)用[J].數(shù)理醫(yī)藥雜志,2005,18(5):487.
[7]Yu P,de Courten M,Pan E,et al.The development and evaluation of a PDA-based method for public health surveillance data collection in developing countries[J].Int J Med Inform,2009,78(8):532-542.
[8]郭海濤,呂長超,楊卓軼.Epi Info軟件與EpiData數(shù)據(jù)管理軟件的比較[J].軟件導刊,2010,9(8):33-34.
[9]A Arthur,J Garay,B Guarda,et al.Redevelopment and evaluation of EpiData:A practical software tool for use in the public health field [J].Inter J Infec Dis,2010,14(Supplement 1):e428.
[10]Gao Q B,Kong Y,F(xiàn)u Z,et al.EZ-Entry:Aclinical datamanagement system[J].Comput Biol Med,2008,38(9):1042-1044.
[11]Collins S,Sadler K.Outpatient care for severely malnourished children in emergency relief programmes:A retrospective cohort study[J].Lancet,2002,360(9348):1824-1830.
[12]Zhang L,Wang F,Wang L,et al.Prevalence of chronic kidney disease in China:A cross-sectional survey[J].Lancet,2012,379(9818):815-822.
[13]Priotto G,Kasparian S,Mutombo W,et al.Nifurtimoxeflornithine combination therapy for second-stage African Trypanosoma brucei gambiense trypanosomiasis:A multicentre,randomised,phase Ⅲ,non-inferiority trial[J].Lancet,2009,374(9683):56-64.
[14]Llibre Rodriguez J J,F(xiàn)erri C P,Acosta D,et al.Prevalence of dementia in Latin America,India,and China:A population-based cross-sectional survey [J].Lancet,2008,372(9637):464-474.
[15]Young infants clinical signs study group.Clinical signs that predict severe illness in children under age 2 months:A multicentre study[J].Lancet,2008,371(9607):135-142.
[16]李春平,王玉邦,束云,等.腫瘤高發(fā)區(qū)人群腫瘤防治知識、態(tài)度及影響因素分析[J].南京醫(yī)科大學學報:自然科學版,2004,24(5):529-531.
[17]謝日華,何國平,羅陽,等.產(chǎn)后抑郁癥及其社會心理因素的相關(guān)性研究[J].解放軍護理雜志,2005,22(11):25-28.
[18]馮怡,張燕敏,邵華芹,等.利用EpiData數(shù)據(jù)管理軟件建立患者滿意度調(diào)查數(shù)據(jù)庫[J].護理與康復,2011,10(8):727-729.