■王 曼
《鄭州大學學報》編輯部,河南省鄭州市科學大道100號 450001
隨著醫(yī)學研究領(lǐng)域的擴張和研究內(nèi)容的深入,統(tǒng)計學在醫(yī)學研究中的應(yīng)用越來越受到重視。統(tǒng)計學是對數(shù)據(jù)進行科學處理的方法學,在選題確定的基礎(chǔ)上,統(tǒng)計學處理的準確性、科學性直接決定了研究的質(zhì)量。目前,許多醫(yī)學科技期刊已經(jīng)意識到統(tǒng)計學的重要性,邀請統(tǒng)計學專家審稿,嚴控論文的統(tǒng)計學缺陷[1-4]。但是,統(tǒng)計學審稿專家多是對實驗設(shè)計是否科學、統(tǒng)計方法是否得當、統(tǒng)計結(jié)論是否正確等方面進行把關(guān),他們一般不會對具體的數(shù)據(jù)進行細致的核對。而編輯同行們對論文中統(tǒng)計學方面的關(guān)注也多是針對統(tǒng)計推斷部分,常常忽視對統(tǒng)計描述性指標的審核[5-8]。對數(shù)據(jù)資料的準確描述是統(tǒng)計推斷的基礎(chǔ),選用的描述性指標不正確則不可能應(yīng)用正確的假設(shè)檢驗方法;描述性指標的數(shù)值不準確,再正確的統(tǒng)計分析方法也得不到正確的結(jié)果;這將直接影響論文的科學性。因此,科技期刊編輯應(yīng)該對論文中的數(shù)據(jù),尤其是統(tǒng)計描述指標進行嚴格審核[9]。本文對醫(yī)學論文中統(tǒng)計描述性數(shù)據(jù)審核的要點、存在的問題和審核方法進行了總結(jié),以期促進編輯的編校水平,進一步提高論文質(zhì)量。有些數(shù)據(jù)疏漏比較明顯[10],文中沒有詳細敘述。對于一些隱蔽性很強的問題進行了舉例辨析,案例均來源于本刊編輯加工的稿件。
統(tǒng)計描述就是指在完成數(shù)據(jù)的收集并經(jīng)過初步整理后,用相應(yīng)的統(tǒng)計指標來反映數(shù)據(jù)的分布特征。統(tǒng)計學通常把數(shù)據(jù)分為定性資料和定量資料。描述定性資料的統(tǒng)計學指標主要有構(gòu)成比、各種率和相對比,以及醫(yī)學人口統(tǒng)計常用指標如出生率、總和生育率、死亡率、病死率等。定量資料的分布主要用集中趨勢指標和離散趨勢指標來描述。集中趨勢指標反映了數(shù)據(jù)資料的平均水平,主要有均數(shù)、中位數(shù)、眾數(shù)等,其中均數(shù)和中位數(shù)是醫(yī)學論文中常見的指標。離散趨勢指標反映了數(shù)據(jù)資料的變異程度,常見的指標有標準差、四分位間距、變異系數(shù)等。
首先應(yīng)該注意的問題是描述性指標的使用是否得當。常見的錯誤有構(gòu)成比和率、病死率和死亡率的混淆以及數(shù)據(jù)精度的不統(tǒng)一。病死率和死亡率的區(qū)別已有很多編輯同仁進行了討論。對于構(gòu)成比和率,臨床醫(yī)生常常錯誤應(yīng)用。區(qū)分的關(guān)鍵就是要嚴格把握好各指標的定義,分清楚分子、分母的含義。
例1某項研究分別對急性期和恢復期細菌性肺炎嬰幼兒患兒進行了PCT檢測,對2組檢測結(jié)果進行了比較。PCT檢測結(jié)果分為<0.5、0.5~2.0、2.0~10.0、>10.0μg/L 4個等級,設(shè)定≥0.5μg/L為PCT陽性。檢測結(jié)果見表1。
表1 不同病程細菌性肺炎嬰幼兒患兒PCT檢測結(jié)果
辨析1該表中“PCT水平”其實是對PCT水平構(gòu)成情況的描述,構(gòu)成的各部分總和應(yīng)等于總觀察數(shù)(該例2組均為50),各部分的構(gòu)成比總和應(yīng)為1或100%??梢钥闯觯?中其實漏了一列數(shù)據(jù),見表2。這種疏漏很不容易察覺,因為數(shù)據(jù)并沒有錯誤,但描述不嚴謹。
辨析2該表中“陽性率”計算無誤,但是小數(shù)點后的有效數(shù)字位數(shù)應(yīng)該與“PCT水平”一致,見表2。這種疏漏比較常見,編輯在編校稿件時應(yīng)著重關(guān)注。
表2 不同病程細菌性肺炎患兒PCT檢測結(jié)果
對于醫(yī)學論文中的定性資料,一般通過上下文的閱讀可以找出描述性指標的分子、分母的值,編輯應(yīng)不怕麻煩,勤動手,對數(shù)據(jù)進行再次計算。另外一個核對重點是關(guān)聯(lián)表之間數(shù)據(jù)的一致性問題。
例2 某項研究對足月正常妊娠(對照組)及足月胎膜早破(PROM組)產(chǎn)婦胎膜中M IF表達強度進行了比較,同時對PROM組中伴和不伴CAM的產(chǎn)婦胎膜中M IF表達強度也進行了比較。胎膜中M IF表達強度測定結(jié)果見表3、表4。
表3 對照組和PROM組產(chǎn)婦胎膜中M IF的表達
表4 PROM組中伴和不伴CAM的產(chǎn)婦胎膜中M IF的表達
辨析表3中PROM組產(chǎn)婦胎膜中M IF表達強度為-、+、++、+++的例數(shù)分別為8、20、17和5例。表4中的數(shù)據(jù)是PROM組中伴和不伴CAM的產(chǎn)婦胎膜中M IF的表達強度,這兩個表的數(shù)據(jù)是有關(guān)聯(lián)的,可以視為關(guān)聯(lián)表。表4中M IF表達強度的合計例數(shù)應(yīng)與表3中PROM組的數(shù)值一致。但很明顯,目前兩個表+和+++兩個表達強度的數(shù)據(jù)不一致。許多稿件中不會列出合計項,故這種疏漏很不容易察覺,因此,編輯應(yīng)該有意識地對關(guān)聯(lián)表的數(shù)據(jù)進行一致性審核。
對于調(diào)查類文章,審核的數(shù)據(jù)較多,尤其是分層越多,計算量越大,編輯要有耐心,可以用不同的算法進行計算,核對最終結(jié)果。但調(diào)查類文章有一點應(yīng)注意,在分層核對時,各層數(shù)據(jù)之和可以小于或等于、但不能多于觀察對象總數(shù)。比如,498例住院重癥手足口病患兒的臨床資料中居住地為城市、農(nóng)村、城鄉(xiāng)結(jié)合部的例數(shù)分別為138、241和107例,可以看出居住地合計小于498。對于大樣本的調(diào)查類研究,其數(shù)據(jù)收集有可能不全,允許有刪失,但文內(nèi)應(yīng)在相應(yīng)數(shù)據(jù)處標注清楚,也可以在居住地變量加上“居住地不詳”這一分類。
與定性數(shù)據(jù)一樣,對于定量數(shù)據(jù)首先應(yīng)該注意的也是描述指標的使用是否得當。主要錯誤是集中趨勢指標選用不當,尤其是算數(shù)均數(shù)和幾何均數(shù)、均數(shù)和中位數(shù)的不當應(yīng)用。有的文章中甚至出現(xiàn)了標準差和標準誤的誤用。算數(shù)均數(shù)和幾何均數(shù)的誤用比較好理解,醫(yī)學論文中幾何均數(shù)主要用于抗體滴度資料,相關(guān)專業(yè)人員對幾何均數(shù)的應(yīng)用也較熟練。但是均數(shù)和中位數(shù)的應(yīng)用較混亂,問題也較多。是選用均數(shù)還是中位數(shù)關(guān)鍵看數(shù)據(jù)的分布。對稱分布或正態(tài)分布資料就要用均數(shù)和標準差分別用來描述資料的集中和離散趨勢,而對于偏態(tài)分布的資料,一般選用中位數(shù)和四分位間距分別用來描述資料的集中和離散趨勢。
例3某項研究采用ELISA法檢測了37例肺癌患者化療前及23例健康者血漿中TGF-β1水平。正常對照組23例年齡35~75(55.0±13.3)歲。肺癌組37例,年齡36~80(57.0±11.6)歲。
辨析對于癌癥患者來說,年齡分布通常是非正態(tài)性的,所以不宜用均數(shù)和標準差來描述,宜選用中位數(shù)和上、下四分位數(shù)。醫(yī)學論文中,一些測量指標的正態(tài)性容易被檢測,作者也都比較能夠理解。而像年齡這一類太常見的指標,反倒容易被忽視。一方面,這類指標太常見,作者們自然而然就采用了常規(guī)數(shù)據(jù)處理方法;另一方面,這類數(shù)據(jù)常態(tài)下是正態(tài)分布,但是在特定人群中的分布特征發(fā)生了改變。年齡在全體人群中是正態(tài)分布,但是在腫瘤患者這個特定人群中,該指標的分布發(fā)生了明顯的負偏峰移動。所以,編輯在審核定量指標的描述時,一定要注意研究對象。
醫(yī)學論文中定量資料描述性指標數(shù)值的核對包括精度和準確性。測量工具直接限定了測量值的精度,因此,編輯在編校文章、核對數(shù)據(jù)時,一定要注意文中有關(guān)測量方法的描述,敘述不清時必須要求作者書寫清楚。描述性指標的數(shù)值一般由原始數(shù)據(jù)計算得來,因此在沒有原始數(shù)據(jù)的情況下很難進行核對,出現(xiàn)的數(shù)值問題一般也比較隱蔽,很難被發(fā)現(xiàn)。但是通過一些計算技巧,通過對關(guān)聯(lián)數(shù)據(jù)的驗算也可以發(fā)現(xiàn)問題。雖然很多時候不能說明數(shù)據(jù)就有問題,但是這種驗算給了編輯質(zhì)疑的理由,可以要求作者核對。這類數(shù)據(jù)的核對主要是掌握核對的思路,計算其實不難。下面舉幾個典型案例加以說明。
例4同例3。
辨析例3中,除了肺癌組不能用均數(shù)和標準差來描述年齡這個指標外,正常對照組的年齡分布數(shù)據(jù)也存疑。正常對照組的年齡范圍為35~75歲,均數(shù)和標準差分別為55.0和13.3歲。這種描述方法默認在正常對照組中年齡呈正態(tài)分布,那么按照95%的概率計算,應(yīng)有95%的年齡數(shù)值在(55.0±1.96×13.3)歲這個范圍內(nèi),計算后這個年齡范圍為28.93~81.07歲,該范圍明顯大于實際的年齡范圍(35~75歲),推測標準差計算有誤。
例5同例2。研究人員對足月正常妊娠(對照組)及足月胎膜早破(PROM組)產(chǎn)婦羊水中IL-6水平進行了比較,同時對 PROM組中伴和不伴CAM的產(chǎn)婦羊水中IL-6水平也進行了比較。羊水中IL-6水平測定結(jié)果見表5、表6。
表5 對照組和PROM組產(chǎn)婦羊水中IL-6的水平
表6 PROM組中伴和不伴CAM的產(chǎn)婦羊水中IL-6的水平
辨析這兩個表屬于關(guān)聯(lián)表格,表6中羊水IL-6水平的測定對象就是整個PROM組的產(chǎn)婦,因此,兩個表中PROM組產(chǎn)婦羊水IL-6水平的均值應(yīng)該相等。由表5可知,該均值為183.2μg/L。表6中雖然沒有直接給出均數(shù),但可以推算出來。根據(jù)表6的數(shù)據(jù),按照公式計算
可以看出,根據(jù)表6計算的PROM組產(chǎn)婦羊水IL-6水平均值與表5中的數(shù)值相差甚遠,有理由推測數(shù)據(jù)有誤。
例6某項研究對海口市767名老年人口腔健康相關(guān)生活質(zhì)量現(xiàn)狀進行了分析,其中以口腔健康影響程度量表(OHIP-14中文版)的總分和各維度得分反映口腔健康相關(guān)生活質(zhì)量。對患和不患有口腔疾患的老年人的OHIP-14得分進行比較。在結(jié)果部分,767名老年人“OHIP-14總分為(17.74±9.73)分,獨立能力減弱、心理不適、身體機能不適、疼痛與不適這4個維度的得分分別為(15.38±4.26)、(8.99 ±2.85)、(5.69 ±1.19) 和(7.70 ±2.97)分?!彪S后,文章對牙齦腫痛對口腔健康相關(guān)生活質(zhì)量的影響進行了分析,結(jié)果見表7。
表7 牙齦腫痛對老年人口腔健康相關(guān)生活質(zhì)量的影響
辨析1首先按照例5的數(shù)據(jù)核對方法對表內(nèi)的總分數(shù)據(jù)與文字敘述的數(shù)據(jù)進行比照,根據(jù)表7計算出的767名老年人OHIP-14總分的均數(shù)為38.90,而文字敘述為17.74,差別非常大。仔細審讀表7,可以看出,4個維度的得分與文字敘述也不相符。經(jīng)與研究者核對,文字敘述部分修改為OHIP-14總分為(37.72±9.72)分。表7修改為表8。
辨析2觀察表7中總分的數(shù)據(jù),兩組總分的標準差分別為0.53和0.40,而文字敘述中標準差為9.73。標準差越小,說明數(shù)據(jù)的變異越小,對于767名受試者,這么大的樣本量,標準差僅有0.53和0.40,有理由懷疑表7中總分的標準差有問題。經(jīng)與研究者核對,表7中標準差數(shù)據(jù)實為標準誤。修訂后的數(shù)據(jù)見表8。
表8 牙齦腫痛對老年人口腔健康相關(guān)生活質(zhì)量的影響(修訂)
統(tǒng)計描述是對實驗數(shù)據(jù)分布特征的反映,描述性指標數(shù)值錯誤將直接影響統(tǒng)計推斷的結(jié)果。雖然已經(jīng)有很多方法可以對假設(shè)檢驗的檢驗統(tǒng)計量的值進行核對,但是如果描述階段就存在錯誤,那么驗證結(jié)果自然也不可能正確。統(tǒng)計描述是后續(xù)進行統(tǒng)計推斷的基礎(chǔ),因此對描述性統(tǒng)計指標的核對意義重大。本文對醫(yī)學論文當中涉及的統(tǒng)計描述方面疏漏的審核方法進行了總結(jié)。編輯掌握了數(shù)據(jù)核對方法,可以對醫(yī)學論文中描述性統(tǒng)計數(shù)據(jù)進行有效的審核,從而保證論文的質(zhì)量,提高期刊的質(zhì)量和影響力。
[1]接雅俐,唐震,陳汐敏,等.科技期刊同行評議審稿流程改革與初步成效[J].中國科技期刊研究,2013,24(5):988-990.
[2]邱芬,曾令霞,國榮.統(tǒng)計學審查在醫(yī)學論文審稿中的必要性[J].中國科技期刊研究,2011,22(4):574-576.
[3]馬英.國外醫(yī)學期刊的審稿標準[J].編輯學報,2009,21(3):276-278.
[4]聞浩,魯立.關(guān)于專家刊前審讀的調(diào)查與分析[J].編輯學報,2011,23(5):428-429.
[5]李運明,陳長生,周煒,等.1篇SCI臨床醫(yī)學論文審稿意見中兩個統(tǒng)計學問題的探討[J].西南軍醫(yī),2012,14(5):797-799.
[6]劉璐,安勝利.中外醫(yī)學期刊論文中的統(tǒng)計學方法應(yīng)用情況分析[J].中國衛(wèi)生統(tǒng)計,2012,29(4):569-571.
[7]徐謙,沈耿,莫傳偉,等.中醫(yī)論文撰寫中常見的統(tǒng)計學錯誤分析[J].廣州中醫(yī)藥大學學報,2012,29(4):474-477.
[8]彭芳,董燕萍,金建華,等.重視醫(yī)學期刊中統(tǒng)計學問題的審查[J].編輯與出版,2013(11):43-46.
[9]王曼.科技期刊編輯工作和職業(yè)追求[J].洛陽師范學院學報,2013,32(5):123-125.
[10]黃晨,袁平戈,張大志.醫(yī)學期刊來稿中有關(guān)統(tǒng)計學錯誤分析[J].現(xiàn)代醫(yī)藥衛(wèi)生,2013,29(15):2268-2269.