董秀玥 趙瑞芹
1北京協(xié)和醫(yī)學院,中國醫(yī)學科學院腫瘤醫(yī)院放療科,中華醫(yī)學會雜志社《中華放射腫瘤學雜志》編輯部,北京,100021;2中國醫(yī)學科學院醫(yī)學信息研究所《醫(yī)學研究雜志》編輯部,北京,100020
?
臨床醫(yī)學文獻中的模糊信息分析與對策研究
董秀玥1趙瑞芹2
1北京協(xié)和醫(yī)學院,中國醫(yī)學科學院腫瘤醫(yī)院放療科,中華醫(yī)學會雜志社《中華放射腫瘤學雜志》編輯部,北京,100021;2中國醫(yī)學科學院醫(yī)學信息研究所《醫(yī)學研究雜志》編輯部,北京,100020
摘要臨床醫(yī)學文獻中的“模糊”信息不同于制假卻嚴重影響了文獻的質(zhì)量。本文從臨床醫(yī)學文獻入手,發(fā)現(xiàn)存在“模糊”信息如下:①組間資料分布、討論比較過程中的可比性問題;②隨訪過程中的隨訪時間、隨訪率問題;③檢驗結(jié)果與圖形選取上不夠具體和準確。就如何杜絕“模糊”提出信息應注意的地方如下:①組間資料分布是否存在偏倚,是否滿足相同標準;②要重視隨訪過程中實際樣本為提升文獻質(zhì)量,本文數(shù)量;③應交代具體P值,并依據(jù)橫坐標變量性質(zhì)來選擇不同的圖形。
關(guān)鍵詞臨床醫(yī)學文獻; 文獻質(zhì)量; “模糊”信息
中國共產(chǎn)黨年十六次代表科學研究究大會以來由于科學研究領(lǐng)域更加重視科技發(fā)展與創(chuàng)新,科技期刊得以飛速發(fā)展。在1978年“文革”后恢復出版的科技期刊有780余種,到2007年底我國大陸科技期刊已經(jīng)達到約5100種,增長了5.5倍,文獻數(shù)量得到大幅增加。然而在中國科技期刊文獻數(shù)量增快的同時,文獻之間的質(zhì)量差距較大[1]。醫(yī)學期刊同樣也存在上述問題。因此,如何縮小文獻質(zhì)量差距是當下一項重要的研究內(nèi)容。本文著眼于臨床醫(yī)學文獻,提出通過不斷把好文獻質(zhì)量關(guān)的方法來杜絕文獻中的“模糊”信息,從而來提升文獻質(zhì)量和影響力。
1 臨床醫(yī)學文獻中的可比性問題分析
所謂可比性,是指組間資料分布是否存在偏倚,是否滿足相同標準,否則比較就毫無意義和價值。因此,首先要交代清楚入組條件和排除標準,然后對組間資料分布進行差異性檢驗。當可比性檢驗結(jié)果顯示組間資料分布無差異后,方可進行組間臨床治療效果的比較。但在部分文獻中存在以下幾種現(xiàn)象:①缺乏組間詳細資料分布,可比性檢驗無從談起;②缺乏重要資料分布檢驗,因此可比性檢驗結(jié)果不完善;③籠統(tǒng)地說組間具有可比性,無詳細資料分布比較結(jié)果。部分“模糊”文獻存出上述情況,主要表現(xiàn)在文獻的科學性嚴重缺失。因此要特別留意文獻中有關(guān)組間資料分布的描述是否完整,組間資料分布是否均衡,特別是那些可能影響最終結(jié)果的因素是否已考慮在內(nèi)。
另外,可比性問題還包含在文獻所討論的內(nèi)容中。在討論中常常會將作者與其他研究者的研究結(jié)果進行簡單比較,這是模糊滋生的土壤,實際上應該仔細對文獻內(nèi)容進行閱讀,考量作者的研究時間與方法是否具有可比性。比如研究方法的不同(前瞻性與回顧性),研究時間的不同(起止點差異),隨訪時間不同(起止點差異),其研究結(jié)果之間也就無可比性。應交代清楚各自研究方法、研究時間和隨訪時間內(nèi)容,將各自研究結(jié)果清晰羅列出來,讓讀者清楚地看到研究方法的優(yōu)劣以及研究的可比性。
2 臨床醫(yī)學文獻中的隨訪問題分析
由于大部分臨床腫瘤治療學的研究文獻是回顧性成組研究,因此其存在的問題也非常突出。
①前瞻性隨機對照研究中的樣本數(shù)問題。由于患者是隨機選好后開始進行不同方法的治療,隨訪的起點相近,隨訪截止時隨訪時間范圍也相近,一般不用隨訪時間中位數(shù)表述,比如在2000年2月1日隨機入組200例患者,每例患者均要經(jīng)歷的1個月左右的治療,到5月1日全部治療結(jié)束,假如每例患者隨訪開始于治療結(jié)束后;可見隨訪開始時間最多只相差3個月,但分別到2003、2005、2008、2010年的5月1日后,200例患者均能滿足3、5、8、10年的隨訪時間(這里要注意的是,不是隨訪3、5、8、10年時除死亡外或失訪例數(shù)后的存活例數(shù)),計算的3、5、8、10年生存率等均是200例樣本數(shù)的結(jié)果(除外某年度因失訪患者被刪除對樣本總數(shù)的影響)。
圖1滿隨訪時間的例數(shù)分布情況
②回顧性對照研究中的樣本數(shù)問題。因為入組病例資料的隨訪起點不一致,有的甚至相差10年多,在隨訪截止時隨訪時間范圍也會相差很多。比如回顧分析2000年2月1日至2010年5月1日間入組的200例患者資料,到2012年時其隨訪時間可以為2個月至12年;可見隨訪時間最多可相差11年10個月,但到2003、2005、2008、2010年的每個5月1日后,能滿足3、5、8、10年隨訪時間(這里要注意的是,不是隨訪3、5、8、10年時除外死亡或失訪例數(shù)后的存活例數(shù))的患者均不足200例,計算的3、5、8、10年生存率等均不是200例樣本的結(jié)果。這樣就引出問題了,如何知道3、5、8、10年生存率等的分母是多少,即是多少樣本數(shù)量計算的結(jié)果。其實最科學的做法是具體交代清楚滿足3、5、8、10年隨訪時間的例數(shù),即各年度實際樣本數(shù)量。如果是繪制生存曲線則應將每年入組研究的患者數(shù)交代清楚,并在圖題內(nèi)用括號標出,如隨訪時間滿1、2、3、4、5年患者分別為x1、x2、x3、x4、x5例。另外,在回顧性成組研究中也應不用“中位生存時間”,因為每年度生存率已經(jīng)具體客觀反映了生存情況,因此,它不平等對待了不同時間起點而相同時間終點的情況。這好比把不是在同一起跑線的人的同一終點成績進行比較,把沒有可比性的分數(shù)綜合一起計算平均成績。
③中位隨訪時間中的樣本數(shù)問題。由于國外期刊在交代隨訪時間范圍時,常常也交代“中位隨訪時間”。這是因為隨訪時間資料分布屬于非正態(tài)分布,在用平均數(shù)表示時,不能用簡單的算數(shù)平均數(shù)、幾何平均數(shù)算法,故采用了中位數(shù)的形式。其實中位隨訪時間的稱謂并不科學,它實際是隨訪時間的中位數(shù),是描述隨訪時間數(shù)據(jù)中的平均值概念,其對,應的樣本數(shù)量也必然分布在最小值至最大值之間,如圖1。但國內(nèi)有些讀者誤認為“中位隨訪時間”是平均每個患者的隨訪時間,比如隨訪時間為2個月至12年,中位數(shù)是6年多,讀者卻誤讀為每個患者隨訪時間都大于6年,不用交代6年之前的每年實際隨訪的樣本數(shù)量。因此在科學研究中應務必重視和認真對待“中位隨訪時間”的概念和應用,特別是“中位隨訪時間”與樣本數(shù)量之間的關(guān)系。實際上年度生存率等都是具體數(shù)據(jù)計算結(jié)果,樣本數(shù)量大小反映了結(jié)果的準確性、科學性高低。因此,重視交代滿隨訪年的樣本數(shù)量和隨訪率,遠比重視交代隨訪時間更加重要。
圖2正確使用線段形式示例
隨訪率=(1-失訪人數(shù))/總?cè)藬?shù)[2]。關(guān)注失訪數(shù)的目的也是要反映樣本數(shù)量。另外,強調(diào)隨訪率的清晰描述,不僅是為了描述所計算的年度生存率等指標所需的樣本數(shù)量[5],同時也為了防止產(chǎn)生數(shù)據(jù)偏移現(xiàn)象而影響統(tǒng)計結(jié)果,因此隨訪率必須保持在90%以上[3]。此外,由于出院時間越長,失訪率可能越高,分母項樣本數(shù)量減少幅度就越小,因此應逐年計算隨訪率(甚至詳細到不同組別內(nèi)),并交代隨訪時間滿后逐年的樣本數(shù)量,只有這樣讀者才能徹底清楚所計算的逐年生存率的實際樣本數(shù)量(實際樣本數(shù)量=逐年計算隨訪率×隨訪時間滿逐年樣本數(shù)量)。
3 臨床醫(yī)學文獻中檢驗結(jié)果與圖形選取問題分析
改革開放以前,國內(nèi)對文獻統(tǒng)計檢驗的意識淡薄,出現(xiàn)將P<0.05與P>0.05意義混淆現(xiàn)象,對統(tǒng)計學不重視還表現(xiàn)在,沒有真正進行過檢驗就隨意寫上P<0.05或P>0.05,“模糊”了統(tǒng)計學的意義和價值。為了杜絕這種現(xiàn)象,中華醫(yī)學會系列雜志要求作者提供獲得P值前的統(tǒng)計量值(t、Z、F、χ2值等),最后甚至要求提供具體P值[4]。
圖3正確使用直方圖形式示例
圖4直方圖錯用線段形式表示示例
準確選擇圖像表達形式是正確表達研究結(jié)果的基礎(chǔ),當橫坐標表達的是連續(xù)變量時應使用線段表述,見圖2[5]。當橫坐標表達的不是連續(xù)變量時應使用條形圖表述,見圖3。文獻中有時存在橫坐標不是連續(xù)變量時使用了線段表述的情況,見圖4, 這就“模糊”了圖形所要表達的意義和價值。錯誤的表述方式會誤導讀者。原來是比較相同季度下東、西、北部間差異以及各部在不同季節(jié)時的差異,令讀者誤區(qū)解為是比較東、西、北部隨不同季度各自變化情況以及其間差異。
4 小結(jié)
臨床醫(yī)學文獻中的“模糊”信息與文獻制假有著根本不同之處,前者是真實的內(nèi)容,只是寫作過程中忽視了細致、嚴謹?shù)淖黠L;而后者則是品德上的問題,特別是高水平的制假文獻看不出來“模糊”問題,危害更大。因此,應首先排除造假文獻的可能,再考慮如何杜絕“模糊”文獻。要使文獻整體質(zhì)量得到提升,首先應從杜絕和制止“模糊”信息入手,準確識別制假與“模糊”文獻的區(qū)別,正確理解“模糊”文獻的定義,做到有的放矢,杜絕發(fā)表“模糊”文獻,從整體上提升文獻水平。
參考文獻
[1]馮長根.中國科技期刊數(shù)量增幅快質(zhì)量差距不小[EB/OL][2013-3-19].http://scitech.PeoPle.com.cn/GB/131715/8233749.html.
[2]洪明晃.隨訪率應逐年計算[J].中國腫瘤,1997,6(6):27.
[3]隊列研究和病例對照研究中的偏倚及控制 [EB/OL][2013-5-13].http://blog.renren.com/share/165413505/4270424386.
[4]中華醫(yī)學會雜志社.中華醫(yī)學會第五次雜志工作會議資料匯編[M].北京:中華醫(yī)學會雜志社,2009:143.
[5]李暉.實用醫(yī)學統(tǒng)計方法[M].鄭州:河南大學出版社,1989.
Analysis and Countermeasure Research on "Vague" Phenomenon of Clinical Medical Literature
Dong Xiuyue et al
EditorialBoardofChineseJournalofRadiationOncology,ChineseMedicalAssociation
PublishingHouse,ChineseAcademyofMedicalSciences,Beijing, 100021
AbstractClinical medical literature in “vague” phenomenon is different from counterfeits. but it seriously offects the quality of clinical medical literature. I study with a clinical oncology literature and discovered “vague” phenomenon, they are the comparability problem of grouped data distribution, comparing of discuss; the problem of follow-up time and follow-up rate; Test results and graphics were selected on the lack of specific and accurate. In order to enhance the quality of clinical medical literature,this paper giues specific recommendations and methods, they are: grouped data distribution whether there is bias, whether to meet the same standards; To pay attention to the actual number of samples during follow-up; To explain the specific value of P, and based on the abscissa variable properties to choose a different graphics. I hope to cause widespread concern and play a catalyst role.
Key WordsClinical Medicine Literature; Literature Quality; “Vague” Information
(收稿日期2014-09-01;編輯馮達)
中圖分類號R195.1
文獻標識碼A
DOI:10.13723/j.yxysh.2015.01.015