韓維棟 黨少農(nóng)
[摘要]科技論文是總結(jié)和傳播科學(xué)研究成果的文獻(xiàn)形式,其統(tǒng)計(jì)學(xué)原理和具體的統(tǒng)計(jì)方法使用得正確與否直接影響到科技論文的科學(xué)性與嚴(yán)謹(jǐn)性。本文結(jié)合編輯工作實(shí)踐,以醫(yī)學(xué)論文為例,探討科技論文中常見(jiàn)的涉及統(tǒng)計(jì)學(xué)的問(wèn)題(如科研設(shè)計(jì)問(wèn)題、統(tǒng)計(jì)描述問(wèn)題、統(tǒng)計(jì)推斷問(wèn)題、論文中統(tǒng)計(jì)方法的說(shuō)明問(wèn)題等),并提出解決科技論文統(tǒng)計(jì)學(xué)問(wèn)題的幾點(diǎn)意見(jiàn)。
[關(guān)鍵詞]科技論文統(tǒng)計(jì)學(xué)問(wèn)題對(duì)策
[中圖分類號(hào)]G23[文獻(xiàn)標(biāo)識(shí)碼]A
科技論文是科研工作的總結(jié)和成果傳播的重要形式,其撰寫(xiě)的邏輯過(guò)程應(yīng)當(dāng)與科研的工作過(guò)程一致,即提出研究問(wèn)題、設(shè)計(jì)研究方案、收集數(shù)據(jù)、統(tǒng)計(jì)分析數(shù)據(jù)和得出結(jié)論。統(tǒng)計(jì)學(xué)原理和方法貫穿于整個(gè)研究工作,是科研工作不可或缺的重要工具。因此,在科技論文中應(yīng)當(dāng)規(guī)范合理地體現(xiàn)研究工作所使用的統(tǒng)計(jì)學(xué)原理和具體的統(tǒng)計(jì)方法。美國(guó)統(tǒng)計(jì)協(xié)會(huì)在《統(tǒng)計(jì)實(shí)踐的倫理指導(dǎo)》中特別指出,在發(fā)表論文時(shí)作者有責(zé)任清楚地報(bào)告足夠的相關(guān)統(tǒng)計(jì)分析信息。隨著科學(xué)技術(shù)的快速發(fā)展。越來(lái)越多的科技論文被發(fā)表,然而由于各種原因,科技論文中涉及統(tǒng)計(jì)學(xué)的問(wèn)題層出不窮,嚴(yán)重地影響了論文的科學(xué)性和嚴(yán)謹(jǐn)性。筆者擬結(jié)合編輯工作實(shí)踐,就科技論文中經(jīng)常出現(xiàn)的統(tǒng)計(jì)學(xué)問(wèn)題進(jìn)行分析。并提出解決這些問(wèn)題的幾點(diǎn)意見(jiàn)。
一、科技論文中常見(jiàn)的統(tǒng)計(jì)學(xué)問(wèn)題
1科研設(shè)計(jì)問(wèn)題
為了保證研究的科學(xué)性、客觀性和嚴(yán)謹(jǐn)性。需要制訂科學(xué)周密的研究計(jì)劃。并在此計(jì)劃的指導(dǎo)下安排研究進(jìn)程,收集、整理和分析數(shù)據(jù)。制訂一個(gè)良好的科研設(shè)計(jì)方案,需要根據(jù)專業(yè)的要求。運(yùn)用科學(xué)的統(tǒng)計(jì)思想和手段來(lái)完成。然而。目前一些研究者在認(rèn)識(shí)上仍存在誤區(qū)。只重視數(shù)據(jù)分析時(shí)的統(tǒng)計(jì)工作,忽視了設(shè)計(jì)時(shí)的統(tǒng)計(jì)要求。從邏輯上說(shuō),如果設(shè)計(jì)上存在嚴(yán)重缺陷,后續(xù)的統(tǒng)計(jì)分析可能就會(huì)失去意義。目前,由于論文篇幅所限。一些科技論文在材料和方法部分要么不說(shuō)明研究設(shè)計(jì)方案,要么說(shuō)明過(guò)于簡(jiǎn)略。使讀者無(wú)法清晰地了解該研究的設(shè)計(jì)方案。甚至無(wú)法重復(fù)、驗(yàn)證該項(xiàng)實(shí)驗(yàn)。
(1)研究設(shè)計(jì)方案交代不清楚
以筆者從事的醫(yī)學(xué)期刊所接觸的稿件為例。目前。醫(yī)學(xué)研究大體可以分為基礎(chǔ)醫(yī)學(xué)研究、臨床醫(yī)學(xué)研究和社區(qū)人群研究三大類?;A(chǔ)醫(yī)學(xué)研究的對(duì)象主要是動(dòng)物、組織、細(xì)胞和基因等。在這類研究文章中研究者對(duì)實(shí)驗(yàn)動(dòng)物的選擇、分組和隨訪,細(xì)胞培養(yǎng)和分組等方面常常交代不明確。臨床醫(yī)學(xué)研究的主要對(duì)象是病人,在這類研究文章中對(duì)于病人的選擇和篩選,研究組的設(shè)立或隨機(jī)化方式交代不清。此外,這類研究文章的一個(gè)突出問(wèn)題是對(duì)照的選擇說(shuō)明不清晰。在對(duì)照研究中,合理規(guī)范地設(shè)立對(duì)照是研究因素被單獨(dú)清晰顯現(xiàn)的重要手段,但常見(jiàn)的問(wèn)題是對(duì)照人數(shù)偏少,選擇方式?jīng)]有說(shuō)明等。在社區(qū)人群研究方面,由于影響研究的因素更加復(fù)雜。所以對(duì)于這類研究文章在研究設(shè)計(jì)中更需要對(duì)可能影響研究的混雜因素進(jìn)行詳細(xì)的說(shuō)明。
(2)隨機(jī)化問(wèn)題
隨機(jī)化是統(tǒng)計(jì)分析的理論基礎(chǔ),相關(guān)的統(tǒng)計(jì)分析方法都建立在隨機(jī)抽樣和隨機(jī)分組的基礎(chǔ)上。遵循隨機(jī)化可以使樣本更具有代表性。組間更加均衡??萍颊撐闹嘘P(guān)于隨機(jī)化的主要問(wèn)題是從論文中無(wú)法看出該研究是否做了隨機(jī)化抽樣或隨機(jī)化分組,作者常在此問(wèn)題上表述不清。
(3)樣本量問(wèn)題
統(tǒng)計(jì)分析是個(gè)概率研究問(wèn)題,必要的重復(fù)(樣本量)是其又一個(gè)重要的理論基礎(chǔ)。樣本量過(guò)小使得樣本無(wú)法代表總體,可能會(huì)把偶然事件當(dāng)作規(guī)律性事件,也可能使得研究結(jié)果無(wú)法重復(fù)。例如,醫(yī)學(xué)研究論文中常見(jiàn)的問(wèn)題是沒(méi)有給出樣本量估算的方式或依據(jù)。關(guān)于樣本是否足夠完成研究也沒(méi)有說(shuō)明。其次。臨床研究中,樣本量過(guò)小是個(gè)突出的問(wèn)題。再次,有些臨床研究只重視病例樣本量,而忽視對(duì)照的樣本量。造成組間樣本量過(guò)于懸殊。在分子生物學(xué)的研究中,樣本量過(guò)小直接影響到實(shí)驗(yàn)重復(fù)次數(shù)的問(wèn)題,在這類研究中,研究者常常忽視這一點(diǎn),只做一次實(shí)驗(yàn)就得出結(jié)論,而無(wú)法進(jìn)行統(tǒng)計(jì)學(xué)分析。
(4)非研究因素的控制
科學(xué)研究主要是為了觀察研究因素所產(chǎn)生的效應(yīng)。但需要注意的是。必須控制或安排好非研究因素,因?yàn)樗鼈兛赡軙?huì)干擾對(duì)研究因素的觀察。所以,在研究設(shè)計(jì)時(shí)應(yīng)當(dāng)充分考慮到這些因素的作用。在論文中應(yīng)對(duì)此進(jìn)行必要的說(shuō)明。目前,醫(yī)學(xué)論文中對(duì)于這個(gè)問(wèn)題常常闡述不清,主要表現(xiàn)在:對(duì)這些因素的發(fā)現(xiàn)、識(shí)別和選擇的依據(jù)不明確,或在材料方法部分回避該問(wèn)題。
2統(tǒng)計(jì)描述問(wèn)題
統(tǒng)計(jì)學(xué)的一項(xiàng)重要工作就是對(duì)數(shù)據(jù)進(jìn)行合理的描述。來(lái)揭示數(shù)據(jù)呈現(xiàn)的規(guī)律或特征。這也是統(tǒng)計(jì)結(jié)果表達(dá)的重要步驟。在科技論文中。應(yīng)當(dāng)對(duì)數(shù)據(jù)進(jìn)行合理的統(tǒng)計(jì)描述。目前,科技論文中常見(jiàn)的統(tǒng)計(jì)描述問(wèn)題首先表現(xiàn)為數(shù)據(jù)資料類型不清楚,進(jìn)而無(wú)法選擇合適的描述指標(biāo)。統(tǒng)計(jì)資料主要分為計(jì)量資料和計(jì)數(shù)資料兩種。計(jì)量資料是用某種測(cè)量工具測(cè)量所獲得的具有單位的數(shù)據(jù),這樣的數(shù)據(jù)主要是描述數(shù)據(jù)的集中趨勢(shì)(平均數(shù))和離散程度(變異度);計(jì)數(shù)資料則是根據(jù)某種分類標(biāo)準(zhǔn)將數(shù)據(jù)分類,然后清點(diǎn)每個(gè)分類的觀察單位的數(shù)量,這類數(shù)據(jù)通常需要通過(guò)相對(duì)數(shù)(率/比)進(jìn)行描述。所以,分清資料的類型是進(jìn)行正確統(tǒng)計(jì)描述的前提。其次,計(jì)量資料的統(tǒng)計(jì)描述。多數(shù)研究者選擇用算術(shù)均數(shù)進(jìn)行平均水平的描述。其實(shí)有時(shí)并不一定合適。描述平均水平的指標(biāo)與數(shù)據(jù)的分布狀態(tài)有關(guān),而不是一概用算術(shù)均數(shù)。算術(shù)均數(shù)是在數(shù)據(jù)符合正態(tài)分布或?qū)ΨQ分布時(shí)最合適,如果數(shù)據(jù)是偏態(tài)分布,則應(yīng)當(dāng)選擇中位數(shù)。與之相應(yīng)的變異度指標(biāo)也需要根據(jù)數(shù)據(jù)的分布情形來(lái)選擇。第三,計(jì)數(shù)資料的統(tǒng)計(jì)描述,常見(jiàn)的問(wèn)題是計(jì)算相對(duì)數(shù)時(shí)分母過(guò)小,這樣計(jì)算的率等指標(biāo)常不穩(wěn)定。無(wú)法說(shuō)明問(wèn)題。如泉觀察例數(shù)太少,建議以絕對(duì)數(shù)進(jìn)行表達(dá)。此外。率和構(gòu)成比常容易混淆。常以構(gòu)成比來(lái)說(shuō)明率的問(wèn)題。這種問(wèn)題常發(fā)生在以數(shù)據(jù)為基礎(chǔ)統(tǒng)計(jì)的分析中。
3統(tǒng)計(jì)推斷問(wèn)題
對(duì)于抽樣性研究來(lái)說(shuō),還需要進(jìn)行必要的統(tǒng)計(jì)推斷。根據(jù)研究問(wèn)題的不同,統(tǒng)計(jì)推斷主要有可信區(qū)間和假設(shè)檢驗(yàn)。
(1)可信區(qū)間
可信區(qū)間(confidence interval,CI)是用來(lái)對(duì)總體特征進(jìn)行估計(jì)的方法。它是從概率的角度把抽樣誤差考慮在內(nèi)估計(jì)總體均數(shù)(率)所在的范圍。研究論文中常出現(xiàn)計(jì)算了相應(yīng)的樣本均數(shù)(率)后沒(méi)有進(jìn)行可信區(qū)間估計(jì)的問(wèn)題,這樣的點(diǎn)估計(jì)無(wú)法說(shuō)明抽樣誤差對(duì)估計(jì)的影響。
(2)假設(shè)檢驗(yàn)
假設(shè)檢驗(yàn)是進(jìn)行總體間比較的統(tǒng)計(jì)方法。在應(yīng)用假設(shè)檢驗(yàn)時(shí)需要對(duì)各種方法的使用條件有所了解,否則容易造成方法誤用。論文中假設(shè)檢驗(yàn)方法使用不當(dāng),其重要原因就是對(duì)各種方法的使用條件缺乏了解。合理應(yīng)用假設(shè)檢驗(yàn)要注意兩個(gè)基本前提:資料類型和研究問(wèn)題(設(shè)計(jì))。資料類型決定了假設(shè)檢驗(yàn)方法的大類區(qū)分,如計(jì)量資料對(duì)應(yīng)t檢驗(yàn)和方差分析等,而計(jì)數(shù)資料對(duì)應(yīng)卡方檢驗(yàn)等。在大類確定后需要根據(jù)研究的問(wèn)題和設(shè)計(jì)類型選擇具體的檢驗(yàn)方法。
隨著計(jì)算機(jī)的普及,統(tǒng)計(jì)分析軟件的推廣,許多復(fù)雜的高級(jí)統(tǒng)計(jì)方法得以推廣,多元線性回歸模型和多元Logistic回歸模型是使用最為廣泛的高級(jí)統(tǒng)計(jì)方法,同時(shí)也出現(xiàn)了很多研究者濫用這些統(tǒng)計(jì)方法的情形。這些方法的使用有明確的條件和要求,回歸模型從邏輯上講是分析原因和結(jié)果的問(wèn)題。因此,對(duì)于符合前因后果時(shí)序的數(shù)據(jù)是合適的。如前瞻性研究、干預(yù)性研究。此外,這些方法對(duì)數(shù)據(jù)也有一定的要求。Logistic回歸模型就要求數(shù)據(jù)為分類數(shù)據(jù),然而,論文中常出現(xiàn)使用連續(xù)性數(shù)據(jù)的情況。
4論文中統(tǒng)計(jì)方法的說(shuō)明
在科技論文中常常缺乏對(duì)所使用的統(tǒng)計(jì)學(xué)原理和具體統(tǒng)計(jì)方法的必要說(shuō)明。在材料方法部分應(yīng)當(dāng)對(duì)研究設(shè)計(jì)的相關(guān)問(wèn)題進(jìn)行說(shuō)明,在統(tǒng)計(jì)部分應(yīng)當(dāng)說(shuō)明所使用的具體統(tǒng)計(jì)方法。對(duì)于復(fù)雜的統(tǒng)計(jì)模型,應(yīng)當(dāng)給出必要的變量定義和過(guò)程說(shuō)明。此外,應(yīng)當(dāng)給出該研究假設(shè)檢驗(yàn)使用的檢驗(yàn)水準(zhǔn)。
統(tǒng)計(jì)圖表是統(tǒng)計(jì)分析結(jié)果表達(dá)的有力工具。目前,科技論文中的統(tǒng)計(jì)圖表不規(guī)范,欠自明性和邏輯相關(guān)性,圖表過(guò)于復(fù)雜或過(guò)于簡(jiǎn)單。
二、解決科技論文中統(tǒng)計(jì)學(xué)問(wèn)題的幾點(diǎn)意見(jiàn)
避免或減少科技論文中運(yùn)用統(tǒng)計(jì)學(xué)出現(xiàn)的問(wèn)題。需要作者、審稿專家和編輯人員的共同努力。
1提高作者對(duì)統(tǒng)計(jì)學(xué)重要性的認(rèn)識(shí)及基本統(tǒng)計(jì)技能
許多研究者認(rèn)為統(tǒng)計(jì)學(xué)只是幫助他們計(jì)算平均數(shù)的簡(jiǎn)單工具,沒(méi)有充分認(rèn)識(shí)到統(tǒng)計(jì)學(xué)原理和方法在科學(xué)研究中的不可或缺性。統(tǒng)計(jì)學(xué)不是幾個(gè)公式和方法,而是涉及一整套科學(xué)的邏輯思維方式方法及其運(yùn)用。所以。應(yīng)加強(qiáng)研究者在這方面的訓(xùn)練,提高研究者對(duì)科研設(shè)計(jì)中統(tǒng)計(jì)應(yīng)用的重視程度。
2建立論文發(fā)表前的統(tǒng)計(jì)學(xué)審稿制度
由于統(tǒng)計(jì)學(xué)具有較強(qiáng)的專業(yè)性,對(duì)于其他專業(yè)的學(xué)者來(lái)說(shuō)靈活應(yīng)用有一定難度,因此有必要請(qǐng)統(tǒng)計(jì)專業(yè)人士對(duì)論文的統(tǒng)計(jì)學(xué)應(yīng)用進(jìn)行評(píng)價(jià),及時(shí)發(fā)現(xiàn)其中的統(tǒng)計(jì)學(xué)問(wèn)題并給予合理的建議,這樣有助于減少統(tǒng)計(jì)問(wèn)題的發(fā)生。提高論文的質(zhì)量。
3科技期刊應(yīng)增加論文撰寫(xiě)的統(tǒng)計(jì)學(xué)要求
科技期刊可以考慮與統(tǒng)計(jì)專業(yè)人士合作制定論文撰寫(xiě)時(shí)的統(tǒng)計(jì)學(xué)要求。如規(guī)范的統(tǒng)計(jì)學(xué)表達(dá)方法、文章中必須出現(xiàn)的統(tǒng)計(jì)學(xué)內(nèi)容等。目前。多數(shù)科技論文的研究設(shè)計(jì)部分不清晰。有必要進(jìn)行規(guī)范。否則審稿專家也無(wú)法判斷研究是否合適。對(duì)于有嚴(yán)重統(tǒng)計(jì)學(xué)問(wèn)題的論文可以考慮要求作者提供原始數(shù)據(jù)進(jìn)行核查。
4編輯人員應(yīng)該在論文的統(tǒng)計(jì)把關(guān)方面有所作為
編輯人員對(duì)科技論文的科學(xué)性、創(chuàng)新性和規(guī)范性負(fù)有不可推卸的甄別責(zé)任。但是,許多編輯人員只重視專業(yè)知識(shí)及編輯業(yè)務(wù)知識(shí)的學(xué)習(xí),而忽視了對(duì)統(tǒng)計(jì)學(xué)知識(shí)的學(xué)習(xí),以致對(duì)文稿中存在的統(tǒng)計(jì)學(xué)問(wèn)題缺乏甄別能力,在審閱修改時(shí)未能及時(shí)發(fā)現(xiàn)存在的問(wèn)題。因此,在這方面應(yīng)該引起編輯同人的重視。第一,要提高認(rèn)識(shí)。在科技論文中出現(xiàn)統(tǒng)計(jì)學(xué)問(wèn)題或瑕疵,會(huì)大大降低論文的科學(xué)性和學(xué)術(shù)質(zhì)量,進(jìn)而影響到刊物的質(zhì)量。第二,要加強(qiáng)學(xué)習(xí)。加強(qiáng)對(duì)統(tǒng)計(jì)學(xué)知識(shí)的學(xué)習(xí)。不斷提高應(yīng)用統(tǒng)計(jì)學(xué)知識(shí)的能力。特別是對(duì)實(shí)際工作中遇到的統(tǒng)計(jì)學(xué)問(wèn)題,能夠及時(shí)請(qǐng)教,相互交流,弄清問(wèn)題所在,真正達(dá)到“去粗取精、去偽存真、優(yōu)者刊出、劣者淘汰”的目的。