[摘" "要] 公眾科學(xué)態(tài)度是科普領(lǐng)域的重要議題。本文以心理學(xué)假設(shè)為基礎(chǔ)編制公眾科學(xué)態(tài)度的量表,并用Rasch模型對(duì)量表進(jìn)行單維性檢驗(yàn)、局部獨(dú)立性檢驗(yàn)、結(jié)構(gòu)分析、試題項(xiàng)目及被試擬合分析、評(píng)定尺度分析。經(jīng)檢驗(yàn),本文量表可測(cè)量公眾科學(xué)態(tài)度,并用于其他延伸性研究。此外,Rasch模型還可作為微觀科普效果評(píng)估方法的補(bǔ)充。
[關(guān)鍵詞] Rasch模型" "公眾科學(xué)態(tài)度" "科普效果評(píng)估
[中圖分類(lèi)號(hào)]" N4 [文獻(xiàn)標(biāo)識(shí)碼] A [ DOI ] 10.19293/j.cnki.1673-8357.2024.05.007
缺失模型(Deficit Model)認(rèn)為公眾因“無(wú)知”而致“猜忌”。但缺失模型作為一種線性單向性模型備受批判,學(xué)界轉(zhuǎn)而關(guān)注以公眾科學(xué)態(tài)度為重點(diǎn)的公眾理解科學(xué),乃至公眾參與科學(xué)。從科普實(shí)踐工作與科普研究層面上而言,公眾科學(xué)態(tài)度仍極具討論價(jià)值。實(shí)踐表明,公眾科學(xué)態(tài)度影響著科研資助、科技成果轉(zhuǎn)化等一系列問(wèn)題。在理論研究方面,公眾參與科學(xué)本身夾雜著科學(xué)性與民主性的協(xié)商。科學(xué)技術(shù)革命日新月異,而我國(guó)公眾科學(xué)素質(zhì)仍處在較低水平。就現(xiàn)實(shí)而言,“誰(shuí)參與”“為何參與”“如何參與”等問(wèn)題仍處于深刻探討之中。因此,公眾科學(xué)態(tài)度是當(dāng)前實(shí)踐工作與理論研究的重要議題。
盡管公眾科學(xué)態(tài)度整體偏向積極,但近年來(lái)爭(zhēng)議性科學(xué)議題逐漸浮現(xiàn),公眾對(duì)科學(xué)呈現(xiàn)出期待與恐懼交織的態(tài)度,使得相關(guān)研究呈現(xiàn)出緊迫性。但當(dāng)前對(duì)“公眾科學(xué)態(tài)度”這一變量的測(cè)量尚存爭(zhēng)議,需先厘清變量,方可在此基礎(chǔ)上進(jìn)行深入研究。
從評(píng)估工具來(lái)看,社會(huì)科學(xué)領(lǐng)域內(nèi)常見(jiàn)將李克特量表(Likert scale)的定序數(shù)據(jù)作為定距數(shù)據(jù)進(jìn)行推論統(tǒng)計(jì)的錯(cuò)誤,予非線性數(shù)據(jù)以線性特征。因而,本文將運(yùn)用Rasch模型轉(zhuǎn)化數(shù)據(jù)類(lèi)型,以減少變量測(cè)量誤差。
1公眾科學(xué)態(tài)度的緣起與測(cè)量
1.1公眾面對(duì)的科學(xué)
科學(xué)是近代的產(chǎn)物,19世紀(jì)前,科學(xué)以依附于宗教、自然哲學(xué)的形式存在。盡管科學(xué)劃界問(wèn)題經(jīng)歷了可確證、可證偽乃至解構(gòu)的變遷,但科學(xué)作為知識(shí)機(jī)器以其“鐵律”[1]廣泛影響著社會(huì)。從狹義上而言,科學(xué)指系統(tǒng)化的自然科學(xué)。
現(xiàn)代自然科學(xué)的發(fā)展日新月異,在極大程度上改善了公眾生活水平,但隨之而來(lái)的生態(tài)、倫理等外在問(wèn)題日漸凸顯,“勾勒姆”(Golem)、 “李森科主義”( Lysenkoism)等內(nèi)在問(wèn)題發(fā)人深省??茖W(xué)被賦予的確定性逐漸消弭,取而代之的是不確定性。媒體環(huán)境更迭,媒體生產(chǎn)邏輯與科學(xué)知識(shí)生產(chǎn)規(guī)范的背離觸發(fā)了媒介化風(fēng)險(xiǎn),成為科學(xué)不確定性的放大器[2]。而公眾科學(xué)態(tài)度呈現(xiàn)搖擺的傾向,尤其體現(xiàn)在對(duì)爭(zhēng)議性科學(xué)議題的態(tài)度上,涉及科學(xué)知識(shí)、科學(xué)建制、科學(xué)共同體、科學(xué)的社會(huì)影響等方方面面。
1.2公眾科學(xué)態(tài)度的心理構(gòu)成
19世紀(jì)60年代,赫伯特·斯賓塞(Herbert Spencer)和亞歷山大·培因(Alexander Bain)將態(tài)度引入心理學(xué)領(lǐng)域用以指稱行動(dòng)準(zhǔn)備的內(nèi)心階段[3]。詹姆斯·M.奧爾森(James M. Olson)和馬克·P.贊納( Mark P. Zanna)認(rèn)為態(tài)度由認(rèn)知(cognition)、感覺(jué)(affect)、行為傾向(behavior tendency)三種成分構(gòu)成[4]。而“公眾科學(xué)態(tài)度”這一概念還未形成得到普遍認(rèn)可的定義。目前國(guó)內(nèi)外學(xué)界主要從細(xì)分對(duì)象著手構(gòu)建變量指標(biāo)體系,相關(guān)研究主要聚焦在以下三個(gè)方面。
其一,公眾對(duì)科學(xué)態(tài)度的評(píng)估。國(guó)內(nèi)代表性評(píng)估如中國(guó)公民科學(xué)素質(zhì)調(diào)查將公民科學(xué)態(tài)度分為三個(gè)維度:公民對(duì)科技的感興趣程度、公民對(duì)科技的態(tài)度與看法、公民對(duì)科學(xué)家的認(rèn)知看法[4]。此外,中國(guó)科學(xué)技術(shù)指標(biāo)中將公民對(duì)科學(xué)技術(shù)的態(tài)度降維為公民對(duì)科學(xué)技術(shù)信息的感興趣程度、公民對(duì)科學(xué)技術(shù)的看法、公民對(duì)公共科技議題的看法三個(gè)二級(jí)指標(biāo)[5]。
國(guó)外的代表性調(diào)查有歐洲晴雨表(Eurobarometer)、美國(guó)科學(xué)指標(biāo)(Science Indicators)[6]、美國(guó)國(guó)家科學(xué)基金(National Science Foundation,NSF)調(diào)查[7-8]、米勒(J·D. Miller)公眾科學(xué)素養(yǎng)測(cè)量[9]、美國(guó)民意調(diào)查等。如歐洲晴雨表認(rèn)為公眾科學(xué)態(tài)度包含公眾對(duì)科學(xué)、科學(xué)的社會(huì)影響、科學(xué)共同體、科技政策等方面的興趣、認(rèn)知與評(píng)價(jià)[10-11]。美國(guó)民意調(diào)查則將科學(xué)家的職業(yè)威望程度、公眾信任科學(xué)家的程度、公眾對(duì)科學(xué)的利弊感知、公眾對(duì)科學(xué)發(fā)展的認(rèn)知等多方面納入變量范疇[12]。
其二,公眾對(duì)爭(zhēng)議性科學(xué)技術(shù)的態(tài)度。如公眾對(duì)轉(zhuǎn)基因[13]、5G技術(shù)[14]、核能[15]等技術(shù)的態(tài)度。
其三,影響公眾對(duì)科學(xué)的態(tài)度的因素。如科學(xué)知識(shí)[12,16-17]、大眾媒體[18]、社會(huì)結(jié)構(gòu)因素、社會(huì)文化觀念[19]等因素對(duì)公眾態(tài)度的影響。這兩類(lèi)研究建立在對(duì)“公眾對(duì)科學(xué)的態(tài)度”這一變量的測(cè)量上,但由于概念界定不清、指標(biāo)體系不明確、試題項(xiàng)目數(shù)量少等問(wèn)題,測(cè)量準(zhǔn)確性不及代表性調(diào)查。
公眾科學(xué)態(tài)度的指標(biāo)體系是變量測(cè)量與延伸性研究的基礎(chǔ)所在。盡管各量表所涉指標(biāo)不盡相同,但基本上圍繞科學(xué)、科學(xué)共同體、科技政策、科技應(yīng)用、科學(xué)的社會(huì)影響等方面展開(kāi)。當(dāng)前研究的指標(biāo)體系較少?gòu)男睦韺W(xué)范疇出發(fā),也較少?gòu)膽B(tài)度這一基本單位著手構(gòu)建,因而忽視了態(tài)度層次的多元性。綜上,本文將公眾科學(xué)態(tài)度定義為公眾基于科學(xué)各方面現(xiàn)狀所形成的一種對(duì)科學(xué)的認(rèn)知取向、情感傾向、行為意向的心理結(jié)構(gòu)。
1.3公眾對(duì)科學(xué)態(tài)度的傾向
測(cè)量公眾科學(xué)態(tài)度時(shí),既往研究通常將其置于態(tài)度二元論的框架之下,以積極、消極二元表述劃分試題項(xiàng)目?jī)A向。同時(shí)采用李克特量表衡量公眾態(tài)度傾向程度,結(jié)果以百分比例或數(shù)值的形式呈現(xiàn),且相關(guān)研究尚未劃定閾值以區(qū)分公眾科學(xué)態(tài)度,如美國(guó)科學(xué)指標(biāo)、歐洲晴雨表、中國(guó)公民科學(xué)素質(zhì)調(diào)查等。
除此之外,既往研究所呈現(xiàn)的數(shù)據(jù)形式難以滿足延伸性研究需求,百分比例的結(jié)果無(wú)法實(shí)現(xiàn)試題項(xiàng)目間累加累減的計(jì)算,難以形成對(duì)變量的整體測(cè)量。而定序數(shù)據(jù)并無(wú)數(shù)值意義,不可進(jìn)行累加累減。此外,由于各量表采用的李克特量表尺度不同,相關(guān)結(jié)果難以進(jìn)行縱橫向比較。
因此,本文將基于Rasch模型對(duì)變量數(shù)據(jù)進(jìn)行多次迭代直至收斂以取得較為精確的數(shù)值。經(jīng)過(guò)Rasch模型的轉(zhuǎn)化,變量數(shù)據(jù)由定序數(shù)據(jù)轉(zhuǎn)為定距數(shù)據(jù),對(duì)變量的整體傾向程度以線性形式呈現(xiàn)。
2研究設(shè)計(jì)
2.1測(cè)量對(duì)象:樣本描述
本文將進(jìn)行預(yù)測(cè)量、正式測(cè)量?jī)奢啘y(cè)量。測(cè)量前將量表指標(biāo)體系進(jìn)行細(xì)化,共計(jì)11個(gè)試題項(xiàng)目。預(yù)測(cè)階段共抽取31人,其中男性17人、女性14人;小學(xué)學(xué)歷3人、初中學(xué)歷16人、高中學(xué)歷6人、大學(xué)學(xué)歷6人;16~35周歲12人、36~60周歲11人、60周歲以上8人。
正式測(cè)量階段采用多階段抽樣,共抽取300人,對(duì)浙江省金華市、河南省駐馬店市、河南省焦作市、新疆維吾爾自治區(qū)喀什市的被測(cè)對(duì)象進(jìn)行調(diào)查,其中每市抽選一個(gè)社區(qū)、一個(gè)村,并以家庭為單位進(jìn)行整群抽樣。測(cè)量對(duì)象為16歲以上的公民,其中男性153人、女性147人;小學(xué)學(xué)歷27人、初中學(xué)歷124人、高中學(xué)歷72人、大學(xué)學(xué)歷77人;16~35周歲113人、36~60周歲150人、60周歲以上37人。
2.2公眾科學(xué)態(tài)度量表編制
本文將公眾科學(xué)態(tài)度這一潛在變量進(jìn)行降維。以心理學(xué)假設(shè)為理論基礎(chǔ),考察公眾對(duì)科學(xué)的認(rèn)知取向、情感傾向、行為意向三個(gè)層面。首先,認(rèn)知取向不等同于認(rèn)知,認(rèn)知取向指對(duì)某客體贊同與否的評(píng)價(jià)性看法等,而并非公眾對(duì)科學(xué)認(rèn)知的能力,即正確作答科學(xué)試題項(xiàng)目的能力。其次,情緒不等同于情感,兩者作為同一心理現(xiàn)象的不同層次,情感可由情緒表達(dá),情緒的累積式變化也會(huì)影響情感的轉(zhuǎn)變。此外,行為意向不等同于行為,行為意向是主體付諸某行為的意愿等。根據(jù)心理學(xué)假設(shè),“態(tài)度—行為”具有一致性傾向,即公眾科學(xué)態(tài)度與公眾對(duì)科學(xué)采取的行為有內(nèi)在一致性。
公眾科學(xué)態(tài)度具體指標(biāo)以公眾科學(xué)素養(yǎng)評(píng)估、公眾調(diào)查等相關(guān)測(cè)量為基礎(chǔ),如中國(guó)科學(xué)技術(shù)指標(biāo)、歐洲晴雨表、美國(guó)國(guó)家科學(xué)基金、美國(guó)科學(xué)指標(biāo)、美國(guó)民意調(diào)查等。部分調(diào)查將“公眾從事科學(xué)相關(guān)職業(yè)”納入測(cè)量,但這一指標(biāo)具有年齡局限性,從普遍性的角度考量將這一指標(biāo)剔除。而伴隨著風(fēng)險(xiǎn)社會(huì)的顯現(xiàn),公眾科學(xué)態(tài)度這一變量也需考慮公眾對(duì)科學(xué)社會(huì)性勾連的認(rèn)知[20]。此外,本文將公眾傳播科學(xué)的意向、參與科學(xué)決策的意向[21]、運(yùn)用科學(xué)的意向[22]等行為意向納入指標(biāo)。
綜上,公眾科學(xué)態(tài)度的指標(biāo)體系如表1所示,共包含11項(xiàng)指標(biāo)。本文將以核電技術(shù)為例,測(cè)量時(shí)將指標(biāo)體系進(jìn)一步具象化。
2.3測(cè)量方法:Rasch模型
經(jīng)典測(cè)量理論(Classical Test Theory,CTT)、概化理論(Generalizability Theory,GT)、項(xiàng)目反應(yīng)理論(Item Response Theory,IRT)、Rasch模型是常見(jiàn)的測(cè)量理論。CTT作為早期測(cè)量理論,具有簡(jiǎn)單易操作的特點(diǎn),是一種中觀測(cè)量理論;GT則改進(jìn)了CTT理論中誤差不可分解的缺陷,注重結(jié)論的概化,屬于宏觀測(cè)量理論;IRT與Rasch模型則均為微觀測(cè)量理論,可對(duì)試題項(xiàng)目、被試水平進(jìn)行細(xì)致分析。盡管同為微觀測(cè)量模型,但I(xiàn)RT與Rasch模型也有著本質(zhì)不同,IRT是一種模型擬合數(shù)據(jù)的理論,而Rasch模型是一種數(shù)據(jù)擬合模型的理論[23-24]。
格奧爾格·拉希(Georg Rasch)于1960年提出Rasch測(cè)量(Rasch Measurement)。其前提假設(shè)為,被試作答試題項(xiàng)目滿足一種數(shù)學(xué)關(guān)系,即被試能力越強(qiáng),則越可能正確作答較難試題項(xiàng)目;試題項(xiàng)目越難,則被試越難以正確作答。當(dāng)被試能力水平與試題項(xiàng)目難度相當(dāng)時(shí),被試正確作答該試題項(xiàng)目的概率是50%。當(dāng)被試能力水平高于試題項(xiàng)目水平時(shí),被試正確作答該試題項(xiàng)目的概率將大于50%,反之則低于50%[25],且Rasch模型參數(shù)間保持相對(duì)獨(dú)立性,即被試能力水平與試題項(xiàng)目難度互不影響。
Rasch測(cè)量建立在概率論基礎(chǔ)之上,能力為Bn的被試n正確作答難度為Di的試題項(xiàng)目i的概率為P,公式如下:
(1)
已知概率P,Rasch測(cè)量將利用概率P進(jìn)一步假設(shè)可能性(odds)模型,并利用自然對(duì)數(shù)進(jìn)一步優(yōu)化,可得Rasch模型(Rasch Model)公式:
(2)
Rasch模型作為“尺子的尺子”,不僅僅在轉(zhuǎn)化定序數(shù)據(jù)上有良好的表現(xiàn),對(duì)“測(cè)量”本身的糾正也是Rasch模型最大的優(yōu)勢(shì)。Rasch模型通過(guò)總體統(tǒng)計(jì)值對(duì)量表信度(Reliability)、區(qū)分度(Separation)、試題總體擬合度、被試總體擬合度進(jìn)行評(píng)估,考察數(shù)據(jù)對(duì)模型的整體擬合情況。Rasch模型需滿足單維性假設(shè),確保量表中所有指標(biāo)均為測(cè)量同一潛在變量;此外,可以通過(guò)試題項(xiàng)目擬合度分析進(jìn)一步檢驗(yàn)試題項(xiàng)目效度;Rasch模型假設(shè)各試題項(xiàng)目之間為相互獨(dú)立,即局部獨(dú)立性;借助懷特圖(Wright map)可考察量表中各試題項(xiàng)目的難度分布情況、被試能力水平分布情況,將過(guò)度重合的試題項(xiàng)目予以修改;Rasch模型需檢驗(yàn)試題項(xiàng)目的選項(xiàng)設(shè)置情況,如若存在多余選項(xiàng)可進(jìn)行選項(xiàng)合并?;诹勘淼亩囗?xiàng)檢驗(yàn),使得測(cè)量過(guò)程被不斷優(yōu)化,以便獲取相對(duì)精準(zhǔn)的數(shù)據(jù)。
2.4預(yù)測(cè)量表及其分析
預(yù)測(cè)量表共計(jì)11項(xiàng)試題項(xiàng)目,分別對(duì)應(yīng)11項(xiàng)指標(biāo)。本文應(yīng)用量表時(shí),將以核電技術(shù)為例,采用李克特四級(jí)量表。如“我認(rèn)為核電技術(shù)未來(lái)發(fā)展整體利大于弊”對(duì)應(yīng)指標(biāo)“公眾對(duì)科學(xué)創(chuàng)新發(fā)展的風(fēng)險(xiǎn)與收益感知”,“我愿意主動(dòng)了解核電技術(shù)”對(duì)應(yīng)指標(biāo)“公眾對(duì)科學(xué)的認(rèn)知意愿”,“我尊重、信任核電技術(shù)專家”對(duì)應(yīng)指標(biāo)“公眾對(duì)科學(xué)家身份的認(rèn)同與信任”等。
將預(yù)測(cè)數(shù)據(jù)錄入Winsteps 3.72.3進(jìn)行處理。預(yù)測(cè)階段量表總體統(tǒng)計(jì)值良好,基本滿足單維性假設(shè),評(píng)定尺度擬合良好。從局部獨(dú)立性假設(shè)來(lái)看,Item6與Item7之間的殘差相關(guān)系數(shù)達(dá)0.61,超出臨界值范圍。從懷特圖中可知,預(yù)測(cè)階段Item8與Item10難度重合。此外,在試題項(xiàng)目擬合方面,Item1的Infit MNSQ、Outfit MNSQ值分別為2.12、2.20,點(diǎn)—測(cè)量相關(guān)系數(shù)為0.38,均落在臨界值之外。被試擬合不良共計(jì)2人,將該數(shù)據(jù)刪除后,重新測(cè)量量表總體統(tǒng)計(jì)值。刪除異常被試后,各部分指標(biāo)數(shù)值有所優(yōu)化,但變化較為微弱,考察綜合情況后對(duì)異常數(shù)據(jù)予以保留。
除部分試題項(xiàng)目外,量表整體表現(xiàn)良好。根據(jù)預(yù)測(cè)階段數(shù)據(jù),擬對(duì)量表中Item7、Item8進(jìn)行修改。其中Item7為“我對(duì)我國(guó)核電安全管理制度有信心”,對(duì)應(yīng)指標(biāo)“公眾對(duì)科學(xué)管理體系的認(rèn)同與信任”;Item8為“我為國(guó)家資助核電技術(shù)感到高興”,對(duì)應(yīng)指標(biāo)“公眾對(duì)科研資助的情感”。預(yù)測(cè)階段測(cè)試人數(shù)較少,使得部分指標(biāo)情況欠佳,將結(jié)合正式測(cè)量階段數(shù)據(jù)進(jìn)一步考察。
3數(shù)據(jù)分析
3.1量表總體統(tǒng)計(jì)值
Rasch模型量表總體統(tǒng)計(jì)值中需考察區(qū)分度、信度、Infit、Outfit。區(qū)分度是衡量試題項(xiàng)目差異、被試個(gè)體能力差異的重要指標(biāo),信度則是檢驗(yàn)量表可信程度的指標(biāo)。
Infit、Outfit是Rasch模型中檢測(cè)數(shù)據(jù)是否擬合模型的關(guān)鍵值,其中Infit是加權(quán)擬合值,Outfit是非加權(quán)擬合值;MNSQ指均方統(tǒng)計(jì)值,ZSTD指顯著性檢驗(yàn)值。Infit主要檢測(cè)被試能力與試題項(xiàng)目難度相近時(shí)的表現(xiàn),該部分?jǐn)?shù)據(jù)產(chǎn)生較大方差;Outfit則對(duì)離估計(jì)值更遠(yuǎn)的被試或試題項(xiàng)目更敏感,如對(duì)高能力被試錯(cuò)誤作答低難度試題項(xiàng)目的情況予以反應(yīng),該部分?jǐn)?shù)據(jù)產(chǎn)生較大殘差。一般情況下,優(yōu)先考察Outfit,其次考察Infit;優(yōu)先考察MNSQ,其次考察ZSTD。在分級(jí)量表中,Infit MNSQ、Outfit MNSQ在0.6~1.4區(qū)間可視為擬合良好[26],接近1時(shí)最為理想。Infit ZSTD、Outfit ZSTD值在±2.0區(qū)間內(nèi)為合理值[27],接近0時(shí)最為理想。
如表2所示,被試平均估計(jì)值為1.19,試題項(xiàng)目估計(jì)值為0.00;被試區(qū)分度為1.81,試題項(xiàng)目區(qū)分度為10.89;被試信度為0.77,試題項(xiàng)目信度為0.99。被試與試題項(xiàng)目的Infit MNSQ值均為0.99,Outfit MNSQ值均為0.99;Infit ZSTD值分別為-0.20、-0.10,Outfit ZSTD值分別為-0.20、-0.10,均在合理范圍內(nèi)。
3.2 Rasch模型單維性檢驗(yàn)
較為常見(jiàn)的單維性檢驗(yàn)方法是主成分分析法(Principal Component Analysis,PCA)、探索性因子分析法(Exploratory Factor Analysis,EFA)與驗(yàn)證性因子分析法(Confirmatory Factor Analysis,CFA)。這類(lèi)檢驗(yàn)方法可以通過(guò)SPSS等分析工具操作,如探索性因子分析中,第一因素特征根為第二特征根的3~5倍即可認(rèn)為量表滿足單維性假設(shè)。但這種檢驗(yàn)法并非直接檢驗(yàn)Rasch模型的單維性,被質(zhì)疑效度有限。
目前,基于Rasch模型本身的單維性檢驗(yàn)方法為殘差主成分分析法(Principal Component Analysis of Residuals,PCAR)。該方法標(biāo)準(zhǔn)如下:其一,由測(cè)量解釋的原始方差(Raw variance explained by measures)比例至少為40%[28];其二,第一對(duì)比中未解釋方差(Unexplained variance in 1st contrast)比例小于5%,特征根小于3[29];其三,由測(cè)量解釋的原始方差比例與第一對(duì)比中未解釋方差比例比值大于3[30]。
如表3所示,總體來(lái)看量表滿足單維性假設(shè)。其中由測(cè)量解釋的原始方差比例的實(shí)際值(Empirical)為49.5%,高于臨界值40%。此外,由測(cè)量解釋的原始方差比例與第一對(duì)比中未解釋方差比例比值為4.85,大于推薦值3。第一對(duì)比中未解釋方差特征根為2.2,符合低于3.0的標(biāo)準(zhǔn),其比例達(dá)到10.2%,大于理想值5%,但仍處在能接受的15%范圍內(nèi)。因此,整體上量表基本滿足了單維性假設(shè)。
3.3局部獨(dú)立性檢驗(yàn)
Rasch模型中,局部獨(dú)立性假設(shè)與單維性假設(shè)同等重要,要求被試能力與試題項(xiàng)目之間相互獨(dú)立,即被試能力水平不受試題項(xiàng)目難度影響。Rasch模型局部獨(dú)立性通過(guò)計(jì)算殘差間相關(guān)性進(jìn)行測(cè)量,若不滿足將導(dǎo)致量表信度被過(guò)度夸大。已有研究將局部獨(dú)立性假設(shè)的臨界值設(shè)為±0.2[31],也有研究將臨界值設(shè)為±0.5[32]或是±0.7[33]。
量表局部獨(dú)立性情況如表4所示,各試題項(xiàng)目間相關(guān)系數(shù)絕對(duì)值在0.24~0.41區(qū)間。較預(yù)測(cè)量階段的0.38~0.61區(qū)間,正式實(shí)驗(yàn)階段的局部獨(dú)立性指標(biāo)有所提升,處在±0.5的臨界范圍內(nèi)。盡管沒(méi)有達(dá)成±0.2的臨界值要求,但整體上滿足了Rasch模型的局部獨(dú)立性假設(shè)。預(yù)實(shí)驗(yàn)階段Item6與Item7的相關(guān)系數(shù)達(dá)0.61,結(jié)合各項(xiàng)指標(biāo),正式實(shí)驗(yàn)階段將item7“我對(duì)我國(guó)核電安全管理制度有信心”修改為“我國(guó)核電安全管理制度能充分預(yù)防核泄漏”,修改后的試題項(xiàng)目表現(xiàn)良好。
3.4量表結(jié)構(gòu)分析
Rasch模型中,懷特圖是反映被試能力與試題項(xiàng)目難度的重要圖示,在懷特圖中被試與試題項(xiàng)目被同時(shí)放置于同一刻度下,刻度單位為L(zhǎng)ogits。懷特圖可以考察被試能力與試題項(xiàng)目難度是否分布合理。
如圖1所示,圖示左邊為被試能力分布,右邊為試題項(xiàng)目難度分布。被試能力越高、試題項(xiàng)目越難則越居上方。從懷特圖中可知,整體上被試對(duì)核電技術(shù)呈現(xiàn)積極的態(tài)度,被試水平整體高于試題項(xiàng)目難度,被試能力均值大于試題項(xiàng)目均值1Logits。若在能力水平測(cè)試中,該懷特圖所展示的結(jié)果欠佳,但本次測(cè)量的潛在變量是公眾科學(xué)態(tài)度,懷特圖所示的均值差距恰恰驗(yàn)證了現(xiàn)階段我國(guó)公眾對(duì)科學(xué)的積極態(tài)度[10]。正式測(cè)量階段對(duì)item8進(jìn)行了修改,從懷特圖分布情況上來(lái)看,修改后item8的難度達(dá)到預(yù)期效果。
綜合看來(lái),量表結(jié)構(gòu)并不算良好,item11與item4之間存在較大空缺。試題項(xiàng)目難度分布存在兩處重合。但可從中知悉,被試對(duì)核電技術(shù)的態(tài)度呈現(xiàn)分層的態(tài)勢(shì),即具有較為積極的認(rèn)知評(píng)價(jià)、情感態(tài)度,但認(rèn)知興趣、傳播意向、參與意向卻極低。
3.5試題項(xiàng)目及被試的擬合度分析
試題項(xiàng)目及被試的擬合度分析是指實(shí)驗(yàn)數(shù)據(jù)與Rasch模型的擬合程度,上文報(bào)告了量表整體的擬合程度,該部分將細(xì)化至每一試題項(xiàng)目與被試,利于篩選出擬合不良的試題項(xiàng)目與被試,進(jìn)一步修改試題項(xiàng)目或刪除被試數(shù)據(jù)。評(píng)價(jià)標(biāo)準(zhǔn)為Infit、Outfit中的MNSQ、ZSTD值以及點(diǎn)—測(cè)量相關(guān)系數(shù)。該部分MNSQ值的臨界值為0.60~1.40,ZSTD值臨界值為±2.0。如若MNSQ值達(dá)標(biāo),則可不報(bào)告ZSTD值。而點(diǎn)—測(cè)量相關(guān)系數(shù)的臨界范圍為0.40~0.80。如表5所示,量表試題項(xiàng)目的擬合情況良好。Infit、Outfit的MNSQ值在0.85~1.19區(qū)間,點(diǎn)—測(cè)量相關(guān)系數(shù)(Point-Measure correlation)整體落在0.52~0.66區(qū)間內(nèi),符合0.40~0.80區(qū)間的臨界范圍。證明各試題項(xiàng)目均符合量表所測(cè)量的“公眾科學(xué)態(tài)度”這一潛在變量。
由于量表試題項(xiàng)目數(shù)量較少,被試擬合值較為敏感,少量異常作答便可影響被試擬合值。因此,被試Infit MNSQ、Outfit MNSQ值以小于2.0為臨界范圍[34]。正式測(cè)量階段超出擬合臨界值的被試共31人。被試擬合不佳的原因可能在于被試未認(rèn)真作答、表現(xiàn)不穩(wěn)定、存在干擾因素等。將異常作答的數(shù)據(jù)刪除后,重新測(cè)量量表總體統(tǒng)計(jì)值。結(jié)果如表6所示,量表中被試Infit MNSQ值由原本的0.99下降為0.97;被試與試題項(xiàng)目的Outfit MNSQ值由0.99、0.99下降為0.98、0.98。被試的信度從原本的0.77上升至0.80。刪除被試數(shù)據(jù)需考察刪除后量表各項(xiàng)指標(biāo)是否有明顯改善,或是被試數(shù)據(jù)確實(shí)存在高度異常表現(xiàn),否則予以保留。刪除部分被試數(shù)據(jù)后,仍會(huì)有新的異常被試出現(xiàn)。綜上,盡管被試信度有所提升,但其他擬合值有所下降,綜合考察情況后決定對(duì)異常作答被試數(shù)據(jù)予以保留。
3.6量表評(píng)定尺度分析
Rasch模型的基本假設(shè)認(rèn)為,高能力被試正確作答高難度試題項(xiàng)目的概率更高。在李克特量表中表現(xiàn)為高能力被試更有可能選擇高等級(jí)選項(xiàng),單個(gè)選項(xiàng)被選中的概率應(yīng)當(dāng)隨著被試能力的提高而呈現(xiàn)單調(diào)遞增性,即Rasch模型的單調(diào)性假設(shè)(monotonicity)。
其一,需考察選項(xiàng)被選擇的次數(shù)(observed count),如若頻次低于10,則應(yīng)當(dāng)將其合并至鄰近選項(xiàng)中。如表7所示,類(lèi)別標(biāo)簽中1表示“非常不同意”,2表示“不同意”,3表示“同意”,4表示“非常同意”。所有選項(xiàng)均滿足最低頻次值。
其二,若量表滿足模型單調(diào)性假設(shè),則平均估計(jì)值(average measure)應(yīng)當(dāng)為單調(diào)遞增;同時(shí)擬合指標(biāo)應(yīng)當(dāng)小于2.0[35],擬合值過(guò)大則認(rèn)為該選項(xiàng)存在較大誤差,應(yīng)考慮合并至鄰近選項(xiàng)。4個(gè)選項(xiàng)的平均估計(jì)值分別為-2.24、-0.69、1.61、3.93,呈現(xiàn)單調(diào)遞增,擬合指標(biāo)均在合理范圍內(nèi)。
其三,相鄰選項(xiàng)間臨界值(thresholds)的差值應(yīng)當(dāng)在1.4~5.0的范圍內(nèi)。相鄰選項(xiàng)間臨界值指被試從一個(gè)選項(xiàng)到另一鄰近選項(xiàng)的臨界值,是衡量被試作答反應(yīng)是否與預(yù)估一致的重要指標(biāo)。以本實(shí)驗(yàn)所用的李克特四級(jí)量表為例,四級(jí)量表應(yīng)當(dāng)有3個(gè)臨界值。臨界值間差值分別為3.67、4.78,均處合理范圍。此外,量表評(píng)定尺度分析可結(jié)合評(píng)分等級(jí)結(jié)構(gòu)圖進(jìn)一步判斷。如圖2所示,各選項(xiàng)都呈現(xiàn)較為明顯的峰值,并且各選項(xiàng)間呈現(xiàn)較為均勻的間隔。因此,本測(cè)量所采用的李克特四級(jí)量表滿足了Rasch模型基本假設(shè)。
3.7公眾科學(xué)態(tài)度測(cè)量
潛在變量經(jīng)Rasch模型迭代轉(zhuǎn)化為定距數(shù)據(jù),得到公眾科學(xué)態(tài)度估計(jì)值(person measure),數(shù)據(jù)以Logits為單位。估計(jì)值數(shù)值越高,則公眾科學(xué)態(tài)度越積極,反之則越消極,此處數(shù)值正負(fù)不代表態(tài)度方向性。國(guó)際測(cè)量通常采用相關(guān)計(jì)算擴(kuò)展估計(jì)值區(qū)間,如以0~1 000 Logits區(qū)間范圍替代原始區(qū)間。如表8所示,公眾科學(xué)態(tài)度估計(jì)值在-3.70Logits至6.52Logits區(qū)間,差值為10.22Logits,呈現(xiàn)極端態(tài)度的公眾人數(shù)較少。結(jié)合圖1Rasch模型懷特圖所示,公眾對(duì)核電技術(shù)的態(tài)度整體上偏向積極,對(duì)核電技術(shù)、其社會(huì)影響、科研資助等方面較為支持。但公眾對(duì)Item1、Item9、Item11的態(tài)度偏向消極,即公眾對(duì)核電技術(shù)缺乏認(rèn)知興趣、傳播意向、參與意向。因此,未來(lái)科普領(lǐng)域相關(guān)研究可著眼于提升公眾認(rèn)知興趣、啟動(dòng)公眾傳播意向、完善公眾參與機(jī)制等方面。
4結(jié)語(yǔ)
Rasch模型已廣泛運(yùn)用于心理學(xué)、教育學(xué)、醫(yī)學(xué)等領(lǐng)域,主要用于測(cè)量如能力水平、科學(xué)素養(yǎng)、抑郁癥、態(tài)度等潛在變量。本文測(cè)量的是“公眾科學(xué)態(tài)度”這一潛在變量,在指標(biāo)體系的構(gòu)建上考量了心理學(xué)假設(shè),并以科普領(lǐng)域現(xiàn)有公民科學(xué)素質(zhì)評(píng)估、公眾調(diào)查為基礎(chǔ)形成11項(xiàng)指標(biāo)。經(jīng)檢驗(yàn),本文所涉量表符合Rasch模型各項(xiàng)假設(shè),可用于測(cè)量公眾科學(xué)態(tài)度。在未來(lái)研究中,量表指標(biāo)細(xì)化時(shí)可適應(yīng)具體研究議題變化,如轉(zhuǎn)基因、人工智能等科學(xué)議題。
Rasch模型不僅可以校正量表,也可實(shí)現(xiàn)數(shù)據(jù)類(lèi)型轉(zhuǎn)化。李克特量表產(chǎn)生的數(shù)據(jù)屬于定序數(shù)據(jù),不可進(jìn)行累加累減。通過(guò)Rasch模型的轉(zhuǎn)化,定序數(shù)據(jù)以估計(jì)值的形式輸出,此時(shí)數(shù)據(jù)為定距類(lèi)型,可進(jìn)行推論性統(tǒng)計(jì),應(yīng)用于延伸性研究。如探究影響公眾科學(xué)態(tài)度的影響因素,可將估計(jì)值與其他變量進(jìn)行相關(guān)性分析;微觀科普效果評(píng)估,考察科普對(duì)公眾認(rèn)知、態(tài)度[36]、行為產(chǎn)生的影響;公眾科學(xué)態(tài)度橫縱向比較等。
參考文獻(xiàn)
邁克爾·斯特雷文斯.知識(shí)機(jī)器:非理性如何造就近現(xiàn)代科學(xué)[M].任燁,譯.北京:中信出版社,2022:75.
庹繼光.擬態(tài)環(huán)境下的“媒介化風(fēng)險(xiǎn)”及其預(yù)防[J].新聞知識(shí),2008(2):38-40.
L·R.艾肯.態(tài)度與行為:理論、測(cè)量與研究[M].何清華,雷霖,陳浪,譯.北京:中國(guó)輕工業(yè)出版社,2008:4.
Olson J M,Zanna M P. Attitudes and Attitude Change[J]. Annual Review of Psychology,1993,44(1):117-154.
中華人民共和國(guó)科學(xué)技術(shù)部.中國(guó)科學(xué)技術(shù)指標(biāo)[M]. 北京:科學(xué)技術(shù)文獻(xiàn)出版社,2017:200.
美國(guó)國(guó)家科學(xué)理事會(huì).美國(guó)科學(xué)指標(biāo)[M].韓建國(guó),齊志英,郝致京,等譯.北京:科學(xué)出版社,1991:241-261.
U. S. National Science Board. Science and Technology:Public Attitudes,Knowledge,and Interest[EB/OL].(2020-05-15)[2023-10-07]. https://ncses.nsf.gov/pubs/nsb20207/.
U. S. National Science Board. Science and Technology:Public Perceptions,Awareness and Information Sources[EB/OL].(2022-05-04)[2023-10-07]. https://ncses.nsf.gov/pubs/nsb20227.
Miller J D. The Measurement of Civic Scientific Literacy[J]. Public Understanding of Science,1998,7(3):203-223.
Eurobarometer. European Citizens’Knowledge and Attitudes towards Science and Technology[EB/OL].(2021-09-23)[2023-10-07]. https://europa.eu/eurobarometer/surveys/detail/2237.
何薇,張超,任磊,黃樂(lè)樂(lè).中國(guó)公民的科學(xué)素質(zhì)及對(duì)科學(xué)技術(shù)的態(tài)度——2020年中國(guó)公民科學(xué)素質(zhì)抽樣調(diào)查報(bào)告[J].科普研究,2021,16(2):5-17,107.
Rahat Nabi Khan,楊京京.科學(xué)、科學(xué)家與社會(huì):公眾對(duì)科學(xué)技術(shù)的態(tài)度[J].科學(xué)對(duì)社會(huì)的影響,1989(3):38-50.
游淳惠,金兼斌.新媒體環(huán)境下科學(xué)知識(shí)對(duì)爭(zhēng)議性科技態(tài)度的影響——以轉(zhuǎn)基因?yàn)槔齕J].國(guó)際新聞界,2020,42(5):81-98.
秦川申.積極、消極和矛盾:公眾對(duì)5G基站部署的態(tài)度與鄰避傾向[J].經(jīng)濟(jì)社會(huì)體制比較,2021(6):131-144.
褚建勛,朱玉潔,張露溪,等.基于核安全認(rèn)知態(tài)度的在線調(diào)查及其對(duì)中國(guó)核科普的啟示[J].科普研究,2017,12(2):47-53.
Sturgis P,Allum N. Science in Society:Re-Evaluating the Deficit Model of Public Attitudes[J]. Public Understanding of Science,2004,13(1):55-74.
Hart P S,Nisbet E C. Boomerang Effects in Science Communication:How Motivated Reasoning and Identity Cues Amplify Opinion Polarization about Climate Mitigation Policies[J]. Communication Research,2012,39(6):701-723.
Lee C J,Scheufele D A. The Influence of Knowledge and Deference toward Scientific Authority:A Media Effects Model for Public Attitudes toward Nanotechnology[J]. Journalism amp; Mass Communication Quarterly,2006,83(4):819-834.
何光喜. 我國(guó)公眾對(duì)科學(xué)技術(shù)的態(tài)度及其影響因素研究[D]. 北京:中國(guó)社會(huì)科學(xué)院,2022.
Kallerud E,Ramberg I. The Order of Discourse in Surveys of Public Understanding of Science. Public Understanding of Science,2002,11(3):213-224.
彭紅燕,朱鑫卓,鄭念.雙三螺旋模型中公眾參與科學(xué)的機(jī)制及角色[J].自然辯證法研究,2022,38(8):54-59.
菲利普·貝爾,布魯斯·列文斯坦,安德魯·紹斯,等. 非正式環(huán)境下的科學(xué)學(xué)習(xí):人、場(chǎng)所與活動(dòng)[M].趙健,王茹,譯.北京:科學(xué)普及出版社,2014:123-157.
晏子. 心理科學(xué)領(lǐng)域內(nèi)的客觀測(cè)量——Rasch模型之特點(diǎn)及發(fā)展趨勢(shì)[J]. 心理科學(xué)進(jìn)展,2010,18(8):1298-1305.
楊慊,賀文潔,王海龍. 單參數(shù)單維度Rasch模型的優(yōu)勢(shì)與意義[J]. 心理科學(xué),2021,44(6):1491-1498.
Wright B D. Solving Measurement Problems with the Rasch Model[J]. Journal of Educational Measurement,1977,14(2):97-116.
Wright B D,Linacre J M. Reasonable Mean-Square Fit Values[J]. Rasch Measurement Transactions,1994,8(3):370.
Bond T G,F(xiàn)ox C M. Applying the Rasch Model:Fundamental Measurement in the Human Sciences(2nd ed.)[M]. Mahwah,NJ:Lawrence Erlbaum Associates Springer Cham,2007.
Linacre J M. Data Variance Explained by Rasch Measures[Z/OL]. [2023-02-27]. https://www.rasch.org/rmt/rmt201a.htm.
Linacre J M. A User’s Guide to Winsteps Ministep Rasch-Model Computer Programs:Program Manual 4.4. 6 [Z/OL]. [2023-12-27]. https://www.winsteps.com/manuals.htm.
Embretson S E,Reise S P. Item Response Theory for Psychologists[M]. Mahwah,N J:Lawrence Erlbaum Associates Publishers,2000.
Chen W H,Thissen D. Local Dependence Indexes for Item Pairs Using Item Response Theory[J]. Journal of Educational and Behavioral Statistics,1997(22):265-289.
Davidson M,Keating J L,Eyres S. A Low Back-Specific Version of the SF-36 Physical Functioning Scale[J]. Spine,2004,29(5):586-594.
Luis González-de Paz,Kostov B,Jose A López-Pina,et al. A Rasch Analysis of Patients’Opinions of Primary Health Care Professionals’Ethical Behaviour with Respect to Communication Issues[J]. Family Practice,2014,32(2):237-243.
Tyumeneva Y,Kuzmina J,Kardanova E. IRT Analysis and Validation of the Grit Scale:A Russian Investigation[J]. HSE Working Papers,2014:1-33.
Linacre J M. A User’s Guide to Winsteps Ministep Rasch-Model Computer Programs:Program Manual 5.4.1[Z/OL]. [2023-12-27]. https://www.winsteps.com/manuals.htm.
朱鑫卓.科學(xué)傳播內(nèi)容對(duì)公眾態(tài)度轉(zhuǎn)變的影響研究[D]. 武漢:中國(guó)地質(zhì)大學(xué),2023.
(編輯" 顏" " 燕" " 荊祎瀾)
基金項(xiàng)目:中國(guó)科協(xié)2024年度研究生科普能力提升項(xiàng)目(KXYJS2024003)。
作者簡(jiǎn)介:朱鑫卓,中國(guó)科學(xué)院大學(xué)人文學(xué)院博士生,研究方向:科學(xué)傳播,E-mail:zhuxinzhuo77@163.com。鄭念為通訊作者,E-mail:zhengnian515@163.com。