甄宏楠,苗 政,連 欣,胡 克,沈 晶,馬佳彬,管 慧,張福泉
中國(guó)醫(yī)學(xué)科學(xué)院 北京協(xié)和醫(yī)學(xué)院 北京協(xié)和醫(yī)院放療科,北京 100730
隨著互聯(lián)網(wǎng)的迅猛發(fā)展,越來越多的患者傾向于從網(wǎng)絡(luò)獲取醫(yī)學(xué)科普信息。調(diào)查顯示,美國(guó)約80%患者會(huì)使用網(wǎng)絡(luò)檢索醫(yī)學(xué)相關(guān)信息[1],92.6%的中國(guó)網(wǎng)民對(duì)醫(yī)學(xué)與健康方面的網(wǎng)絡(luò)信息最感興趣,中國(guó)國(guó)民從網(wǎng)絡(luò)獲取信息的比率已由2010年的22.6%上升至2015年的53.4%[2]。宮頸癌是目前中國(guó)女性惡性腫瘤發(fā)病率第6位的疾病,發(fā)病率呈逐年上升趨勢(shì)[3],該病起病隱匿、癥狀不一、診治復(fù)雜、療程較長(zhǎng),患者在診治過程中可能會(huì)從醫(yī)院外途徑了解相關(guān)疾病信息,網(wǎng)絡(luò)便捷與覆蓋廣泛的優(yōu)勢(shì)使其成為患者獲取疾病科普信息的重要渠道。然而,目前網(wǎng)絡(luò)上的醫(yī)學(xué)科普信息良莠混雜,許多患者又缺乏辨別能力,因此容易受到不良信息的誘導(dǎo)貽誤病情,甚至為臨床正規(guī)治療帶來阻力,誘發(fā)醫(yī)患矛盾。本研究調(diào)查了就診的宮頸癌患者對(duì)中文網(wǎng)絡(luò)醫(yī)學(xué)科普信息的搜索情況,評(píng)估了中文網(wǎng)絡(luò)宮頸癌科普文章的質(zhì)量和閱讀難度,以期為今后的科普文章寫作提供參考。
問卷調(diào)查采用問卷填寫的方式,以2018年4月至6月在北京協(xié)和醫(yī)院放療科就診的宮頸癌患者為研究對(duì)象,共110名患者接受調(diào)查,調(diào)查患者對(duì)宮頸癌網(wǎng)絡(luò)醫(yī)學(xué)科普信息的需求程度,具體調(diào)查內(nèi)容為:是否通過網(wǎng)絡(luò)搜索相關(guān)醫(yī)學(xué)科普信息、獲取信息的頻率、是否認(rèn)為信息可靠、傾向于獲取哪些方面的內(nèi)容、在疾病的哪個(gè)階段獲取信息。
宮頸癌科普信息檢索選擇目前市場(chǎng)占有率最高的兩大搜索引擎百度與搜狗(分別為66.7%和11.3%,合計(jì)78%,2018年4月5日統(tǒng)計(jì)結(jié)果),以“宮頸癌”為關(guān)鍵詞,2018年4月5日10時(shí)為時(shí)間點(diǎn)進(jìn)行檢索。百度共計(jì)16 100 000條檢索結(jié)果,每頁(yè)10條,取前5頁(yè)共50條,搜狗共計(jì)772 308條檢索結(jié)果,其中第1頁(yè)14條,之后每頁(yè)10條,共選取5頁(yè)54條,作為初步樣本庫(kù)。將初步樣本庫(kù)交由2位宮頸癌??漆t(yī)師進(jìn)行詳細(xì)閱讀及評(píng)估,并制定最終納入及排除標(biāo)準(zhǔn)。納入標(biāo)準(zhǔn):可以免費(fèi)登陸,登錄首頁(yè)即可獲取免費(fèi)全文。排除標(biāo)準(zhǔn):(1)內(nèi)容重復(fù)的結(jié)果;(2)醫(yī)學(xué)專業(yè)教科書及學(xué)術(shù)論文;(3)論壇貼吧等;(4)新聞報(bào)道;(5)文章字?jǐn)?shù)過少(<600字);(6)圖片等非文字為主的信息;(7)廣告。對(duì)納入到最終樣本庫(kù)的所有文章、作者屬性及網(wǎng)站建設(shè)者屬性進(jìn)行分析。其中,作者屬性分為公立醫(yī)院醫(yī)師、私立醫(yī)院醫(yī)師、患者及其他非醫(yī)學(xué)相關(guān)人員。網(wǎng)站建設(shè)者屬性分為:公立醫(yī)院醫(yī)師、私立醫(yī)院醫(yī)師、公立醫(yī)院或醫(yī)學(xué)院、私立醫(yī)院、醫(yī)學(xué)學(xué)術(shù)機(jī)構(gòu)、患者個(gè)人或患者組織、其他商業(yè)機(jī)構(gòu)等。
信息質(zhì)量評(píng)估1999年英國(guó)牛津大學(xué)健康科學(xué)研究所公共衛(wèi)生和初級(jí)醫(yī)療專業(yè)團(tuán)隊(duì)制定了Discern評(píng)分系統(tǒng),旨在評(píng)估醫(yī)學(xué)科普信息質(zhì)量,是目前業(yè)內(nèi)最常用的醫(yī)學(xué)科普信息評(píng)估系統(tǒng)之一。該系統(tǒng)是首個(gè)評(píng)價(jià)網(wǎng)絡(luò)醫(yī)學(xué)科普文章質(zhì)量的工具[4],用以評(píng)估醫(yī)學(xué)科普文章的可靠性、治療方案的信息質(zhì)量及總體評(píng)估,著重評(píng)估治療的機(jī)制、療效、風(fēng)險(xiǎn)、替代方案、拒絕治療的后果、對(duì)生活質(zhì)量的影響等治療方面的信息質(zhì)量。共分為兩大部分共16個(gè)問題,采用1~5分制:1分表示該篇科普文章完全未提及所問問題的要點(diǎn);2~4分:部分提及問題的要點(diǎn);5分:完全提及問題的要點(diǎn)。由兩位宮頸癌??漆t(yī)師分別閱讀并予以評(píng)分,取兩者平均分作為最終得分,并對(duì)兩位醫(yī)師評(píng)分的一致性進(jìn)行評(píng)估。因Discern體系側(cè)重于對(duì)科普文章可靠性和疾病治療方面的評(píng)估,對(duì)于疾病其他方面評(píng)估不夠,故同時(shí)采用核對(duì)表記錄科普信息中對(duì)于宮頸癌的定義、流行病學(xué)、病因和危險(xiǎn)因素、癥狀、分類和分型、診斷標(biāo)準(zhǔn)、并發(fā)癥、治療選擇、不良反應(yīng)、預(yù)后及就診建議等多個(gè)項(xiàng)目。
閱讀難度評(píng)估采用人教社小學(xué)、初中和高中的語(yǔ)文教材作為第1~3級(jí)中文水平參考標(biāo)準(zhǔn)語(yǔ)料庫(kù),本科和研究生畢業(yè)論文作為4~5級(jí)中文水平參考標(biāo)準(zhǔn)語(yǔ)料庫(kù),定義閱讀難度分別對(duì)應(yīng)第1~5級(jí)。根據(jù)中文語(yǔ)言學(xué)相關(guān)研究[5],參照《通用規(guī)范漢字表》、《漢語(yǔ)水平詞匯與漢字等級(jí)大綱》,通過主成分分析法,選定1~3級(jí)字占比,甲、乙、丙、丁級(jí)詞占比,平均詞長(zhǎng)等10個(gè)核心參數(shù)作為評(píng)估項(xiàng)目,通過計(jì)算機(jī)隨機(jī)選取第1~5級(jí)參考標(biāo)準(zhǔn)語(yǔ)料庫(kù)中共計(jì)769個(gè)有效數(shù)據(jù)模塊作為建模材料,利用計(jì)算機(jī)統(tǒng)計(jì)出10個(gè)參數(shù)的量化數(shù)值,使用有序回歸進(jìn)行建模。同時(shí)分析納入中文網(wǎng)絡(luò)醫(yī)學(xué)科普信息的文字,得出每個(gè)網(wǎng)頁(yè)的10項(xiàng)語(yǔ)言學(xué)評(píng)估參數(shù)結(jié)果,根據(jù)參考標(biāo)準(zhǔn)材料建模結(jié)果,判斷其閱讀難度分級(jí)。
統(tǒng)計(jì)學(xué)處理采用SPSS 22.0統(tǒng)計(jì)軟件包,計(jì)數(shù)資料以個(gè)數(shù)及百分比表示,兩位醫(yī)師Discern評(píng)分一致性的評(píng)估采用Spearman秩相關(guān)分析,兩網(wǎng)站間比較采用非參數(shù)檢驗(yàn) Kolmogorov-Smirnov檢驗(yàn),中文閱讀難度分級(jí)建模采用Cauchit回歸分析,P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
網(wǎng)絡(luò)信息搜索需求度共回收調(diào)查問卷113份,重復(fù)填寫0份,無(wú)效問卷3份,最終納入110份。其中,87.3%(96/110)受調(diào)查者曾經(jīng)在網(wǎng)絡(luò)中搜索醫(yī)療科普信息,53.6%(59/110)頻繁搜索網(wǎng)絡(luò)科普信息(每天或每周);搜索的主要內(nèi)容是疾病的病因和危險(xiǎn)因素(66.4%,73/110)、癥狀(66.4%,73/110)、治療選擇(63.6%,70/110)、治療不良反應(yīng)(61.8%,68/110)和預(yù)后(58.2%,64/110);96.4%(106/110)受調(diào)查者認(rèn)為網(wǎng)絡(luò)科普信息可靠(圖1)。
網(wǎng)絡(luò)科普信息篩選結(jié)果初步樣本庫(kù)共104條檢索結(jié)果,最終符合納入標(biāo)準(zhǔn)的檢索結(jié)果共13條。其中,百度入選9條(9/50);搜狗入選5條(5/54),因其中1條與百度重復(fù),故最終共納入13條(圖2)。104條檢索結(jié)果中,未入選91條(87.5%)中,重復(fù)內(nèi)容32條(30.8%),非文字網(wǎng)頁(yè)6條(5.8%),字?jǐn)?shù)較少(小于300)18條(17.3%),廣告7條(6.7%),新聞3條(2.9%),論壇貼吧22條(21.2%),學(xué)術(shù)論文3條(2.9%)(圖2)。所有網(wǎng)站均由商業(yè)機(jī)構(gòu)建設(shè)并管理(100%),無(wú)公益機(jī)構(gòu)(醫(yī)學(xué)院及其附屬醫(yī)院、公立或私立醫(yī)院醫(yī)生個(gè)人、醫(yī)學(xué)學(xué)術(shù)機(jī)構(gòu)),但有2篇文章出自國(guó)家衛(wèi)生健康委員會(huì)指導(dǎo)的科普網(wǎng)站。13篇入選文章中,2篇(15.4%)由公立醫(yī)院醫(yī)師撰寫;11篇(84.6%)并未交代作者屬性;6篇(46.2%)標(biāo)注網(wǎng)頁(yè)建立時(shí)間,時(shí)間跨度從2004年至2017年;2篇(23.1%)標(biāo)注了更新時(shí)間,沒有文章提及相關(guān)參考文獻(xiàn)。
信息質(zhì)量評(píng)估結(jié)果兩位專業(yè)醫(yī)師對(duì)于所有納入醫(yī)學(xué)科普信息的出版物可靠性評(píng)估(r=0.728,P<0.001)、治療相關(guān)信息的質(zhì)量評(píng)估(r=0.431,P<0.001)和綜合評(píng)分(r=0.559,P<0.001)的評(píng)估結(jié)果一致。在出版物可靠性評(píng)估中,出版物的內(nèi)容來源、信息如何產(chǎn)生、贊助方和引用細(xì)節(jié)及尚未明確部分4項(xiàng)評(píng)分平均分低于3分,以贊助方及引用細(xì)節(jié)一項(xiàng)最低;內(nèi)容切題及客觀公正2項(xiàng)為最高分。在治療相關(guān)信息的質(zhì)量評(píng)估中,各項(xiàng)得分均低于3分,其中,治療方案如何運(yùn)作和其他方案可能性2項(xiàng)得分最高,治療選擇如何影響生活質(zhì)量得分最低(表1)。
圖1納入研究的網(wǎng)站信息內(nèi)容分析
Fig1Analysis of website information content included in the study
圖2信息篩選流程
Fig2Information screening protocol
百度與搜狗信息搜索質(zhì)量的比較兩位專業(yè)醫(yī)師評(píng)選總分最高的3項(xiàng)分別位于百度搜索引擎的第7、40位和搜狗引擎的第47位。對(duì)百度及搜狗檢索出來的納入研究的文章進(jìn)行比較,結(jié)果顯示兩者在出版物可靠性評(píng)估(P=0.355)、治療相關(guān)信息的質(zhì)量評(píng)估(P=0.721)和綜合評(píng)分(P=0.622)方面差異均無(wú)統(tǒng)計(jì)學(xué)意義(表2)。
閱讀難度分析結(jié)果選取參考數(shù)據(jù)庫(kù)769個(gè)文字模塊,以平均詞長(zhǎng)、句平均字?jǐn)?shù)和句平均詞數(shù)1~3級(jí)字占比,甲、乙、丙、丁級(jí)詞占比,等10項(xiàng)常見語(yǔ)言學(xué)參數(shù)進(jìn)行建模。統(tǒng)計(jì)13篇文章的上述語(yǔ)言學(xué)參數(shù),計(jì)算文章閱讀難度分級(jí)。結(jié)果顯示,納入研究的13篇文章閱讀難度均較高,其中,研究生論文水平(5級(jí))4篇,本科論文水平(4級(jí))4篇,高中教材水平(3級(jí))0篇,高于義務(wù)教育水平(≥3級(jí))共計(jì)8篇(61.5%);義務(wù)教育水平(≤2級(jí))僅5篇(38.5%)(表3)。
廣泛的網(wǎng)絡(luò)覆蓋,便捷的網(wǎng)絡(luò)信息獲取,使我國(guó)國(guó)民從網(wǎng)絡(luò)獲取醫(yī)學(xué)信息的比率逐年上升。本研究結(jié)果顯示,87.3%受調(diào)查者曾經(jīng)在網(wǎng)絡(luò)中搜索醫(yī)療科普信息,53.6%頻繁搜索網(wǎng)絡(luò)科普信息(每天或每周);搜索的主要內(nèi)容是疾病的病因和危險(xiǎn)因素、癥狀、治療選擇、治療不良反應(yīng)和預(yù)后;96.4%受調(diào)查者認(rèn)為網(wǎng)絡(luò)科普信息可靠。這說明絕大多數(shù)受調(diào)查者會(huì)通過網(wǎng)絡(luò)搜索臨床診療信息并相信網(wǎng)絡(luò)信息的可靠性。
百度和搜狗兩大中文搜索網(wǎng)站合計(jì)市場(chǎng)占有率超過75%,是我國(guó)國(guó)民常用網(wǎng)絡(luò)檢索工具,因此本研究選擇這兩種搜索引擎進(jìn)行科普文獻(xiàn)的檢索。由于檢索文獻(xiàn)量巨大,本研究?jī)H對(duì)前5頁(yè)檢索結(jié)果進(jìn)行調(diào)查,結(jié)果顯示,納入樣本庫(kù)的104條檢索結(jié)果中,只有13條(12.5%)符合納入標(biāo)準(zhǔn),91條未入選,無(wú)效信息高達(dá)87.5%,其中多為重復(fù)信息及貼吧論壇,提示目前中文搜索引擎對(duì)高質(zhì)量醫(yī)學(xué)科普文章的檢出率較低。
1999年英國(guó)牛津大學(xué)健康科學(xué)研究所公共衛(wèi)生和初級(jí)醫(yī)療專業(yè)團(tuán)隊(duì)制定了Discern評(píng)分系統(tǒng),旨在評(píng)估醫(yī)學(xué)科普信息質(zhì)量[4],20年來該評(píng)分系統(tǒng)已被廣泛用于英文醫(yī)學(xué)科普信息評(píng)估[6- 8]。本研究采用該評(píng)分系統(tǒng)對(duì)13篇入選的中文宮頸癌科普文章進(jìn)行了評(píng)估,結(jié)果顯示兩位專業(yè)醫(yī)師對(duì)出版物可靠性、治療相關(guān)信息質(zhì)量和綜合評(píng)分評(píng)估一致,且總體評(píng)分的平均分為3分;可靠性評(píng)估中平均分小于3分的對(duì)應(yīng)問題是:出版物的內(nèi)容來源、信息如何產(chǎn)生、贊助方和引用細(xì)節(jié)以及尚未明確部分;治療信息評(píng)估中,各項(xiàng)評(píng)分的平均分均小于3分。所有最終納入研究的13篇文章均來自商業(yè)網(wǎng)站,沒有文章提及利益沖突等出版物關(guān)鍵信息;部分文章甚至沒有明確指出作者屬性;絕大部分文章未指出所述信息來源,如文獻(xiàn)出處等。僅有2篇文章提及所屬商業(yè)網(wǎng)站的科普信息由國(guó)家衛(wèi)生健康委員會(huì)等機(jī)構(gòu)指導(dǎo)文章,其中僅1篇明確指出由大型公立醫(yī)院??漆t(yī)師對(duì)文章進(jìn)行審核。大部分文章未明確指出疾病尚未明確的部分,只有極少數(shù)文章提供了更新。上述結(jié)果表明,Discern評(píng)分系統(tǒng)可被用于中文醫(yī)學(xué)科普信息評(píng)估且重復(fù)性較好,本研究納入的13篇文章總體質(zhì)量不高。
表1 網(wǎng)絡(luò)信息綜合質(zhì)量分析Table 1 Overall quality of network information
本研究中,Discern評(píng)分得分較高的文章多為百科類,此類文章通常位于檢索結(jié)果的前兩頁(yè),而其他得分較高的易讀信息并不像百科類文章易于獲得,在搜索引擎中不但排名靠后,而且不能同時(shí)被兩者檢索到。進(jìn)一步對(duì)比兩大搜索引擎檢索出并納入研究的文章后結(jié)果顯示,其Discern評(píng)分無(wú)顯著性差異,提示兩大主流中文搜索引擎檢索醫(yī)學(xué)科普信息能力相當(dāng),均未達(dá)到較高水平。
表2 百度及搜狗網(wǎng)絡(luò)信息質(zhì)量比較Table 2 Comparison of the quality of information searched by Baidu and Sogou
值得一提的是,Discern評(píng)分本身更注重于對(duì)于醫(yī)學(xué)科普文章治療方面評(píng)估,而某些科普文章撰寫的重點(diǎn)并非在宮頸癌治療方面,從而造成此類文章在Discern評(píng)分治療相關(guān)信息質(zhì)量部分得分較低,這也反映出Discern評(píng)分并不能完全評(píng)估疾病所有方面內(nèi)容。大部分納入研究的科普文章,尤其是非“百科”類科普文章,主要側(cè)重于對(duì)宮頸癌癥狀、危險(xiǎn)因素、流行病學(xué)特征等內(nèi)容的科普,而在臨床或病理分期、分型、治療不良反應(yīng)等方面的內(nèi)容則相對(duì)缺乏甚至未提及。宮頸癌因其疾病的特殊性,主要由婦科分期決定治療方案(手術(shù)為主或放療為主)。本研究納入的文章中只有少部分詳細(xì)描述了宮頸癌分期及基于不同分期的治療方案,并比較各治療方案之間的利弊,因此無(wú)法在治療選擇方面給出患者進(jìn)一步建議。此外,治療過程中并發(fā)癥發(fā)生率較高,持續(xù)時(shí)間較長(zhǎng),有的會(huì)影響患者生活質(zhì)量,這一部分內(nèi)容也急需體現(xiàn)在科普文章中。另外需要注意的是,在一部分納入文章中,甚至出現(xiàn)部分錯(cuò)誤的內(nèi)容,這些內(nèi)容應(yīng)該被及時(shí)的糾正,以免對(duì)患者產(chǎn)生誤導(dǎo)。
閱讀難度分析是本研究的另一個(gè)重點(diǎn),目前尚無(wú)成熟的中文文章閱讀難度分析評(píng)價(jià)體系,僅在對(duì)外漢語(yǔ)教學(xué)中有小規(guī)模的閱讀難度分級(jí)研究[9-10]。本研究根據(jù)漢語(yǔ)語(yǔ)言學(xué)特點(diǎn),將各級(jí)別語(yǔ)文教材及論文作為標(biāo)準(zhǔn)庫(kù),采用不同層次語(yǔ)言學(xué)參數(shù)進(jìn)行建模,并與納入研究的13篇科普文章進(jìn)行比對(duì),結(jié)果顯示,研究生論文水平(5級(jí))4篇,本科論文水平(4級(jí))4篇,高中教材水平(3級(jí))0篇,高于義務(wù)教育水平(≥3級(jí))共計(jì)8篇(61.5%);義務(wù)教育水平(≤2級(jí))僅5篇(38.5%)。說明本研究納入的科普文章大多數(shù)閱讀難度較高,可能會(huì)影響患者對(duì)文章內(nèi)容的理解。
表3 納入研究網(wǎng)頁(yè)的相關(guān)信息、Discern評(píng)分和閱讀難度分級(jí)Table 3 Information in the research webpage,Discern score and reading difficulty rating
a:所有16個(gè)評(píng)分總和的平均值;b:1級(jí)=小學(xué)教材水平,2級(jí)=初中教材水平,3級(jí)=高中教材水平,4級(jí)=全日制本科教材水平,5級(jí)=研究生論文水平
a:the average of all 16 scores;b:level 1=primary school textbook level,level 2=middle school textbook level,level 3=high school textbook level,level 4=full-time undergraduate textbook level,level 5=Graduate student level
綜上,本研究結(jié)果顯示,絕大多數(shù)受調(diào)查的宮頸癌患者會(huì)通過網(wǎng)絡(luò)搜索臨床診療信息并相信其可靠性,中文搜索引擎對(duì)高質(zhì)量醫(yī)學(xué)科普文章的檢出率較低,現(xiàn)有的高質(zhì)量醫(yī)學(xué)科普文章較少,閱讀難度較大,目前亟需臨床??漆t(yī)師撰寫更多易讀的高質(zhì)量文章進(jìn)行科普。