陳圓圓,楊春軍,王冬梅,宋穎
近幾十年來隨著全球經(jīng)濟的發(fā)展及生活方式的巨大變化,使得糖尿病患病率在世界范圍內(nèi)不斷攀升,成為繼心腦血管疾病、腫瘤之后第3大威脅人類健康的慢性非傳染性疾病。中國是世界上糖尿病患者人數(shù)最多的國家,流行病學數(shù)據(jù)表明大約11%的人口患有糖尿病,而其中很大一部分尚未確診,此外,35.7%的人群存在葡萄糖異常狀態(tài)[1]。國際糖尿病聯(lián)合會推薦糖尿病需要綜合治療,其中營養(yǎng)與飲食治療是其他治療措施的基礎,貫穿于糖尿病自然病程的任何階段[2]。隨著對飲食與營養(yǎng)的日益關注,許多學者提出了營養(yǎng)素養(yǎng)的概念,即“個人獲取和理解營養(yǎng)信息,做出正確判斷,并運用這些信息維護和促進自身及他人營養(yǎng)狀況的能力”[3-5]。有研究表明,較高的營養(yǎng)素養(yǎng)與健康飲食行為呈正相關,通過了解患者的營養(yǎng)素養(yǎng)水平,使其明確營養(yǎng)信息的重要性,也為臨床醫(yī)護人員實施針對性的營養(yǎng)教育措施提供依據(jù)[6-7]。然而,目前國內(nèi)尚無成熟的評價工具測量糖尿病患者的營養(yǎng)素養(yǎng)。2018年美國學者GIBBS等[5,8]編制了用于測量營養(yǎng)相關慢性病患者營養(yǎng)素養(yǎng)的評價工具,并在美國、西班牙營養(yǎng)相關慢性病患者中使用,具有良好的信效度。本研究旨在對英文版營養(yǎng)素養(yǎng)評價工具(Nutrition Literacy Assessment Instrument,NLit)進行漢化,并在糖尿病患者中使用,評價其信度與效度。
1.1 研究對象 2018年11月—2019年5月采用方便抽樣法選擇在天津醫(yī)科大學總醫(yī)院住院的325例糖尿病患者作為研究對象。納入標準:(1)符合1999年WHO糖尿病的診斷標準[9];(2)年齡≥18歲;(3)意識清楚,有基本的聽說讀寫能力,能自行閱讀理解或在別人幫助下理解問卷內(nèi)容;(4)知情同意,自愿參與。排除標準:(1)患有嚴重精神疾病或認知障礙;(2)妊娠期糖尿病患者。本研究經(jīng)天津醫(yī)科大學總醫(yī)院倫理委員會審核批準。
1.2 研究工具
1.2.1 一般資料調(diào)查表 使用自行設計的一般資料調(diào)查表收集患者一般資料,包括性別、年齡、文化程度、月收入水平等。
1.2.2 NLit NLit是由GIBBS等[5]研制的英文版自評量表,包括營養(yǎng)與健康(7條)、食物中的能量來源(6條)、家庭食品測量(6條)、食品標簽計算(6條)、食物分組(8條)、消費者技能(9條)6個分量表,共42個條目,均為標準選擇題形式,每個選擇題包括了題干以及3~7個備選項,正確選項賦值1分,錯誤選項賦值0分,總分為42條目得分總和,理論最高分為42分??偡帧?8分為極大可能低營養(yǎng)素養(yǎng);29~38分為中等水平的營養(yǎng)素養(yǎng);≥39分為極大可能高營養(yǎng)素養(yǎng)。該量表的專家效度及信度較好,整體信度為0.96。
1.2.3 健康素養(yǎng)-最新關鍵指標量表(Newest Vital Sign,NVS) NVS于2005年由美國學者WEISS等開發(fā),是國際通用的健康素養(yǎng)測量工具,已被美國、英國、日本、中國等許多國家驗證和使用[10-13]??梢杂脕頊y量人群健康素養(yǎng)以及營養(yǎng)素養(yǎng)中的閱讀和計算能力。漢化版的NVS內(nèi)容包括4項計算題和2項閱讀題,簡單易行,完成測評僅需3 min。量表采用2級計分方式,回答正確計1分,錯誤計0分,最高分為6分,得分0~1分為健康素養(yǎng)水平低,2~3分為臨界水平,≥4分為較高的健康素養(yǎng)水平。該量表具有良好的信效度,本研究使用該量表作為效標測量中文版營養(yǎng)素養(yǎng)評價工具(CHINLit)的效標關聯(lián)效度。
1.3 研究過程
1.3.1 量表漢化 取得原量表作者授權(quán),嚴格按照Brislin翻譯原則進行量表翻譯和修訂[14]:(1)正譯:由1名營養(yǎng)學教授和1名護理學專業(yè)碩士獨立完成量表的正向翻譯,兩者均精通雙語。(2)審核:請1名臨床護理專家和1名營養(yǎng)學專家進行獨立審核,并由研究者記錄修改意見。(3)回譯:由1名雙語護理專家和1名大學英語教師在未了解量表內(nèi)容的前提下進行量表回譯。(4)比對:有國外留學經(jīng)歷的護理專家對兩份英文譯稿進行對比分析,當語句一致率不足70%時,由翻譯小組進行翻譯和回譯步驟的循環(huán),直至達到與原量表在概念、語義、思想上等價。(5)修改:邀請1名博士學歷的內(nèi)分泌科主任對量表初稿與原量表進行對比,依據(jù)我國居民飲食習慣,對各條目內(nèi)容提出修改意見。(6)專家咨詢:為提高其嚴謹性和有效性,需對測試問卷進行專家咨詢,將測試題編制成專家咨詢問卷發(fā)放給5名工作時間10年以上,副高級及以上職稱的專家(2名護理學教授、2名營養(yǎng)學教授、1名內(nèi)分泌科主任),對量表的翻譯效度、內(nèi)容效度和跨文化調(diào)適做出評價并給予修改意見。考察內(nèi)容包括:項目與主題的關系程度、項目語言的簡明程度、項目語言的清晰度、項目與源語言的等值程度4個方面。研究者本人記錄咨詢結(jié)果,根據(jù)結(jié)果對量表進行條目篩選、修改或刪除,形成CHI-NLit初稿。
1.3.2 預試驗和正式調(diào)查 采用方便抽樣的方法抽取符合納入排除標準的30例糖尿病患者,發(fā)放CHI-Nlit初稿調(diào)查問卷。向患者解釋調(diào)查目的、注意事項,填寫完畢后當場收回,調(diào)查中詢問患者對問卷的理解程度、填表感受、記錄填表時間,存在問題和建議,結(jié)果顯示,患者能夠認真填寫問卷和理解問卷內(nèi)容,平均填寫時間約15 min。抽取在天津醫(yī)科大學總醫(yī)院住院的338例糖尿病患者進行正式調(diào)查。
1.4 資料收集 研究者本人發(fā)放問卷,確定統(tǒng)一指導語,告知本次調(diào)查目的和主要內(nèi)容,說明調(diào)查的保密性和匿名性,獲得患者同意并簽署知情同意書。問卷填寫前告知其填寫方式和注意事項,填寫完畢當場收回。本研究共發(fā)放問卷338份,剔除無效問卷13份(無效問卷為患者無法在24 h內(nèi)獨立完成問卷),回收有效問卷325份,有效問卷回收率為96.2%。符合項目反應理論(Item Response Theory,IRT)中對Rasch模型樣本量≥200的要求[15-16]。
1.5 統(tǒng)計學方法 采用SPSS 23.0軟件進行經(jīng)典測量理論(Classica Test Theory,CTT)數(shù)據(jù)分析,使用Conquest 4.5.2軟件進行Rasch模型分析。計數(shù)資料采用相對數(shù)表示,計量資料以(±s)表示;CTT數(shù)據(jù)分析的指標包括量表的信度和效度,其中量表的穩(wěn)定性采用重測信度,內(nèi)部一致性采用庫理信度(KR-21)檢驗,分量表得分與量表總分的相關性采用Pearson相關分析;效度檢驗包括內(nèi)容效度和效標關聯(lián)效度;采用IRT中的Rasch模型對數(shù)據(jù)進行信效度分析,主要包括:模型擬合度、難度、信度等。潛在特質(zhì)的單維性是進行Rasch模型分析的一個重要前提條件,即模型所處理的測驗只能包括一個潛在特質(zhì)維度[17],而量表單維性檢驗可采用Rasch模型殘差主成分分析法(PCA),以首因子標準化殘差特值作為衡量量表單維性的指標,其范圍為(1.4,2.1)[18]。通常,未加權(quán)均方擬合統(tǒng)計量(Outfit Mean Square,Outfit MNSQ)和加權(quán)均方擬合統(tǒng)計量(Infit Mean Square,Infit MNSQ)均可作為模型擬合度指標,取值范圍為(0.50,1.50)[19],越接近于1表示越擬合。T值是均方(MNSQ)兩種適配指標通過Wilson-Hilferty轉(zhuǎn)換法轉(zhuǎn)換成近似正態(tài)化的T分數(shù),當|T|<2.0時,代表條目測量的是同一個概念[19]。條目-總分相關系數(shù)(PT-measure)表示個體在某一條目上的表現(xiàn)與在整個量表中表現(xiàn)的相關性,范圍一般為(0.40,0.80)[20]。Rasch模型分析的項目信度表示項目在施測于其他樣本時,項目排序是否相同,樣本信度表示相同被試者在完成類似測驗時,個體排序是否相同,兩者取值范圍在(0,1.000),越接近于1.000表示信度越好。懷特圖是體現(xiàn)量表整體質(zhì)量的指標之一,其將被試能力與條目難度放在同一尺度中,能直接顯示出項目對于個體的適切度。通過對異常條目的擬合指數(shù)(難度值、Outfit MNSQ、T值、Infit MNSQ及PT-measure相關系數(shù)、Rasch信度)等方面進行綜合評價,以作為條目刪減與否的依據(jù)。首先對分量表進行逐一分析,其次對量表進行對比分析;間隔7 d后對30例糖尿病患者進行重測,計算其重測信度。采用KR-21對量表進行內(nèi)部一致性信度分析,其表達式為,其中K為整個量表的總題數(shù),為量表分數(shù)的平均數(shù),S2為總分的方差。
2.1 一般資料 受試者中男178例(54.8%),女147例(45.2%);年齡18~82歲,平均年齡(54.6±13.5)歲;文化程度:高中及以下173例(53.2%),大專103例(31.7%),本科及以上49例(15.1%);月收入水平:≤3 000元43例(13.2),3 001~5 000元129例(39.7%),5 001~10 000元102例(31.4%),>10 000元51例(15.7%)。
2.2 Rasch分析結(jié)果 本研究中的6個分量表是營養(yǎng)素養(yǎng)這一潛在特質(zhì)的重要組成部分,即6個分量表中包含的條目都要指向營養(yǎng)素養(yǎng)這一特質(zhì)。因此本研究首先對各分量表進行單維性檢驗,其次對量表進行Rasch模型分析。
2.2.1 單維性檢驗 分量表1~6的首成分殘差特征值分別是1.7、1.8、1.7、1.7、1.8、1.6,總量表的首成分殘差特征值是3.1。
2.2.2 數(shù)據(jù)-模型擬合 總量表的的項目信度為0.952,樣本信度為0.827,分量表的具體情況見表1。
2.2.3 懷特圖分析 條目難度分布大約為8個Logits,被試能力分布大約為6個Logits,結(jié)果詳見圖1。
2.2.4 項目分析 刪除相關條目后總量表的項目信度為0.919,樣本信度為0.838,具體刪減情況見表2。
2.3 經(jīng)典測量理論的信效度
2.3.1 內(nèi)容效度 為了使量表內(nèi)容更符合我國文化習俗及居民的飲食習慣,專家對各條目內(nèi)容進行討論修改,建議將條目1中的“黃油”修改為“動物油”,條目6中的“黑咖啡”修改為“礦泉水”,條目11中的“蛋黃醬”修改為“沙拉醬”,“人造黃油”修改為“植物油”,條目20~25中的“奶酪通心粉”修改為“蛋糕”,條目30中“豬排”修改為牛肉,為了便于受試者理解,將原量表中所涉及的重量單位“盎司”全部換算為“克”,條目34~42中所附食品彩圖全部替換為中文食品彩圖。根據(jù)內(nèi)容效度計算方法,本研究結(jié)果顯示,條目水平的內(nèi)容效度指數(shù)(Item-Level CVI,I-CVI)為0.800~1.000,量表的內(nèi)容效度指數(shù)(Scale-Level CVI,S-CVI)為0.905。
2.3.2 效標關聯(lián)效度 以NVS作為金標準,Pearsen相關分析結(jié)果顯示,CHI-Nlit評分與NVS評分呈正相關(P<0.05,見表3)。以NVS≤1分表示營養(yǎng)素養(yǎng)水平不足,繪制CHINLit預測營養(yǎng)素養(yǎng)水平的受試者工作特征(ROC)曲線,ROC曲線下面積(AUC)為0.885〔95%CI(0.846,0.924)〕,當CHI-NLit= 21.5分時,約登指數(shù)最大為0.623,此時靈敏度為0.884,特異度為0.757(見圖2)。
表1 項目擬合指數(shù)Table 1 Item fitting index
2.3.3 CHI-NLit的信度分析 分量表的重測信度為(0.895,0.931),KR-21為(0.688,0.721),總量表的重測信度為0.936,KR-21為0.860(見表4)。
本研究結(jié)合了CTT和IRT中的Rasch模型分析方法共同評價CHI-NLit的整體質(zhì)量,探究其在我國人群中的適應性,并提出修訂建議。
圖1 中文營養(yǎng)素養(yǎng)評價工具懷特圖Figure 1 The wright map of CHI-NLit
圖2 CHI-NLit預測營養(yǎng)素養(yǎng)水平的ROC曲線Figure 2 The ROC curve of the CHI-NLit to predict nutritional literacy level
表2 項目分析結(jié)果Tabel 2 The results of item analysis
表3 CHI-NLit各維度評分與NVS評分相關性Table 3 Correlation coefficients of scale and subscale scores of CHI-NLit with NVS scale score
表4 CHI-NLit的信度分析Table 4 Reliability analysis of CHI-NLit
3.1 CHI-NLit具有良好的效度 一般而言,量表I-CVI>0.78,S-CVI>0.90,表明量表內(nèi)容效度較好[21]。本研究量表的I-CVI為0.8~1.0,S-CVI為0.905,認為該量表具有較好的內(nèi)容效度。CHI-NLit的結(jié)構(gòu)效度通過Rasch模型分析的殘差主成分分析、模型擬合度分析、難度分析等來驗證,殘差主成分分析結(jié)果顯示,各分量表的首成分殘差特征值均在標準范圍內(nèi),表明各項目均在所屬分量表中,即各分量表分別測量糖尿病患者營養(yǎng)素養(yǎng)的一個方面,不存在特質(zhì)交叉??偭勘淼氖壮煞謿埐钐卣髦挡辉跇藴史秶鷥?nèi),顯示此量表并非單維量表,因此本研究支持原量表中6個維度的劃分。依據(jù)原量表條目分布進行深層分析,模型擬合分析結(jié)果表明除26條目(蘋果屬于哪一組食物)和29條目(玉米餅屬于哪一組食物)不擬合外,其余40個條目的Outfit MNSQ和Infit MNSQ指數(shù)為(0.69,1.31),說明數(shù)據(jù)與Rasch模型擬合良好。絕大部分|T|在參考范圍內(nèi),說明量表內(nèi)容能夠預測被試者的營養(yǎng)素養(yǎng)水平。除第26、29、31、32條目的PT-measure相關系數(shù)不在標準范圍內(nèi),其他條目的相關系數(shù)為(0.51,0.77),顯示條目與分量表之間有良好的相關性。繼而對量表進行難度分析,從圖1可以看出條目難度分布大約為8個Logits,被試能力分布大約為6個Logits,說明難度處于中等水平,部分條目缺乏被試與其對應,過于簡單以至于條目很難區(qū)分被試能力,如第26、31、32條目。為保證量表質(zhì)量,需對CHI-NLit量表進行項目分析,有學者認為當某些條目與模型擬合不一致時,表示該條目與其他條目不協(xié)調(diào),應將其刪除,但并不表示該條目不重要,只是在本次調(diào)查中未能有效測出所需要的潛在特質(zhì)[22]。BOND等[23]則認為不能以擬合指標作為條目刪減標準,應根據(jù)擬合度指標對異常條目進行分析。本研究通過對相關指標進行綜合評價,共刪除4個條目,形成38條目的CHI-NLit,具有良好的結(jié)構(gòu)效度。CHI-NLit與NVS相關性結(jié)果表明,CHI-NLit具有良好的效標效度,通過ROC曲線確定截斷值為21.5,顯示CHI-NLit總分<21.5分的糖尿病患者存在營養(yǎng)素養(yǎng)不足的風險,需要加強相關營養(yǎng)宣教。
3.2 CHI-NLit具有良好的信度 傳統(tǒng)測量方法中,對于二分計分方式的量表的內(nèi)部一致性信度采用KR-21信度表示,量表的穩(wěn)定性通過重測信度表達,KR-21系數(shù)在0.6以上,重測信度系數(shù)(ICC)在0.7以上,表明問卷的信度較好[24]。本研究中,總量表KR-21和重測信度分別為0.860和0.936,分量表KR-21和重測信度分別為0.688~0.721和0.895~0.931。在Rasch模型分析中,可對項目信度和樣本信度進行測量,其數(shù)值在0.6以上代表信度尚可。本研究結(jié)果顯示,總量表項目信度為0.919,樣本信度為0.838,分量表的項目信度為0.902~0.968,樣本信度為0.601~0.690??偭勘硇哦鹊陀谠勘硇哦龋ㄕw信度為0.960),但仍在接受范圍內(nèi),可能與信度指標不同有關。兩種測量方法均表明CHI-NLit具有良好的信度。
3.3 小結(jié) 通過傳統(tǒng)信效度分析和Rasch模型分析結(jié)果表明,CHI-NLit擬合度良好,信效度較好,條目難度與患者能力水平分布合理,整體質(zhì)量較好。條目內(nèi)容簡單易懂,并確定截斷值為21.5,可用于糖尿病患者的營養(yǎng)素養(yǎng)調(diào)查,為臨床快速篩查低營養(yǎng)素養(yǎng)患者并及時提供營養(yǎng)教育指導提供依據(jù)。本研究的局限性在于受條件限制,樣本均選自同一地點,量表的普適性有待進一步驗證;原量表中被試人群為營養(yǎng)相關慢性病患者(糖尿病、肥胖、高血壓等),而本研究中僅選取糖尿病患者進行驗證,因此未來研究可納入多種營養(yǎng)相關慢性病患者,增加其適用性。
作者貢獻:陳圓圓、宋穎進行文章的構(gòu)思與設計;楊春軍、王冬梅進行研究的實施與可行性分析;陳圓圓、王冬梅進行數(shù)據(jù)收集和整理;陳圓圓進行統(tǒng)計學分析,結(jié)果的分析與解釋,撰寫論文;楊春軍、宋穎進行論文的修訂;宋穎負責文章的質(zhì)量控制及審校,對文章整體負責,監(jiān)督管理。
本文無利益沖突。