冉琳,黃灝飛,李澍
1. 重慶大學(xué) 生物醫(yī)學(xué)工程系,重慶 400044;2. 中國(guó)食品藥品檢定研究院 醫(yī)療器械檢定所,北京 102629
隨著移動(dòng)互聯(lián)網(wǎng)及人工智能的飛速發(fā)展,人類開(kāi)啟了數(shù)字化新時(shí)代,與此同時(shí),醫(yī)學(xué)模式也從經(jīng)驗(yàn)醫(yī)學(xué)、實(shí)驗(yàn)醫(yī)學(xué)逐步進(jìn)入了現(xiàn)代醫(yī)學(xué)時(shí)代[1]。為了解決物理治療、藥物治療等傳統(tǒng)治療方式本身存在的局限,移動(dòng)網(wǎng)絡(luò)技術(shù)與循證醫(yī)學(xué)原理進(jìn)行結(jié)合形成了數(shù)字療法(Digital Therapeutics,DTx)。數(shù)字療法不僅擁有成本低、醫(yī)生耗時(shí)少的優(yōu)勢(shì),還可使用戶自行管理個(gè)人護(hù)理和個(gè)人健康信息。數(shù)字療法遵循的循證醫(yī)學(xué)原理包括認(rèn)知行為療法、生物反饋療法、運(yùn)動(dòng)療法等,其中,認(rèn)知行為療法是數(shù)字療法用到的最頻繁的循證醫(yī)學(xué)方法之一。目前,DTx 產(chǎn)品已廣泛應(yīng)用于各種疾病,如糖尿病、腫瘤治療管理、精神類疾病等[2]。但是,DTx 作為一款新型醫(yī)療技術(shù)產(chǎn)品,與常規(guī)醫(yī)療器械產(chǎn)品的最大區(qū)別在于用戶不同。常規(guī)醫(yī)療器械的用戶更多是醫(yī)生、護(hù)士等專業(yè)人員,而DTx 的用戶是患者本身??捎眯宰鳛镈Tx 評(píng)估的一個(gè)關(guān)鍵指標(biāo),可保證患者安全有效地使用DTx。醫(yī)療器械的可用性評(píng)估方法有很多種,如訪談法、直接觀察法、量表調(diào)查法等,其中量表調(diào)查法不僅能夠?qū)τ脩粽鎸?shí)的使用感受進(jìn)行挖掘,還能以量化的方式輸出數(shù)據(jù)結(jié)果,是常用的可用性測(cè)試方法之一。
基于以上背景,本文對(duì)可用于DTx 的可用性量表展開(kāi)研究,經(jīng)過(guò)資料調(diào)研及篩選分類,最終選取了14 個(gè)可用性量表,并對(duì)量表進(jìn)行討論分析。本文對(duì)量表的基本信息、關(guān)鍵特征以及評(píng)價(jià)維度進(jìn)行研究,從不同角度對(duì)量表進(jìn)行分析,厘清每個(gè)量表的評(píng)估側(cè)重點(diǎn),分析量表的評(píng)價(jià)維度,同時(shí)建立一個(gè)適用于DTx 的可用性評(píng)價(jià)指標(biāo)體系,并選出針對(duì)性最強(qiáng)的可用性量表。
業(yè)內(nèi)最受認(rèn)可的DTx 定義來(lái)自國(guó)際數(shù)字療法聯(lián)盟:數(shù)字療法依靠高質(zhì)量軟件為患者提供基于循證醫(yī)學(xué)的干預(yù)措施,實(shí)現(xiàn)預(yù)防、管理或治療疾病及其癥狀[3]。DTx是一種干預(yù)手段、措施或服務(wù),與藥物療法、物理療法等其他療法存在取代、輔助、補(bǔ)充的關(guān)系。與普通數(shù)字醫(yī)療軟件不同的是,DTx 可直接針對(duì)患者或疾病進(jìn)行干預(yù),所有的DTx 產(chǎn)品均需經(jīng)過(guò)臨床確認(rèn)及監(jiān)管機(jī)構(gòu)評(píng)估認(rèn)證。
DTx 作為一個(gè)還未發(fā)展成熟的醫(yī)療器械產(chǎn)品,不論從產(chǎn)業(yè)上還是監(jiān)管上,依然存在著許多問(wèn)題。從產(chǎn)業(yè)上來(lái)說(shuō),DTx 的臨床療效科學(xué)依據(jù)不足,因此尚未被臨床專家認(rèn)可;另一方面,公眾對(duì)于DTx 產(chǎn)品的認(rèn)知度不夠,導(dǎo)致對(duì)DTx 產(chǎn)品的接受度及依從性低。從監(jiān)管角度來(lái)看,目前國(guó)內(nèi)外還未頒布專門針對(duì)DTx 評(píng)價(jià)的法規(guī)政策,DTx 產(chǎn)品審批依然遵循著現(xiàn)有政策。但是DTx 作為一種特殊的醫(yī)療產(chǎn)品,其本身的創(chuàng)新特性與現(xiàn)有的醫(yī)療軟件評(píng)價(jià)方法及思路不符,導(dǎo)致監(jiān)管部門無(wú)法合理高效地對(duì)DTx 產(chǎn)品進(jìn)行質(zhì)控和溯源。具體來(lái)說(shuō),DTx 的創(chuàng)新特性之一就是與用戶之間的大規(guī)模交互,且這些人機(jī)交互具有實(shí)時(shí)性,需要用戶有很高的依從性。因此,為保證用戶能夠正確使用DTx 產(chǎn)品,降低使用錯(cuò)誤帶來(lái)的風(fēng)險(xiǎn),DTx 產(chǎn)品的可用性評(píng)估研究必不可少。
可用性并沒(méi)有一個(gè)完全一致的定義,不同學(xué)者及標(biāo)準(zhǔn)對(duì)可用性都有著不同的理解。Shackel[4]認(rèn)為可用性是“被人類輕松有效地使用的能力”,并提出了5 個(gè)可用性評(píng)價(jià)維度:有效性、易學(xué)性、保留性、錯(cuò)誤和態(tài)度。Nielsen[5]提出的可用性定義應(yīng)用最為廣泛,他認(rèn)為可用性評(píng)價(jià)主要在于效率、易學(xué)性、記憶性、錯(cuò)誤/安全性和滿意度5 個(gè)維度。行業(yè)標(biāo)準(zhǔn)[6]中指出,可用性是指具有有效性、效率、用戶易學(xué)和用戶滿意的用戶接口特性。
目前,醫(yī)療器械的可用性評(píng)價(jià)主要分為主觀評(píng)價(jià)和客觀評(píng)價(jià)。主觀評(píng)價(jià)主要包括量表調(diào)查法、觀察法等;客觀評(píng)價(jià)主要有客觀績(jī)效法、眼動(dòng)指標(biāo)評(píng)價(jià)法等。在對(duì)產(chǎn)品進(jìn)行可用性測(cè)試時(shí),可通過(guò)用戶在產(chǎn)品使用過(guò)程中對(duì)產(chǎn)品整體的易用性、易學(xué)性等指標(biāo)的主觀感受以及用戶個(gè)人的滿意度來(lái)對(duì)產(chǎn)品的可用性進(jìn)行評(píng)價(jià)。量表調(diào)查法就是通過(guò)讓用戶填寫(xiě)特定可用性評(píng)價(jià)量表的方式對(duì)用戶在產(chǎn)品使用過(guò)程中的主觀感受以及滿意度進(jìn)行量化評(píng)價(jià),不同的可用性量表評(píng)價(jià)的方面可能存在差異。量表調(diào)查法相較于觀察法和用戶口述感受的方法,具有更高的準(zhǔn)確性和可靠性,可幫助和引導(dǎo)用戶對(duì)產(chǎn)品可用性進(jìn)行全方位的打分評(píng)價(jià),是可用性評(píng)價(jià)中應(yīng)用非常廣泛的方式。
隨著對(duì)可用性評(píng)估的深入研究,可用于醫(yī)療器械評(píng)估的可用性量表數(shù)量逐漸增多,但不一定適用于DTx,如針對(duì)網(wǎng)頁(yè)可用性評(píng)估的網(wǎng)頁(yè)評(píng)估問(wèn)卷(WEQ)[7]。本文選取了14 個(gè)可用于DTx 可用性評(píng)估的量表并進(jìn)行簡(jiǎn)要總結(jié),分別為:用戶界面滿意度調(diào)查問(wèn)卷(Questionnaire for User Interface Satisfaction,QUIS)[8]、技術(shù)接受模型(Technology Acceptance Model,TAM)[9]、場(chǎng)景后問(wèn)卷(After Scenario Questionnaire,ASQ)[10]、研究后系統(tǒng)可用性問(wèn)卷(Post-Study System Usability Questionnaire,PSSUQ)[11]、軟件可用性測(cè)試問(wèn)卷(Software Usability Measurement Inventory,SUMI)[12]、計(jì)算機(jī)系統(tǒng)可用性問(wèn)卷(Computer System Usability Questionnaire,CSUQ)[13]、系統(tǒng)可用性量表(System Usability Scale,SUS)[14]、ISO 指標(biāo)(IsoMetrics)[15]、手機(jī)可用性問(wèn)卷(Mobile Phone Usability Questionnaire,MPUQ)[16]、用戶體驗(yàn)可用性指標(biāo)(Usability Metric for User Experience,UMUX)[17]、備用可用性(Alternate Usability,AltUsability)[18]、手機(jī)應(yīng)用評(píng)定量表(Mobile APP Rating Scale,MARS)[19]、用戶移動(dòng)應(yīng)用評(píng)定量表(User Mobile APP Rating Scale,uMARS)[20]、移動(dòng)健康應(yīng)用可用性問(wèn)卷(mHealth APP Usability Questionnaire,MAUQ)[21]。需要注意的是,CSUQ 是PSSUQ 的修改版,uMARS 是MARS 的修改版。
表1 列舉了可用于DTx 的可用性量表的關(guān)鍵特征,分別是條目數(shù)量、分類、信度[克朗巴哈系數(shù)(Cronbach’sα)]、條目類型,并根據(jù)各量表Cronbach’sα系數(shù)進(jìn)行了排序。其中,IsoMetrics 的條目數(shù)量最多,達(dá)到了75 個(gè),條目數(shù)量最少的為ASQ 量表,僅包含3 個(gè)條目。在14 個(gè)量表中,條目數(shù)量≥50 個(gè)的量表有3 個(gè)(IsoMetrics、MPUQ 和SUMI,占比約21%),條目數(shù)量≤10 個(gè)的量表有4 個(gè)(SUS、AltUsability、UMUX、ASQ,占比約29%),條目數(shù)量為10~50個(gè)的量表數(shù)量最多,共7 個(gè)(QUIS、MARS、MAUQ、uMARS、PSSUQ、CSUQ 及TAM,占比約50%)。條目數(shù)量不同意味著用戶填寫(xiě)量表所需的時(shí)間不同,評(píng)估的深淺程度也不同,條目數(shù)量多的量表可以從多個(gè)方面更加詳細(xì)地進(jìn)行可用性評(píng)估,但所花費(fèi)的時(shí)間也相應(yīng)增加;條目數(shù)量少的量表可以更加快速、輕便地進(jìn)行可用性評(píng)估,用戶的配合程度更高,但評(píng)價(jià)的維度也會(huì)相應(yīng)減少。因此,在選取量表對(duì)DTx 進(jìn)行可用性評(píng)估時(shí),應(yīng)該根據(jù)項(xiàng)目自身情況及需求合理選擇。
表1 可用性評(píng)估量表關(guān)鍵特征
量表的信度分析即可靠性分析,用來(lái)評(píng)價(jià)測(cè)量量表能否穩(wěn)定地對(duì)所測(cè)的對(duì)象進(jìn)行評(píng)估測(cè)量。用于量表信度分析的方法有多種,如重測(cè)信度、內(nèi)部一致性信度、復(fù)本信度等[22]。其中,內(nèi)部一致性信度是最常用的量表信度分析方法,此方法中提出的Cronbach’sα是目前最常用的信度系數(shù)。Cronbach’sα是一個(gè)用于評(píng)價(jià)量表信度的統(tǒng)計(jì)量,系數(shù)值通常為0~1,越接近0 表示量表可靠性越低,越接近1 表示量表可靠性越高。一般認(rèn)為Cronbach’sα值不超過(guò)0.6 時(shí),量表的內(nèi)部一致信度不足;達(dá)到0.7~0.8 時(shí),表示量表具有相當(dāng)?shù)男哦?;超過(guò)0.8表示量表的信度非常好。因此,量表的最低Cronbach’sα接受度為0.7[23]。
Cronbach’sα的計(jì)算方式如公式(1)所示。
式中,K為量表的題目數(shù);為第i個(gè)題目得分(測(cè)量值)的方差,為量表總得分的方差。
在量表可靠性方面,14 份量表中,Cronbach’sα系數(shù)為0.80~0.89 的有MAUQ、IsoMetrics 共2 個(gè)量表(占比約14%),說(shuō)明MAUQ、IsoMetrics 量表信度非常好;其余12個(gè)量表的Cronbach’sα系數(shù)均為0.90~0.99(占比約86%),說(shuō)明這12 個(gè)可用性量表?yè)碛袠O為可靠的信度。
按照量表不同類型進(jìn)行整理分類是量表研究中的關(guān)鍵任務(wù)。Yang 等[24]根據(jù)評(píng)估系統(tǒng)的類型,將調(diào)查問(wèn)卷分為3 種類型:通用可用性問(wèn)卷、網(wǎng)站可用性問(wèn)卷、移動(dòng)應(yīng)用程序可用性問(wèn)卷。由于DTx 大多以移動(dòng)應(yīng)用程序的形式存在,不涉及網(wǎng)頁(yè),因此本文涉及的可用性量表研究不涉及針對(duì)網(wǎng)站評(píng)估的問(wèn)卷。從表1 可以看出,在14 份可用性量表中,10 個(gè)量表為通用類型,可以用于評(píng)估所有類型的界面(如手機(jī)APP 界面、PC 端界面等),4 個(gè)量表只支持針對(duì)移動(dòng)應(yīng)用程序的可用性評(píng)估。
可用性量表的條目類型有很多種,如語(yǔ)義差別量表[25]、李克特量表[26]、二分量表等,其中李克特量表應(yīng)用最為廣泛。李克特量表由多個(gè)與量表主題內(nèi)容相關(guān)的問(wèn)題或判斷句組成,其評(píng)分范圍從認(rèn)可的極端態(tài)度到否定的極端態(tài)度,如“非常同意”到“非常不同意”。李克特量表的尺度形式有多種,常見(jiàn)的是5 級(jí)量表和7 級(jí)量表,即一個(gè)問(wèn)題有5 個(gè)或7 個(gè)答項(xiàng),評(píng)分為1~5 或1~7。在本研究中的14 個(gè)可用性量表中,11 個(gè)量表(占比約79%)為李克特量表,2 個(gè)(占比約14%)為語(yǔ)義差別量表,1 個(gè)(占比約7%)為二分量表。在11 個(gè)李克特量表中,4 個(gè)量表為5 級(jí)李克特量表,7 個(gè)量表為7 級(jí)李克特量表;2 個(gè)語(yǔ)義差別量表分別為7 級(jí)和10 級(jí);1 個(gè)二分量表為3 級(jí)二分量表。
對(duì)14 個(gè)量表的評(píng)價(jià)維度進(jìn)行整理,將評(píng)價(jià)維度分為與用戶相關(guān)的維度和與產(chǎn)品相關(guān)的維度2 個(gè)方面,見(jiàn)表2。
表2 可用性量表評(píng)價(jià)維度
由表2 可得,在與用戶相關(guān)的維度中,“易于學(xué)習(xí)/易學(xué)性”(QUIS、SUMI、SUS、MPUQ)、“易于使用/易用性”(TAM、SUS、MPUQ、MAUQ)、“滿意度”(UMUX、MARS、uMARS、MAUQ)出現(xiàn)在了4 個(gè)量表中。在與產(chǎn)品相關(guān)的維度中,“信息質(zhì)量”(QUIS、PSSUQ、CSUQ、MARS、uMARS)出現(xiàn)在了5 個(gè)量表中,“系統(tǒng)有用性”(TAM、PSSUQ、CSUQ、MAUQ)、“可控性”(SUMI、IsoMetrics、MPUQ、AltUsability)、“效率”(SUMI、MPUQ、UMUX、AltUsability)出現(xiàn)在了4 個(gè)量表中。
為了能夠在14 個(gè)量表中篩選出更加適合DTx 可用性評(píng)估的量表,結(jié)合前文所述的量表關(guān)鍵特征以及評(píng)價(jià)維度,能夠更好地應(yīng)用于DTx 的量表需具備以下條件:量表的條目數(shù)量適中、Cronbach’sα系數(shù)盡可能高、最好針對(duì)移動(dòng)應(yīng)用程序設(shè)計(jì)、評(píng)價(jià)維度盡可能全面。將4 個(gè)評(píng)價(jià)條件表征為0~1 的數(shù)值,數(shù)值越接近1 表示越好,對(duì)14 個(gè)量表作雷達(dá)圖如圖1 所示。其中,Cronbach’sα系數(shù)取原數(shù)值,通用型量表取0.8,針對(duì)移動(dòng)應(yīng)用程序的量表取1。量表?xiàng)l目數(shù)量表征計(jì)算方式如公式(2)所示。
圖1 量表評(píng)價(jià)雷達(dá)圖
式中,為平均值;max 為最大值。
評(píng)價(jià)維度表征的計(jì)算方式如公式(3)所示。
式中,x1為評(píng)價(jià)用戶方面維度的個(gè)數(shù);x2為評(píng)價(jià)產(chǎn)品方面維度的個(gè)數(shù)。
為了更加量化地評(píng)價(jià)各量表,取信度和評(píng)價(jià)維度權(quán)重為0.3,條目數(shù)量和分類權(quán)重為0.2,計(jì)算各量表評(píng)價(jià)總得分,得分越高的量表表示更適用于DTx 的可用性評(píng)價(jià),評(píng)價(jià)得分?jǐn)?shù)據(jù)如表3 所示。量表評(píng)分得分前3 位的是MAUQ、MARS 及uMARS,由此得出這3 個(gè)量表更適用于DTx 的可用性評(píng)價(jià)。
通過(guò)對(duì)14 個(gè)DTx 可用性量表的總結(jié)研究可知,除去4 個(gè)YY/T 1474-2016[6]定義的傳統(tǒng)醫(yī)療器械的可用性評(píng)價(jià)維度“易于學(xué)習(xí)/易學(xué)性”“滿意度”“有效性”“效率”之外,用戶方面的“易于使用/易用性”、產(chǎn)品方面的“系統(tǒng)有用性”“信息質(zhì)量”“可控性”4 個(gè)維度出現(xiàn)的頻率也很高。其中,“易于使用/易用性”是可用性評(píng)價(jià)中的一個(gè)重要指標(biāo),指用戶在使用產(chǎn)品時(shí)認(rèn)為該產(chǎn)品是否易于使用,ANSI AAMI HE74[27]中就指出可用性包括“易于使用”?!跋到y(tǒng)有用性”指整個(gè)系統(tǒng)是否具有實(shí)際的功能和價(jià)值,是側(cè)面反應(yīng)“有效性”的指標(biāo)。DTx 作為一類數(shù)字化軟件產(chǎn)品,其“信息質(zhì)量”的評(píng)估也非常重要,信息需準(zhǔn)確、可信、全面?!翱煽匦浴笔侵赣脩艨赏ㄟ^(guò)控制輸入來(lái)將系統(tǒng)的輸出調(diào)整到想要的結(jié)果,對(duì)于用戶來(lái)說(shuō),整個(gè)系統(tǒng)是可靠的。因此,在對(duì)DTx 進(jìn)行可用性評(píng)價(jià)時(shí),須重點(diǎn)考慮這4 個(gè)維度。
有不少學(xué)者和機(jī)構(gòu)提出過(guò)與可用性相關(guān)的模型,如FBS、UPCARE、GOMS 等。FBS 模型是關(guān)于產(chǎn)品可用性設(shè)計(jì)的“功能-行為-結(jié)構(gòu)”方法論,“功能”是產(chǎn)品設(shè)計(jì)中滿足用戶需求的核心,“行為”是用戶為實(shí)現(xiàn)產(chǎn)品功能與產(chǎn)品間進(jìn)行的交互,“結(jié)構(gòu)”是產(chǎn)品設(shè)計(jì)的成果[28]。UPCARE 模型是一種用于可用性和風(fēng)險(xiǎn)分析的模型,主要包括6 個(gè)維度:需求、感知、認(rèn)知、操作行為、結(jié)果、評(píng)價(jià)[29]?;谌藱C(jī)交互領(lǐng)域,將人機(jī)互動(dòng)過(guò)程描述為目標(biāo)、操作、方法和選擇規(guī)則4 個(gè)部分[30]。GOMS模型是一種用于人機(jī)交互領(lǐng)域的建模工具,主要用來(lái)分析用戶在執(zhí)行任務(wù)時(shí)的認(rèn)知過(guò)程。其中,“目標(biāo)”指用戶在使用系統(tǒng)時(shí)試圖達(dá)到的目標(biāo);“操作符”指用戶可以執(zhí)行的最基本動(dòng)作,如點(diǎn)擊、拖拽或輸入文本;“方法”指完成目標(biāo)的具體步驟,是一系列操作符的組合;“選擇規(guī)則”指當(dāng)有多種方法可以達(dá)到同一目標(biāo)時(shí),用來(lái)決定使用哪一種方法的規(guī)則。FBS 更注重產(chǎn)品創(chuàng)新設(shè)計(jì)過(guò)程中的可用性,偏向于工業(yè)產(chǎn)品;UPCARE 評(píng)價(jià)對(duì)象為常規(guī)醫(yī)療器械;GOMS 聚焦于人機(jī)交互,未涉及產(chǎn)品本身的評(píng)價(jià)。為更好地對(duì)DTx 產(chǎn)品進(jìn)行可用性評(píng)價(jià),本文結(jié)合FBS、UPCARE、GOMS 3 個(gè)可用性模型及可用性量表指標(biāo)建立DTx 可用性評(píng)價(jià)指標(biāo)體系。
整個(gè)指標(biāo)體系將DTx 可用性評(píng)價(jià)劃分為了3 個(gè)橫向及2 個(gè)縱向共計(jì)6 個(gè)部分,橫向包括需求、操作、結(jié)果3 個(gè)方向,縱向包括用戶和產(chǎn)品2 個(gè)方向,形成了感知/認(rèn)知、功能、行為、性能、態(tài)度、評(píng)價(jià)6 個(gè)部分,6 個(gè)部分又分別包含對(duì)應(yīng)的具體評(píng)價(jià)指標(biāo)。3 個(gè)橫向指標(biāo)中,需求包括用戶的感知/認(rèn)知(生理/心理)需求和對(duì)產(chǎn)品的功能需求;操作是指用戶為完成需求所執(zhí)行的行為動(dòng)作以及產(chǎn)品在用戶行為過(guò)程中表現(xiàn)出的性能;結(jié)果代表用戶對(duì)行為結(jié)果的態(tài)度及對(duì)產(chǎn)品功能結(jié)果的評(píng)價(jià)。此評(píng)價(jià)指標(biāo)體系涵蓋了用戶使用DTx 產(chǎn)品從第一步感知/認(rèn)知到使用結(jié)束階段評(píng)價(jià)的整個(gè)全生命周期。進(jìn)行DTx產(chǎn)品的可用性評(píng)價(jià)時(shí),可根據(jù)此指標(biāo)體系對(duì)產(chǎn)品的可用性進(jìn)行全面評(píng)估。
通過(guò)對(duì)各量表表征得分進(jìn)行分析,最終選定MAUQ、MARS 和uMARS 3 個(gè)量表作為應(yīng)用于DTx 軟件產(chǎn)品的可用性評(píng)估的最優(yōu)解。MAUQ 量表是一款專門針對(duì)移動(dòng)健康應(yīng)用可用性評(píng)估的量表。MARS 量表主要針對(duì)醫(yī)生、護(hù)士、研究人員等醫(yī)藥衛(wèi)生行業(yè)從業(yè)者,問(wèn)題中的專業(yè)術(shù)語(yǔ)較多。由于MARS 量表專業(yè)性較強(qiáng),普通人使用難度較高,為了解決這一痛點(diǎn),MARS 量表的用戶版本——uMARS 量表被設(shè)計(jì)了出來(lái)。uMARS 中使用的句式及名詞等相較于MARS 更簡(jiǎn)單直觀,非專業(yè)人員也能讀懂。陳潔紅等[31]將uMARS 量表應(yīng)用于運(yùn)動(dòng)健身APP 的功能、質(zhì)量以及可用性的評(píng)價(jià)上,認(rèn)為uMARS 量表能夠較好地反映運(yùn)動(dòng)健身APP 的整體質(zhì)量水平和個(gè)體差異。
3 款量表雖都能作為DTx 軟件可用性評(píng)估的有力工具,但三者也存在區(qū)別。在評(píng)估內(nèi)容上,MAUQ 更側(cè)重人機(jī)交互過(guò)程中用戶對(duì)于產(chǎn)品的使用感受,而MARS 和uMARS 不僅包括用戶的主觀使用感受,也包含了用戶對(duì)產(chǎn)品系統(tǒng)性、功能性的評(píng)價(jià)。在面對(duì)對(duì)象上,MARS主要面向有一定知識(shí)儲(chǔ)備的醫(yī)生、護(hù)士等專業(yè)人員,而uMARS 和MAUQ 較為簡(jiǎn)單直觀,專業(yè)人員和非專業(yè)人員都可使用。在量表可靠性上,MARS 和uMARS量表的Cronbach’sα系數(shù)一致,為0.92,MAUQ 的Cronbach’sα系數(shù)較前兩者較低,為0.80。在實(shí)際進(jìn)行DTx 可用性評(píng)估量表選取時(shí),可根據(jù)評(píng)估內(nèi)容、面向人群、可靠性要求進(jìn)行選擇。
DTx 作為順應(yīng)移動(dòng)設(shè)備及互聯(lián)網(wǎng)技術(shù)而產(chǎn)生的新型醫(yī)療產(chǎn)品產(chǎn)物,在預(yù)防、治療、干預(yù)慢性病、精神類疾病等方面擁有廣闊的應(yīng)用前景及市場(chǎng)潛力??捎眯宰鳛镈Tx 評(píng)估時(shí)需要考慮的一大要素,對(duì)可用性測(cè)試量表的研究必不可少。本文首先介紹了DTx 的定義與發(fā)展現(xiàn)狀,并提出了與監(jiān)管評(píng)估相關(guān)的問(wèn)題,對(duì)能夠針對(duì)DTx 評(píng)估的可用性量表進(jìn)行了總結(jié)研究。本研究一共列舉了出14 個(gè)可用性量表,分別對(duì)各個(gè)量表的關(guān)鍵特征及評(píng)價(jià)維度進(jìn)行了分析,研究討論了在DTx 可用性評(píng)價(jià)中應(yīng)重點(diǎn)關(guān)注的評(píng)價(jià)維度,并根據(jù)各量表的關(guān)鍵特征對(duì)量表進(jìn)行了打分。最后,結(jié)合現(xiàn)有的可用性模型以及量表應(yīng)用研究,建立了DTx 可用性評(píng)價(jià)指標(biāo)體系,選擇MAUQ、MARS 和uMARS 3 個(gè)量表作為更適合DTx 軟件產(chǎn)品的可用性量表,并且對(duì)3 個(gè)量表的不同之處進(jìn)行了討論。