王之晨,盧如意,金以勒,孫靜,馮靖祎
1. 浙江大學醫(yī)學院附屬第一醫(yī)院 醫(yī)學工程與物資部,浙江 杭州 310003;
2. 浙江大學醫(yī)學院附屬第一醫(yī)院 浙江省醫(yī)療器械臨床評價技術研究重點實驗室,浙江 杭州 310003
數(shù)字病理學是病理學領域的重要創(chuàng)新,為病理學工作模式帶來了顯著變革。近100 多年來,顯微鏡一直是病理學的主要觀察工具,然而,數(shù)字病理學通過將診斷工具從顯微鏡轉換為電子屏幕,并將圖像存儲介質從載玻片轉換為數(shù)字圖像文件,引領了病理學的新發(fā)展[1-3]。數(shù)字病理學的顯著特點是實現(xiàn)了病理圖像從載玻片到計算機屏幕的轉換,并利用數(shù)字掃描儀將病理組織切片轉換為高分辨率的數(shù)字圖像,這些數(shù)碼影像數(shù)據(jù)可以保存于本地服務器或者云端系統(tǒng)之中,并且借助于互聯(lián)網(wǎng)的高速傳輸能力,使遠程解讀與分析病理影像成為了可能,從而擴大了病理診斷的時間和空間維度[4-5]。此外,數(shù)字病理圖像的數(shù)字化媒介為機器學習和輔助診斷提供了可能性,利用計算機算法和圖像處理技術,數(shù)字病理圖像可以進行自動化分析和輔助診斷,從而為病理學家提供更便捷和更準確的工具。這種數(shù)字圖像的轉變還為后續(xù)人工智能技術的開發(fā)和應用提供了便捷的基礎[6-9]。
載玻片打號機在數(shù)字病理學中扮演著重要的角色,具有多個方面的重要性。首先,它可以在病理組織切片上打印唯一的標識碼、條碼或二維碼,以確保每個樣本都具有獨特的標識,由此,數(shù)字病理系統(tǒng)可以準確地追蹤每個樣本的信息,確保數(shù)據(jù)的一致性和可靠性[10]。其次,載玻片打號機的自動化功能可以大大提高工作效率,減少人力成本和時間投入[11]。通過使用載玻片打號機,醫(yī)院、實驗室或病理診斷中心可以加快樣本處理速度,縮短診斷等待時間,并提高工作流程的整體效率。此外,載玻片打號機能夠與數(shù)字病理系統(tǒng)相連接,將樣本標識與數(shù)字病理圖像和相關數(shù)據(jù)進行整合,方便病理學家和研究人員訪問和查看特定樣本的圖像和信息[12]。最后,載玻片打號機通過自動化的標識過程,可以減少人為因素造成的錯誤和混淆,提高數(shù)據(jù)的準確性和質量。
隨著數(shù)字病理學的迅猛發(fā)展,國內生產(chǎn)的載玻片打號機也取得了快速進步。然而,目前國內市場仍然以進口產(chǎn)品為主導。這一現(xiàn)象主要歸因于進口產(chǎn)品在市場上占據(jù)主導地位已久,用戶對其使用方式形成了較為固化的習慣。同時,由于缺乏一套客觀完善的載玻片打號機評價指標體系,無法對進口和國產(chǎn)載玻片打號機進行全方位的性能評估和臨床使用對比,也就無法給用戶提供客觀全面的選擇參考依據(jù)[13-14]。因此,本文擬研究并建立一套客觀完善的載玻片打號機評價指標體系,以便從安全性、設備技術性能、適用性、易用性及可靠性等多個方面對載玻片打號機進行客觀全面的臨床評估,明確進口和國產(chǎn)設備之間的差異[15-16]。通過評價體系的應用,可以幫助國產(chǎn)廠商準確定位設備的優(yōu)勢和不足之處,并為醫(yī)療機構的采購提供技術手段和理論基礎。
載玻片打號機評價指標體系的建立思路如圖1所示。首先,通過前期的研究和內部討論,并參考醫(yī)療設備常用的評價指標體系模型,初步形成了載玻片打號機評價指標體系。隨后,進行小范圍專家咨詢,對指標進行刪減和增補。將修改后的載玻片打號機評價指標體系設計為調查問卷,并通過自研的在線問卷系統(tǒng)進行電子化處理。接著,邀請專家通過三輪德爾菲法對各指標進行評價,并使用層次分析法計算各指標的組合權重,以反映各指標之間的相對重要程度。在每輪德爾菲法的調查問卷完成后,利用自研的問卷數(shù)據(jù)分析系統(tǒng)進行層次分析,并根據(jù)專家的反饋對評價指標體系進行修改和完善。經(jīng)過三輪德爾菲法的問卷評估后使用SPSS V29 進行問卷信度分析,最終確定載玻片打號機評價指標體系。
圖1 載玻片打號機評價指標體系建立思路流程圖
通過文獻查詢、產(chǎn)品資料分析、廠家交流等方式,收集并列舉與載玻片打號機技術性能和臨床使用相關的所有指標。通過頭腦風暴、小范圍專家咨詢和小組討論的方式對所收集指標進行篩選及分類,從而形成初步的載玻片打號機評價指標體系。該指標體系包括了兩個一級指標,分別為臨床可用性和設備技術性能,以及9 個二級指標。指標內容如表1 所示。
表1 載玻片打號機初級評價指標體系
為保證載玻片打號機評價指標體系的權威性和可靠性,本研究對參與評價的專家進行篩選,以確保專家選擇的專業(yè)程度。專家遴選的標準如下:① 從事病理領域的工作5 年及以上;② 擁有初級及以上的職稱;③ 在甲級醫(yī)院從事病理工作。三輪德爾菲法選擇的專家基本情況如表2 所示。
表2 三輪德爾菲法咨詢專家基本情況
評價主要分為指標評價和專家權威度評估兩部分,指標評價中的評價變量包括“指標重要度”和“補充或刪減指標”,其中“指標重要度”為單選項目,將指標的重要度分為5 個等級,并從小到大分別賦以1~5 分,而“補充或刪減指標”為開放項,專家根據(jù)自身經(jīng)驗以及使用感受,提出針對現(xiàn)有指標的看法及建議;在專家權威度評估中,包括“熟悉程度”和“判斷依據(jù)”兩個評價變量,其中“熟悉程度”將專家對于載玻片打號機的熟悉程度量化為5 個等級,并從小到大分別賦以0.2~1.0 分,而“判斷依據(jù)”則細化為4 個項目。分別為“實踐經(jīng)驗”“理論分析”“參考資料”以及“直觀感受”[17]。
在層次分析法中,通過專家對準則或方案進行兩兩比較并使用標度進行評分,形成相對重要性的判斷矩陣。然后,對判斷矩陣進行歸一化處理,使每列的和為1,得到歸一化的判斷矩陣。接下來,計算判斷矩陣的特征向量,即各列的平均值,用于表示每個準則或方案的權重。歸一化特征向量確保權重之和為1[18]。在評估一致性方面,首先計算一致性指標(Consistency Index,CI),公式為CI=(λmax-n)/(n-1),其中λmax為判斷矩陣的最大特征值,n為判斷矩陣的階數(shù)。隨后,根據(jù)判斷矩陣的階數(shù),參考隨機一致性指數(shù)表獲取隨機一致性指數(shù)(Random Index,RI),然后計算一致性比率(Consistency Ratio,CR),公式為CR=CI/RI,用于評估判斷矩陣的一致性。通常情況下,CR<0.1 被認為是可接受的,表示判斷矩陣具有較好的一致性。若CR ≥0.1,則意味著判斷矩陣存在較大的一致性問題,需要進行修正或重新評估[19]。
在問卷調查到截止日期后,使用自研的在線問卷系統(tǒng)的統(tǒng)計功能對回收的結果進行量化統(tǒng)計。主要計算指標包括以下幾個方面。
首先針對各指標重要度的統(tǒng)計指標,其中包括均值、差異度、滿分率、標準差以及變異系數(shù)。變異系數(shù)反映了評價專家對該指標在相對重要性上的協(xié)調程度。較小的變異系數(shù)表明評價專家對該指標的相對重要性判斷波動較小,協(xié)調程度較好。變異系數(shù)的計算公式是指標重要性評分的標準差與均值的比值。
其次是專家熟悉程度和判斷依據(jù)的統(tǒng)計指標,包括各參與專家的權威程度值和均值。專家熟悉程度和判斷依據(jù)的均值反映了評價專家對該指標的整體熟悉程度和判斷依據(jù)的一致性程度。專家權威程度的評價指標是專家權威系數(shù)(Cr),其計算公式是評價專家對評價指標的熟悉程度(Cs)與判斷依據(jù)(Ca)的算術平均值,即Cr=(Ca+Cs)/2。通常認為當Cr ≥0.7 時,具有一定的意義,反映專家在評價指標上具有較高的權威性。
問卷數(shù)據(jù)的信度分析使用SPSS V29 進行分析,主要通過計算各指標的克隆巴赫系數(shù)(Cronbach’sα系數(shù)),判斷專家可信度,系數(shù)≥0.6 時,表示專家回復具有可信度。
第一輪德爾菲法咨詢共發(fā)放調查問卷14 份,回收問卷14 份,回收率100%,其中有效問卷14 份,有效回收率100%,說明參與專家的積極度比較高?;趩柧淼慕Y果以及專家的意見,重要性評分<3.5、組合權重=0或者變異系數(shù)>0.25 的指標將會被刪除。
第一輪的反饋結果中,無指標符合刪除條件。此外,多位專家均提出增加指標的建議,其中主要涉及設備尺寸、環(huán)境安全、人員安全、耗材管理和軟件兼容等方面?;趯<曳答仯谶M行組內討論后,添加“耗材更換簡易度”“設備尺寸”“軟件兼容性”及“環(huán)境友好性”,共4 個二級指標。
第二輪德爾菲法咨詢共發(fā)放調查問卷16 份,回收問卷16 份,回收率100%,其中有效問卷16 份,有效回收率100%,說明參與的專家積極度較高。
第二輪反饋結果中,無指標符合刪除條件。此外,基于多位專家的討論,第二輪德爾菲法論證的載玻片打號機評價指標體系存在涉及范圍不全面、現(xiàn)有指標不夠細化等問題,因此經(jīng)過組內討論及專家咨詢后,形成了較為完善的載玻片打號機評價指標體系。該指標體系從安全性、設備技術性能、適用性、易用性和可靠性等幾個方面,多角度地評估了載玻片打號機的臨床價值、安全屬性及經(jīng)濟價值。指標體系共有5 個一級指標,25 個二級指標,指標內容如表3 所示。
表3 第三輪咨詢載玻片打號機評價指標體系
第三輪德爾菲法咨詢共發(fā)放調查問卷15 份,回收問卷15 份,回收率100%,其中有效問卷15 份,有效回收率100%,并且反饋專家權威程度均值Cr=0.93>0.7,且信度分析各指標的Cronbach’sα系數(shù)均>0.6(表4),說明專家參與度高,回復可信度高,并且對于載玻片打號機的評價指標有較高的權威度。第三輪回收數(shù)據(jù)使用層級分析法進行指標權重計算,結果如表5 所示。
表4 第三輪問卷信度分析結果
表5 載玻片打號機評價指標體系統(tǒng)計結果
本輪反饋結果顯示沒有符合刪除條件的指標。所有指標的重要度除“附帶掃描功能”外,均數(shù)均>4.00,同時,除“觸摸操作屏”和“附帶掃描功能”兩個指標外,其余指標的變異系數(shù)均≤0.20,說明專家對指標的相對重要性判斷波動較小,協(xié)調程度較好。在使用層次分析法進行指標權重計算后,進行指標的一致性判斷,各判斷矩陣的一致性比率CR 分別為0.005、0.022、0.035、0.004、0.007 和0.050 均<0.10,說明各指標之間存在一致性。本輪反饋中,專家均對指標體系有較好的反饋,同時高均數(shù)、低變異指數(shù)以及指標一致性均說明了現(xiàn)階段的載玻片打號機評價指標體系已較為完善。因此,經(jīng)過三輪德爾菲法咨詢后,最終建立了載玻片打號機評價指標體系。
本研究采納德爾菲法作為專家咨詢的手段,并輔以層次分析法來決定各評價指標的權重,從而構建了一套完善的載玻片打號機評價指標體系。在三輪專家咨詢過程中,所有參與的專家均展現(xiàn)出了高度的參與意愿及專業(yè)權威,確保了研究結果的可靠性與權威性。
為了對載玻片打號機進行全面評估,本研究從安全性、設備技術性能、適用性、易用性和可靠性多個維度進行了深入探討。這種多維度的評估方法明顯超越了目前主流的僅針對主要性能指標的評估模式[20]。它能夠更為深入地對載玻片打號機在技術性能、使用體驗、安全防護以及維護維修等方面進行翔實評價,進而為相關領域的研究和應用提供更為科學和細致的參考依據(jù)。
本次研究中,一級指標權重最高的為“安全性”以及“設備技術性能”,其次為“適用性”“易用性”以及“可靠性”,說明臨床使用中病理醫(yī)生更關注設備的安全屬性以及使用性能。在二級指標中,權重占比最高的分別為“故障率”“環(huán)境友好性”“兼容功能”“載玻片卡頓恢復便利性”以及“卡頓發(fā)生率”,這與臨床使用中病理醫(yī)生重點關注的點相貼合,說明本研究所建立的評價指標體系比較符合臨床使用場景,能很好地貼合臨床需求。
本文所建立的載玻片打號機評價指標體系是一個通過專家討論咨詢以及文獻調查獲得的相對量化的體系,在實際使用之前仍需要針對每一項指標建立符合實際情況的評分標準,然后通過邀請病理醫(yī)生、生產(chǎn)廠家及臨床工程師根據(jù)評價指標以及評分標準對不同類型的載玻片打號機進行評價、綜合分析,以評判產(chǎn)品優(yōu)劣。
此外,隨著數(shù)字病理學的快速發(fā)展,對載玻片打號機技術性能的需求也會逐步提升,因此隨著載玻片打號機設備的不斷進步,本文中所建立的評價指標體系也需要隨之修改以適應技術的發(fā)展。
本文所建立的載玻片打號機評級指標體系涉及5 個一級指標,25 個二級指標,涵蓋了病理醫(yī)生、生產(chǎn)廠家及臨床工程師所關注的安全性、設備技術性能、適用性、易用性和可靠性5 個方面,可以相對定量的進行客觀的設備評價,明確進口和國產(chǎn)設備之間的差異,幫助國產(chǎn)廠商準確定位設備的優(yōu)勢和不足之處,并為醫(yī)療機構的采購提供技術手段和理論基礎。