摘 要:針對(duì)醫(yī)務(wù)人員到達(dá)手術(shù)室時(shí)存在手術(shù)位置與手術(shù)信息不準(zhǔn)確的問(wèn)題,本文進(jìn)行了手術(shù)室人臉識(shí)別與確認(rèn)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)的研究。通過(guò)基于稀疏表達(dá)的人臉識(shí)別算法和基于Face Net的人臉識(shí)別判定,實(shí)現(xiàn)對(duì)手術(shù)室人臉的準(zhǔn)確識(shí)別。同時(shí),通過(guò)系統(tǒng)開(kāi)發(fā)工具的選擇、系統(tǒng)總體設(shè)計(jì)、數(shù)據(jù)庫(kù)以及其交互設(shè)計(jì),完成了手術(shù)室人臉確認(rèn)系統(tǒng)的功能規(guī)劃。實(shí)際應(yīng)用結(jié)果表明,新系統(tǒng)可以提高醫(yī)務(wù)人員到達(dá)手術(shù)室時(shí)手術(shù)位置與信息的準(zhǔn)確性,有利于促進(jìn)醫(yī)院智能化建設(shè)。
關(guān)鍵詞:手術(shù)室;人臉;識(shí)別;系統(tǒng)
中圖分類號(hào):TP 31 " " " " " " 文獻(xiàn)標(biāo)志碼:A
手術(shù)室是醫(yī)院最關(guān)鍵的部門之一,其安全性和效率與患者的生命健康息息相關(guān)。因此,提高手術(shù)室的安全性和效率一直是醫(yī)院管理者關(guān)注的重點(diǎn)[1]。隨著科技的進(jìn)步,人臉識(shí)別技術(shù)逐漸在醫(yī)療領(lǐng)域得到應(yīng)用,為提高手術(shù)室的安全性和效率提供了新的解決方案。
在深入研究相關(guān)領(lǐng)域后,筆者發(fā)現(xiàn)手術(shù)室人臉識(shí)別與確認(rèn)系統(tǒng)的開(kāi)發(fā)能夠顯著提升手術(shù)室的安全性。通過(guò)人臉識(shí)別技術(shù),可以確認(rèn)進(jìn)入手術(shù)室的人員身份,有效防止無(wú)關(guān)人員進(jìn)入,從而提高手術(shù)室的安全性[2]。同時(shí),在手術(shù)過(guò)程中,醫(yī)生能夠準(zhǔn)確確認(rèn)患者的身份和手術(shù)部位,從而避免醫(yī)療事故的發(fā)生。
隨著現(xiàn)代化醫(yī)院管理模式的不斷發(fā)展,智能化管理已成為趨勢(shì)。人臉識(shí)別技術(shù)的應(yīng)用可以實(shí)現(xiàn)手術(shù)室的智能化管理,提高醫(yī)院的管理效率和工作水平。因此,根據(jù)相關(guān)工作的具體需求,筆者對(duì)該系統(tǒng)進(jìn)行了設(shè)計(jì)。
1 手術(shù)室人臉識(shí)別
1.1 基于稀疏表達(dá)的人臉識(shí)別算法設(shè)計(jì)
手術(shù)室人員進(jìn)出的人臉識(shí)別基本問(wèn)題是通過(guò)使用來(lái)自k個(gè)不同類別的標(biāo)記訓(xùn)練樣本確定測(cè)試樣本的所屬類別。利用已知的訓(xùn)練樣本ni(i為所包括的樣本類別),構(gòu)建矩陣Ai,其數(shù)學(xué)表達(dá)式如公式(1)所示。
Ai=[vi,1,vi,2,...,vi,ni]∈Rm×ni " " " " " "(1)
式中:vi,1、vi,2、...、vi,ni為矩陣中的訓(xùn)練樣本;Rm×ni為訓(xùn)練樣本實(shí)數(shù)集合。
結(jié)合人臉識(shí)別理論,可以定義1個(gè)w×h的灰度圖像,并在上述矩陣行列中引入一個(gè)矢量v,v∈Rm,Rm為實(shí)數(shù)集合。在矩陣Ai中,堆疊了訓(xùn)練人臉圖像的i個(gè)主題。測(cè)試樣本則是由這些訓(xùn)練樣本的稀疏組合來(lái)表示的。為更好地了解矩陣Ai的結(jié)構(gòu),研究者們已經(jīng)提出了多種方法。其中一種簡(jiǎn)單、有效的方法是將同一類別的樣本模擬為1個(gè)線性子空間。這種方法能夠捕捉到真實(shí)數(shù)據(jù)中的大部分變化并且特別適用于人臉識(shí)別[3]。研究表明,在光照、表情等因素的影響下,人臉圖像實(shí)際上位于1個(gè)低維的子空間中,這個(gè)子空間稱為人臉子空間?;谶@個(gè)假設(shè),可以認(rèn)為訓(xùn)練樣本也位于這個(gè)子空間中。給定充足的訓(xùn)練樣本,可以構(gòu)建與i個(gè)主類相關(guān)的矩陣Ai。與i類相關(guān)的測(cè)試樣本如公式(2)所示。
y=ai,1vi,1+ai,2vi,2+…ai,nivi,ni " (2)
式中:y為在訓(xùn)練樣本線性跨度內(nèi)與i類相關(guān)的測(cè)試樣本;a為線性跨度。
當(dāng)對(duì)條目為矢量的編碼測(cè)試樣本進(jìn)行標(biāo)識(shí)時(shí),可以通過(guò)求解線性結(jié)構(gòu)y=Ax來(lái)實(shí)現(xiàn)。需要特別注意的是,使用整個(gè)訓(xùn)練集來(lái)求解x與按照特定順序求解的結(jié)果是不同的。通過(guò)整體表征,可以得到1個(gè)判別能力更強(qiáng)的分類器,它能夠更好地識(shí)別訓(xùn)練集所代表的目標(biāo),并有效地剔除訓(xùn)練集中任意類別不包括的邊界樣本[4]。這種方法在不增加計(jì)算量的前提下,實(shí)現(xiàn)了增量式的排序,其復(fù)雜度與訓(xùn)練用例集的規(guī)模呈線性關(guān)系。
為了找到y(tǒng)=Ax的最稀疏解,需要對(duì)該問(wèn)題進(jìn)行優(yōu)化,如公式(3)所示。
=argmin||x||0s.tAx=y " " (3)
式中:為優(yōu)化后的結(jié)果;Ax為標(biāo)準(zhǔn)樣本數(shù)值;‖x‖0為零范數(shù),可以對(duì)一個(gè)矢量中非零條目數(shù)進(jìn)行計(jì)算。
針對(duì)優(yōu)化后的問(wèn)題,可以通過(guò)標(biāo)準(zhǔn)的線性規(guī)劃進(jìn)行求解。當(dāng)已知解為非稀疏系數(shù)時(shí),可以采用更有效的方法來(lái)進(jìn)行求解。
1.2 基于Face Net的人臉識(shí)別判定
在完成基于稀疏表達(dá)的人臉識(shí)別算法設(shè)計(jì)后,本文結(jié)合Face Net來(lái)實(shí)現(xiàn)對(duì)人臉的識(shí)別與判定。在深度網(wǎng)絡(luò)的學(xué)習(xí)過(guò)程中,盡管并非直接通過(guò)訓(xùn)練生成嵌入,但是更深層次的特征往往更容易實(shí)現(xiàn)匹配?,F(xiàn)有的人臉識(shí)別算法通常都經(jīng)過(guò)訓(xùn)練,可以將K個(gè)人臉劃分為多個(gè)類別,并選擇1個(gè)中間層作為嵌入對(duì)其進(jìn)行分類。然而,這種方法存在不夠直接和中間層數(shù)量較多等問(wèn)題,嚴(yán)重影響了運(yùn)算和識(shí)別效率。
針對(duì)這一問(wèn)題,使用隨機(jī)梯度下降和標(biāo)準(zhǔn)(back-propagation),如果作者確認(rèn)正確,請(qǐng)給出依據(jù)。)以及自適應(yīng)梯度(AdaGard)下降算法來(lái)對(duì)卷積神經(jīng)網(wǎng)絡(luò)(CNN)進(jìn)行訓(xùn)練[5]。通常情況下,從0.05的學(xué)習(xí)率開(kāi)始,在CPU集群上進(jìn)行訓(xùn)練,訓(xùn)練時(shí)間為1 000 h~2 000 h。在這期間,當(dāng)時(shí)間為500 h時(shí),損失會(huì)逐漸減少并趨于平緩,總的來(lái)說(shuō),訓(xùn)練時(shí)間越長(zhǎng),效果越好[6]。為了在更短的訓(xùn)練時(shí)間內(nèi)獲得更理想的訓(xùn)練效果,本文建立了一個(gè)基于神經(jīng)網(wǎng)絡(luò)(GoogLeNet)風(fēng)格的初始模型。該模型中的參數(shù)量減少了700萬(wàn),部分模型在尺寸(包括深度和過(guò)濾器數(shù)量)上明顯減少。Face Net基本結(jié)構(gòu)見(jiàn)表1。
在完成訓(xùn)練后,判定多張人臉圖像是否屬于同一人的推理步驟如下。1)輸入已經(jīng)過(guò)人臉測(cè)試的人臉樣本,并將其裁剪為適當(dāng)?shù)某叽纭?)將裁剪后的人臉圖像輸入深度神經(jīng)網(wǎng)絡(luò)GoogLeNet中進(jìn)行深度學(xué)習(xí)。通過(guò)深度神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí),可以提取人臉的高級(jí)特征。3)對(duì)提取的特征進(jìn)行歸一化處理,并進(jìn)行次方操作,將結(jié)果映射到1個(gè)類球面上。4)計(jì)算3張圖片(通常是1張錨點(diǎn)圖片、1張正樣本圖片和1張負(fù)樣本圖片)的三元損失,并對(duì)其特征進(jìn)行分析,以判斷它們是否屬于同一人[7]。結(jié)合歐幾里得距離判定,如果計(jì)算出的距離越小,則說(shuō)明多個(gè)樣本屬于同一身份的可能性越大。
在訓(xùn)練的過(guò)程中,為了確保收斂速度,理想情況下會(huì)選擇特定的三元組作為訓(xùn)練機(jī)制F,如公式(4)所示。
F=argminxin||f(xia)-f(xin)||22 (4)
式中:F為三元組;xin為訓(xùn)練樣本;f(xia)為訓(xùn)練率為a時(shí)的樣本訓(xùn)練結(jié)果;f(xin)為訓(xùn)練率為n時(shí)的樣本訓(xùn)練結(jié)果。
結(jié)合上述選擇機(jī)制,重新計(jì)算圖片之間的歐幾里得距離。在整個(gè)訓(xùn)練的過(guò)程中,在線生成每個(gè)小批量的訓(xùn)練樣本,并通過(guò)從小批量中選擇正負(fù)樣例來(lái)實(shí)現(xiàn)對(duì)三元組的選擇[8]。利用上述訓(xùn)練后的算法,可以對(duì)手術(shù)室中的人臉進(jìn)行識(shí)別。
2 手術(shù)室人臉確認(rèn)系統(tǒng)的實(shí)現(xiàn)
2.1 系統(tǒng)開(kāi)發(fā)工具與總體設(shè)計(jì)
為確保開(kāi)發(fā)的系統(tǒng)在實(shí)際應(yīng)用中能夠達(dá)到預(yù)期效果,筆者將以上述設(shè)計(jì)內(nèi)容為基礎(chǔ),進(jìn)行手術(shù)室人臉確認(rèn)系統(tǒng)的開(kāi)發(fā)環(huán)境、操作與使用工具的設(shè)計(jì)分析。主要開(kāi)發(fā)工具包括TensorFlow、OpenCV(Open Source Computer Vision Library)、Python和MySQL。
在明確系統(tǒng)開(kāi)發(fā)所使用的工具后,為了充分發(fā)揮人臉識(shí)別的價(jià)值,避免手術(shù)室中存在的人員混雜等問(wèn)題,筆者進(jìn)行了確認(rèn)系統(tǒng)的總體設(shè)計(jì)(如圖1所示)。
根據(jù)系統(tǒng)投入使用的實(shí)際需求,將該系統(tǒng)劃分為3個(gè)主要模塊,分別為信息顯示模塊、人臉識(shí)別模塊以及人臉?biāo)趨^(qū)域檢測(cè)模塊?;谶@3個(gè)模塊,設(shè)計(jì)手術(shù)室人員確認(rèn)系統(tǒng)模型(如圖2所示)。
2.2 數(shù)據(jù)庫(kù)及其交互設(shè)計(jì)
在上述內(nèi)容的基礎(chǔ)上,筆者進(jìn)行了確認(rèn)系統(tǒng)中數(shù)據(jù)庫(kù)的開(kāi)發(fā)與交互設(shè)計(jì)。繪制E-R (實(shí)體 - 關(guān)系)圖是系統(tǒng)數(shù)據(jù)庫(kù)設(shè)計(jì)與開(kāi)發(fā)的前提條件。因此,筆者設(shè)計(jì)了確認(rèn)系統(tǒng)中管理員與手術(shù)室進(jìn)入人員的E-R圖(如圖3所示)。
為確保開(kāi)發(fā)的系統(tǒng)在實(shí)際應(yīng)用中能夠達(dá)到預(yù)期的交互效果,將確認(rèn)系統(tǒng)與HIS (醫(yī)院內(nèi)部信息管理)系統(tǒng)進(jìn)行了對(duì)接。通過(guò)這種方式,本文實(shí)現(xiàn)了在手術(shù)室管理過(guò)程中對(duì)人員的精準(zhǔn)識(shí)別與管理。在上述內(nèi)容的基礎(chǔ)上,筆者利用確認(rèn)系統(tǒng)中的Web Service接口技術(shù),及時(shí)獲取并更新數(shù)據(jù)庫(kù)中的數(shù)據(jù)。獲取的數(shù)據(jù)將返回服務(wù)器端,這個(gè)過(guò)程稱為數(shù)據(jù)庫(kù)中數(shù)據(jù)與系統(tǒng)的交互過(guò)程。如圖4所示。
考慮到該系統(tǒng)不需要所有醫(yī)生和患者的全部信息,因此,在交互過(guò)程中,只需要集成部分Web Service接口,即可實(shí)現(xiàn)在訪問(wèn)系統(tǒng)中對(duì)數(shù)據(jù)庫(kù)中信息的交互。
根據(jù)系統(tǒng)操作需求,當(dāng)醫(yī)護(hù)人員需要進(jìn)入手術(shù)室時(shí),安裝在門口的攝像機(jī)就會(huì)開(kāi)始拍攝。在此過(guò)程中,系統(tǒng)以5幀/s的速度從攝像機(jī)中讀取視頻,并使用HTML5視頻標(biāo)記進(jìn)行人臉讀取。該功能利用多層神經(jīng)網(wǎng)絡(luò)進(jìn)行面部區(qū)域提取,可以自動(dòng)返回選擇框中,并標(biāo)記面部關(guān)鍵點(diǎn),便于后續(xù)的面部對(duì)準(zhǔn)。人臉識(shí)別成功界面如圖5所示。
面部區(qū)域檢測(cè)是指當(dāng)醫(yī)護(hù)人員有可能戴著口罩時(shí),系統(tǒng)也能精確地選擇面部框,從而向要進(jìn)手術(shù)室的醫(yī)護(hù)人員可視化地發(fā)送面部選擇框,并提示其進(jìn)行下一步操作。
在此過(guò)程中,本文采用Face Net技術(shù),計(jì)算2幅圖像的歐幾里得距離。如果“人”“碼”一致,則門禁取消,人員可以進(jìn)入,并根據(jù)確認(rèn)的人員信息,顯示相應(yīng)的手術(shù)信息;否則,門禁將無(wú)法開(kāi)啟。
3 結(jié)語(yǔ)
人臉識(shí)別技術(shù)在醫(yī)療領(lǐng)域的應(yīng)用已經(jīng)得到了廣泛關(guān)注。國(guó)內(nèi)外研究者提出了一系列針對(duì)醫(yī)療領(lǐng)域的人臉識(shí)別方法,包括基于深度學(xué)習(xí)的人臉識(shí)別和基于特征提取的人臉識(shí)別等。然而,目前手術(shù)室人臉識(shí)別與確認(rèn)系統(tǒng)的相關(guān)研究還比較少見(jiàn)且存在一定的局限性(例如對(duì)硬件設(shè)備的要求較高且識(shí)別準(zhǔn)確率較差)。針對(duì)早期系統(tǒng)開(kāi)發(fā)存在的不足,本文進(jìn)行了此次研究。
雖然該系統(tǒng)截至目前在經(jīng)過(guò)大量測(cè)試后已經(jīng)取得了顯著成果,但是在實(shí)際應(yīng)用中仍不可避免地存在一些問(wèn)題,例如對(duì)側(cè)臉和遮擋臉的識(shí)別效果有待進(jìn)一步提高。未來(lái)的研究方向可以包括改進(jìn)面部識(shí)別算法、優(yōu)化硬件設(shè)備配置和拓展系統(tǒng)的應(yīng)用范圍等??傊?,隨著技術(shù)的不斷發(fā)展和完善,手術(shù)室人臉識(shí)別系統(tǒng)將在醫(yī)療領(lǐng)域發(fā)揮越來(lái)越重要的作用,為患者和醫(yī)院帶來(lái)更多的安全和便利。
綜上所述,本文所設(shè)計(jì)的系統(tǒng)具有一定的理論價(jià)值和實(shí)際意義,可以為提高手術(shù)室的安全性和效率提供有效的技術(shù)支持。
參考文獻(xiàn)
[1]應(yīng)悅,朱鋒杰.超高頻電子射頻識(shí)別技術(shù)在手術(shù)器械自動(dòng)清點(diǎn)中的應(yīng)用[J].醫(yī)療裝備,2022,35(20):55-57.
[2]張興靖,羅葉輝,徐云華,等.基于多模態(tài)信息識(shí)別技術(shù)管理模式在醫(yī)院手術(shù)室管理中的效果研究[J].中國(guó)醫(yī)學(xué)裝備,2023,20(6):108-111.
[3]徐嵐,鄭紹基,張應(yīng),等.基于智慧醫(yī)療支持下運(yùn)用TRM方法對(duì)手術(shù)室醫(yī)用耗材二級(jí)庫(kù)房的管理研究[J].中國(guó)醫(yī)療器械雜志,2023,47(2):220-224.
[4]應(yīng)悅,王以文,包莉.射頻識(shí)別技術(shù)在手術(shù)室外科縫線精細(xì)化管理中的應(yīng)用[J]. 醫(yī)療裝備,2022,35(24):52-55.
[5]盧振玲,楊昕宇,馬兵,等.根本原因分析法在日間手術(shù)患者身份識(shí)別流程改進(jìn)中的應(yīng)用[J].中國(guó)護(hù)理管理,2022,22(12):1866-1871.
[6]徐鑫,王從,杜立挺,等.射頻識(shí)別技術(shù)在手術(shù)室儀器設(shè)備全生命周期管理中的應(yīng)用效果分析[J].延安大學(xué)學(xué)報(bào)(醫(yī)學(xué)科學(xué)版),2022,20(1):89-92.
[7]張敏麗,徐英英,孫博.射頻識(shí)別技術(shù)在手術(shù)室智能化管理中的應(yīng)用[J].中醫(yī)藥管理雜志,2021,29(20):182-183.
[8]陳俊,林巖,王全平,等.基于二維碼識(shí)別技術(shù)在手術(shù)室儀器設(shè)備管理中的應(yīng)用[J].全科護(hù)理,2021,19(6):807-809.