李關(guān)東 鄒函怡 王藝樺 許楊 孫怡寧 馬祖長(zhǎng) 高理升
當(dāng)前,我國(guó)人口老齡化進(jìn)程顯著加劇。第七次全國(guó)人口普查數(shù)據(jù)顯示,我國(guó)60歲及以上人口有26 402萬(wàn)人,占總?cè)丝诘?8.70%,與第六次普查數(shù)據(jù)相比上升5.44%[1]。人口老齡化將增加家庭養(yǎng)老負(fù)擔(dān),并帶來(lái)基本公共服務(wù)供給的壓力。為積極應(yīng)對(duì)老齡化,2019年國(guó)務(wù)院頒發(fā)了《關(guān)于推進(jìn)養(yǎng)老服務(wù)發(fā)展的意見》,文件中明確指出,通過(guò)政府購(gòu)買服務(wù),統(tǒng)一開展老年人能力綜合評(píng)估,并將評(píng)估結(jié)果作為領(lǐng)取補(bǔ)貼、接受養(yǎng)老服務(wù)的依據(jù)[2]。因此,發(fā)展適宜在社區(qū)大規(guī)模推廣開展的老年綜合評(píng)估方法具有緊迫而重要的實(shí)際意義。
老年綜合評(píng)估(comprehensive geriatric assessment,CGA)是指采用多學(xué)科方法評(píng)估老年人的軀體情況、功能狀態(tài)、心理健康和社會(huì)環(huán)境狀況等,并據(jù)此制訂以維持及改善老年人健康和功能狀態(tài)為目的的治療計(jì)劃,最大程度地提高老年人的生活質(zhì)量[3]。目前CGA主要分為綜合評(píng)估測(cè)量和單項(xiàng)評(píng)估累計(jì)測(cè)量[4]。綜合評(píng)估工具內(nèi)容繁雜,評(píng)估耗時(shí)耗力,難以普及使用。單項(xiàng)評(píng)估工具在單一維度評(píng)估中準(zhǔn)確便捷,但累計(jì)多項(xiàng)工具評(píng)估同樣喪失其簡(jiǎn)捷性。評(píng)估過(guò)程冗長(zhǎng)繁瑣易引起老人的煩躁情緒,進(jìn)而影響評(píng)估結(jié)果的準(zhǔn)確性,難以在社區(qū)開展大面積篩查評(píng)估工作[5]。
為解決上述問(wèn)題,學(xué)者們使用多種方法對(duì)問(wèn)卷內(nèi)容進(jìn)行簡(jiǎn)化。李苗苗等[5]通過(guò)文獻(xiàn)分析和專家會(huì)議法初步設(shè)計(jì)CGA指標(biāo)體系框架和快速篩查條目,并采用Delphi專家函詢法進(jìn)一步修訂,最終構(gòu)建CGA快速篩查指標(biāo)體系,相較傳統(tǒng)綜合評(píng)估量表,問(wèn)題數(shù)明顯減少。Tai等[6]首先通過(guò)ROC曲線和約登指數(shù)確定軀體功能截?cái)嘀担偈褂弥鸩絣ogistic回歸篩選老年綜合征的危險(xiǎn)因素,最后根據(jù)分析結(jié)果從常用CGA工具中篩選題項(xiàng),最終形成簡(jiǎn)明綜合評(píng)估工具。這些研究使用專家知識(shí)或者統(tǒng)計(jì)學(xué)方法,通過(guò)直接刪減部分問(wèn)題達(dá)到了簡(jiǎn)化量表的目的。然而,刪減問(wèn)題將會(huì)影響量表的準(zhǔn)確性[7]。評(píng)估過(guò)程中準(zhǔn)確性和便捷性不可兼得的問(wèn)題難以解決。
隨著計(jì)算機(jī)技術(shù)的發(fā)展,有學(xué)者嘗試使用智能化方法輔助簡(jiǎn)化CGA流程。Daniel等[8]通過(guò)推導(dǎo)的分支規(guī)則構(gòu)建了可應(yīng)用于老年綜合評(píng)估的數(shù)據(jù)挖掘算法,但該方法僅適用于二元問(wèn)題,具有較大局限性。Mo等[7]基于提出的影響力算法構(gòu)建了快速前向問(wèn)卷模型(fast preceding questionnaire model,F(xiàn)PQM),該模型對(duì)問(wèn)卷問(wèn)題進(jìn)行預(yù)測(cè)與重排序。該方法在保證問(wèn)卷結(jié)構(gòu)完整的前提下減少了調(diào)查題項(xiàng)。但模型空間占用量巨大,不利于推廣使用;此外模型的準(zhǔn)確性仍有提升空間。
貝葉斯網(wǎng)絡(luò)是一種表示不確定性信息的概率圖模型,它一方面直觀易懂[9],方便學(xué)者交流和建模,另一方面又具備嚴(yán)格的數(shù)學(xué)證明,適合計(jì)算機(jī)處理[10],被認(rèn)為是人工智能領(lǐng)域最重要的研究成果之一。Aburai等[11]對(duì)富士商業(yè)街居民和游客的需求進(jìn)行問(wèn)卷調(diào)查,利用貝葉斯網(wǎng)絡(luò)獨(dú)特的可視化能力和概率推理能力,分析問(wèn)卷題項(xiàng)之間的因果關(guān)系,并對(duì)潛在游客進(jìn)行預(yù)測(cè)估計(jì),為構(gòu)建更有效實(shí)用的規(guī)劃建筑提供了參考依據(jù)。貝葉斯網(wǎng)絡(luò)可推理問(wèn)卷問(wèn)題的回答,基于此特性便可進(jìn)一步實(shí)現(xiàn)簡(jiǎn)化評(píng)估過(guò)程的目的。
本文利用貝葉斯網(wǎng)絡(luò)發(fā)掘問(wèn)卷題項(xiàng)間的關(guān)聯(lián),并提出一種用于CGA的問(wèn)卷調(diào)查算法,以解決評(píng)估過(guò)程中準(zhǔn)確性和便捷性不可兼得的問(wèn)題,并與前文所述的FPQM進(jìn)行比較分析,探究該方法在簡(jiǎn)化CGA中的應(yīng)用價(jià)值,為普及社區(qū)CGA工作提供一種可行的技術(shù)手段。
本研究數(shù)據(jù)來(lái)源于北京大學(xué)健康老齡與發(fā)展研究中心[12]組織的中國(guó)老年健康影響因素跟蹤調(diào)查(Chinese Longitudinal Healthy Longevity Survey,CLHLS),在全國(guó)23個(gè)省(自治區(qū)、直轄市)隨機(jī)抽取約一半的縣市,前后總共進(jìn)行了8次跟蹤調(diào)查。該調(diào)查數(shù)據(jù)質(zhì)量經(jīng)過(guò)評(píng)估得到國(guó)內(nèi)外學(xué)者普遍認(rèn)可,已成為學(xué)界公認(rèn)類似調(diào)研中數(shù)據(jù)信息十分豐富和研究潛力巨大的交叉學(xué)科研究項(xiàng)目。該調(diào)查對(duì)象為65歲及以上老人,調(diào)查內(nèi)容包括了老人生理心理健康、認(rèn)知功能、社會(huì)參與、社會(huì)經(jīng)濟(jì)狀況、生活習(xí)慣等。
本研究采用2018年橫斷面調(diào)查數(shù)據(jù),該數(shù)據(jù)包含15 874例數(shù)據(jù)。以CGA中國(guó)專家共識(shí)[3]和民政部2013年頒布的老年人能力評(píng)估標(biāo)準(zhǔn)[13]為指導(dǎo),CGA主要包含日常生活活動(dòng)能力、精神狀態(tài)、心理健康、感知覺等維度,本研究據(jù)此篩選數(shù)據(jù)集中與CGA內(nèi)容相關(guān)的49項(xiàng)題目,并對(duì)回答缺失或無(wú)效的樣本進(jìn)行剔除,最后隨機(jī)抽取其中958例數(shù)據(jù)用于構(gòu)建模型和性能測(cè)試。認(rèn)知功能題項(xiàng)中的反應(yīng)能力、計(jì)算能力、記憶力和語(yǔ)言理解中題目有順序要求,應(yīng)分別當(dāng)作整體進(jìn)行評(píng)估,因此分別對(duì)相應(yīng)題目進(jìn)行計(jì)分并作為單變量輸入,最終輸入屬性為38個(gè),詳細(xì)內(nèi)容如表1所示。
表1 問(wèn)卷題項(xiàng)內(nèi)容Table 1 Questionnaire items
本研究首先通過(guò)貝葉斯網(wǎng)絡(luò)發(fā)掘并計(jì)算問(wèn)卷題項(xiàng)之間的關(guān)系,并以此構(gòu)建問(wèn)卷模型。其中度量問(wèn)卷題項(xiàng)間的關(guān)系對(duì)應(yīng)結(jié)構(gòu)學(xué)習(xí)過(guò)程,計(jì)算屬性間關(guān)聯(lián)強(qiáng)度對(duì)應(yīng)參數(shù)學(xué)習(xí)過(guò)程。
基于評(píng)分搜索的結(jié)構(gòu)學(xué)習(xí)[14]將在所有可能存在的結(jié)構(gòu)Gn中尋找一個(gè)評(píng)分最高的結(jié)構(gòu)G*,評(píng)分函數(shù)用以度量搜索空間中每個(gè)結(jié)構(gòu)與樣本數(shù)據(jù)的擬合程度。以BIC評(píng)分函數(shù)為例,其評(píng)分函數(shù)主要基于信息論的最小描述長(zhǎng)度(minimum description length,MDL)原理實(shí)現(xiàn),該評(píng)分準(zhǔn)則將在網(wǎng)絡(luò)精度與復(fù)雜度之間尋找一個(gè)平衡點(diǎn)。
基于貝葉斯估計(jì)的參數(shù)學(xué)習(xí)[15]先將待估條件概率表參數(shù)Θ視為隨機(jī)變量,并將關(guān)于Θ的先驗(yàn)知識(shí)表示為先驗(yàn)概率分布,在觀測(cè)到前l(fā)個(gè)樣本的完整數(shù)據(jù)后,計(jì)算Θ的后驗(yàn)概率分布以及下一個(gè)樣本Dl+1的概率分布。
本研究提出一種基于貝葉斯網(wǎng)絡(luò)的問(wèn)卷調(diào)查算法,其可抽象為遍歷網(wǎng)絡(luò)結(jié)構(gòu)G,通過(guò)實(shí)際問(wèn)詢或者推理計(jì)算獲取每個(gè)屬性的取值。算法的流程如圖 1所示,主要步驟如下。
(1) 對(duì)于貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)G= (V,E),首先對(duì)V按入度從小到大進(jìn)行排序,優(yōu)先選擇從入度較小的結(jié)點(diǎn)開始遍歷。
(2) 已遍歷結(jié)點(diǎn)取值作為證據(jù)集,推理當(dāng)前訪問(wèn)結(jié)點(diǎn)的所有取值的概率P,選取其中最大值與輸入的超參數(shù)閾值σ進(jìn)行比較,如果P≥σ,則該結(jié)點(diǎn)通過(guò)推理計(jì)算預(yù)測(cè)取值,否則通過(guò)實(shí)際問(wèn)詢老人得到回答,同時(shí)將取值加入證據(jù)集。
(3) 繼續(xù)遍歷剩余結(jié)點(diǎn)并執(zhí)行步驟(2),直到所有結(jié)點(diǎn)訪問(wèn)完畢,獲得最終調(diào)查結(jié)果。
由于貝葉斯網(wǎng)絡(luò)支持多種推理類型,因此結(jié)構(gòu)G的遍歷可以選擇如下4種方式。
(1) 單向深度優(yōu)先搜索(DFS):從一個(gè)結(jié)點(diǎn)V0開始,先訪問(wèn)其中一個(gè)子結(jié)點(diǎn)V1,再?gòu)腣1開始訪問(wèn)它的子結(jié)點(diǎn),重復(fù)上述過(guò)程直到結(jié)點(diǎn)全部被訪問(wèn)。
(2) 單向廣度優(yōu)先搜索(BFS):從一個(gè)結(jié)點(diǎn)V0開始,先訪問(wèn)它所有的子結(jié)點(diǎn){Vchild},之后再依次訪問(wèn){Vchild}的子結(jié)點(diǎn),重復(fù)上述過(guò)程,直到結(jié)點(diǎn)全部被訪問(wèn)。
(3) 雙向DFS:從一個(gè)結(jié)點(diǎn)V0開始,先訪問(wèn)其中一個(gè)子結(jié)點(diǎn)或父結(jié)點(diǎn)V1,再?gòu)腣1開始訪問(wèn)它的子結(jié)點(diǎn)或父結(jié)點(diǎn),重復(fù)上述過(guò)程直到結(jié)點(diǎn)全部被訪問(wèn)。
(4) 雙向BFS:從一個(gè)結(jié)點(diǎn)V0開始,先訪問(wèn)它所有的子結(jié)點(diǎn)和父結(jié)點(diǎn){Vchild,Vparent},之后再依次訪問(wèn){Vchild,Vparent}的父子結(jié)點(diǎn),重復(fù)上述過(guò)程,直到結(jié)點(diǎn)全部被訪問(wèn)。
圖1 算法流程圖Figure 1 Flowchart of the algorithm
本算法目的為同時(shí)保證評(píng)估過(guò)程的準(zhǔn)確性和簡(jiǎn)捷性,因此評(píng)價(jià)指標(biāo)主要由準(zhǔn)確率和簡(jiǎn)化率構(gòu)成。涉及的定義如下:個(gè)體準(zhǔn)確率表示正確預(yù)測(cè)的問(wèn)題在所有預(yù)測(cè)問(wèn)題中的占比,平均準(zhǔn)確率(average accuracy rate,AAR)是數(shù)據(jù)集中所有個(gè)體準(zhǔn)確率的算術(shù)平均數(shù),評(píng)價(jià)算法整體準(zhǔn)確率。
(1)
式中:m表示測(cè)試集樣本容量;Cij為第i個(gè)個(gè)體的第j個(gè)問(wèn)題的預(yù)測(cè)正誤標(biāo)記,預(yù)測(cè)正確為1,否則為0;Iij為第i個(gè)個(gè)體的第j個(gè)問(wèn)題的預(yù)測(cè)標(biāo)記,成功預(yù)測(cè)為1,否則為0。
個(gè)體簡(jiǎn)化率表示預(yù)測(cè)的問(wèn)題在問(wèn)卷中的占比,平均簡(jiǎn)化率(average reduction rate,ARR)是數(shù)據(jù)集中所有個(gè)體簡(jiǎn)化率的算術(shù)平均數(shù),評(píng)價(jià)算法整體簡(jiǎn)化率。
(2)
式中:n表示問(wèn)卷問(wèn)題數(shù)。
AFβ綜合考慮平均準(zhǔn)確率和平均簡(jiǎn)化率兩個(gè)指標(biāo),用于評(píng)價(jià)算法的性能。
(3)
式中:β為設(shè)定參數(shù),可根據(jù)實(shí)際需要對(duì)準(zhǔn)確率和簡(jiǎn)化率的權(quán)重進(jìn)行調(diào)整。AFβ越大表示算法的性能越高。當(dāng)Iij= 0時(shí),ARR=0,AAR=1恒成立;則AFβ=0。當(dāng)Iij= 1時(shí),ARR=1恒成立;則AFβ和ARR都會(huì)很低。因此需要選取合適的Iij使AFβ最大,Iij取決于閾值σ與遍歷模式。
將抽取的958例數(shù)據(jù)按7:3的比例劃分訓(xùn)練集和測(cè)試集,其中訓(xùn)練集用于構(gòu)建貝葉斯網(wǎng)絡(luò),測(cè)試集用于評(píng)價(jià)算法性能。貝葉斯網(wǎng)絡(luò)基于Python的pgmpy庫(kù)實(shí)現(xiàn),pgmpy庫(kù)完全使用Python語(yǔ)言實(shí)現(xiàn)貝葉斯網(wǎng)絡(luò),支持多種結(jié)構(gòu)學(xué)習(xí)、參數(shù)學(xué)習(xí)和推理算法。
本實(shí)驗(yàn)在PyCharm 2021.2.1中編寫程序并運(yùn)行。試驗(yàn)硬件配置:CPU為AMD Ryzen 5 3500U @ 2.10 GHz,內(nèi)存為20.0 GB,操作系統(tǒng)為Windows 10。
本實(shí)驗(yàn)使用爬山法對(duì)貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行搜索,并通過(guò)BIC評(píng)分函數(shù)篩選最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)。采用貝葉斯估計(jì)進(jìn)行模型參數(shù)學(xué)習(xí),使用變量消元法對(duì)屬性進(jìn)行精確推理。在評(píng)價(jià)指標(biāo)中,設(shè)置AFβ的β=0.5,表示準(zhǔn)確率重要程度為簡(jiǎn)化率的2倍。調(diào)查算法中的超參數(shù)閾值σ從0.95開始以0.05為單位依次減小進(jìn)行試驗(yàn),每種閾值條件下分別進(jìn)行4次不同遍歷模式的試驗(yàn),最終選取AFβ最高的參數(shù)組合作為最優(yōu)參數(shù)。
通過(guò)訓(xùn)練集學(xué)習(xí)得到的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu),使用Netica軟件對(duì)其進(jìn)行可視化展示,由于網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,本文僅以部分結(jié)點(diǎn)為示例,如圖 2所示。每個(gè)結(jié)點(diǎn)即一個(gè)問(wèn)題,網(wǎng)絡(luò)同時(shí)存儲(chǔ)每個(gè)選項(xiàng)出現(xiàn)的概率,結(jié)點(diǎn)之間通過(guò)有向邊連接,表示存在依賴關(guān)系。調(diào)查開始時(shí),算法從上到下依次執(zhí)行搜索策略,當(dāng)任意一個(gè)問(wèn)題的回答確定后,網(wǎng)絡(luò)將及時(shí)自動(dòng)更新其他問(wèn)題選項(xiàng)的概率。在積累足夠信息后,算法便可推斷一些問(wèn)題的回答,否則繼續(xù)直接問(wèn)詢獲取回答。
在958例數(shù)據(jù)中隨機(jī)選取30%的數(shù)據(jù)即288例構(gòu)建測(cè)試集,對(duì)設(shè)計(jì)的算法進(jìn)行驗(yàn)證分析。對(duì)比輸入不同的閾值σ和遍歷模式下的評(píng)價(jià)指標(biāo),分別選取單項(xiàng)指標(biāo)最高的參數(shù)組合進(jìn)行展示,如表 2所示。結(jié)果顯示,當(dāng)閾值σ≤0.2時(shí),無(wú)論何種遍歷模式,都能獲得最高的平均簡(jiǎn)化率,可達(dá)0.92,但準(zhǔn)確性較差;當(dāng)閾值σ取最高的0.95時(shí),單雙向BFS遍歷模式都能獲得最高的平均準(zhǔn)確率,可達(dá)0.98,但簡(jiǎn)化率很低。這符合認(rèn)知,當(dāng)閾值過(guò)低時(shí),即使出現(xiàn)概率較低也會(huì)被直接預(yù)測(cè),因此大部分問(wèn)題都不會(huì)被問(wèn)詢,但這樣的預(yù)測(cè)結(jié)果并不可信;當(dāng)閾值很高時(shí),預(yù)測(cè)的問(wèn)題可信度很高,但大部分問(wèn)題都不會(huì)被預(yù)測(cè)。因此,考慮算法的綜合性能,應(yīng)該在這兩個(gè)數(shù)值之間尋找平衡,本試驗(yàn)的結(jié)果是σ= 0.7時(shí),無(wú)論何種遍歷模式,都能獲得最高的AFβ,可達(dá)0.85,此時(shí)綜合性能最佳。遍歷模式在相同閾值的條件下對(duì)試驗(yàn)結(jié)果影響不大,說(shuō)明無(wú)論模型采用何種推理方式,均能得到較一致的結(jié)果。
圖2 貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)示意圖Figure 2 Structure diagram of Bayesian network structure
表2 不同參數(shù)組合的性能Table 2 Performance of different parameter combinations
進(jìn)一步,算法性能隨閾值σ的變化如圖 3所示,平均簡(jiǎn)化率從閾值σ= 0.4開始,隨閾值σ的增加快速下降,相反,平均準(zhǔn)確率從閾值σ= 0.4開始,隨閾值σ的增加快速上升,而AFβ從σ= 0.4開始先是不斷上升,在σ= 0.7達(dá)到最高點(diǎn),之后開始下降,整體波動(dòng)幅度較小。因此,權(quán)衡準(zhǔn)確率和簡(jiǎn)化率后,σ= 0.7可作為本實(shí)驗(yàn)的最優(yōu)參數(shù)。
圖3 算法性能隨閾值σ增加的變化Figure 3 Performance with increasing threshold σ
為進(jìn)一步驗(yàn)證本研究算法的性能,將與其他算法進(jìn)行對(duì)比。調(diào)研發(fā)現(xiàn),現(xiàn)有公開報(bào)道中有關(guān)老年綜合能力評(píng)估的智能算法較少,本文采用其中較有代表性的FPQM[7]作為對(duì)比。與本研究算法類似,F(xiàn)PQM同樣需要輸入一個(gè)閾值參數(shù)σ對(duì)性能進(jìn)行調(diào)試,因此對(duì)閾值σ從0.95開始以0.05為單位依次減小進(jìn)行實(shí)驗(yàn)。各項(xiàng)指標(biāo)峰值及模型存儲(chǔ)大小對(duì)比結(jié)果如表3所示。結(jié)果表明,本研究算法在最高準(zhǔn)確率和綜合性能上明顯高于FPQM,同時(shí)在空間占用上大幅減小,在最高簡(jiǎn)化率上雖低于FPQM但差距不大。
表3 不同算法的性能比較Table 3 Performance comparison of different algorithms
本研究表明,基于貝葉斯網(wǎng)絡(luò)的老年綜合評(píng)估過(guò)程簡(jiǎn)化方法相較先前的FPQM綜合性能更好,準(zhǔn)確率更高,同時(shí)節(jié)省數(shù)萬(wàn)倍的存儲(chǔ)空間,在運(yùn)行時(shí)能更加高效地加載訓(xùn)練好的模型到內(nèi)存中,適合大面積綜合評(píng)估的應(yīng)用場(chǎng)景。
目前CGA普遍采用量表、問(wèn)卷調(diào)查的方式進(jìn)行評(píng)估[4],量表題項(xiàng)都是經(jīng)過(guò)復(fù)雜流程挑選得到的,題項(xiàng)之間既存在關(guān)聯(lián),也存在獨(dú)立的情況[16]。因此,通過(guò)刪減題項(xiàng)的方式將會(huì)降低評(píng)估的準(zhǔn)確性。量表的題項(xiàng)以單選題為主[17],少部分多選題可以通過(guò)計(jì)分方式轉(zhuǎn)化為單選題,這些題項(xiàng)均可作為離散屬性變量輸入計(jì)算機(jī)處理。通過(guò)部分問(wèn)題回答去預(yù)測(cè)其他問(wèn)題回答,屬于多維分類問(wèn)題,與傳統(tǒng)分類問(wèn)題不同,這是一個(gè)前沿課題[18]。
FPQM基于一階依賴的假設(shè),解釋了部分屬性間的真實(shí)關(guān)系。一階依賴假設(shè)過(guò)于理想,本研究考慮基于高階依賴的思想可以更完整地解釋屬性間關(guān)系,進(jìn)一步提升算法的泛化性能[19]。真實(shí)問(wèn)卷中題項(xiàng)間會(huì)呈現(xiàn)網(wǎng)狀關(guān)系,以圖結(jié)構(gòu)表示題項(xiàng)之間的關(guān)系更加貼近實(shí)際。貝葉斯網(wǎng)絡(luò)以圖為基礎(chǔ)結(jié)構(gòu)表達(dá)屬性間的關(guān)聯(lián),并通過(guò)概率計(jì)算具體量化屬性間的關(guān)聯(lián)強(qiáng)度。表 4列出了貝葉斯網(wǎng)絡(luò)與FPQM原理的比較?;谪惾~斯網(wǎng)絡(luò)的問(wèn)卷調(diào)查算法通過(guò)預(yù)測(cè)部分回答的方式在不刪減題項(xiàng)的前提下減少了問(wèn)詢問(wèn)題數(shù),達(dá)到了簡(jiǎn)化評(píng)估過(guò)程的目的。
CGA主要通過(guò)問(wèn)卷得分劃分老人能力等級(jí),因此只要最終得分在同一等級(jí)范圍內(nèi),即使該算法不能達(dá)到100%的準(zhǔn)確率,個(gè)別問(wèn)題的失真對(duì)最后分級(jí)結(jié)果的影響也在可控范圍內(nèi),因此本研究提出的算法能夠在保證結(jié)果準(zhǔn)確的同時(shí)實(shí)現(xiàn)簡(jiǎn)化評(píng)估的效果。CGA分級(jí)結(jié)果的驗(yàn)證將在后續(xù)研究中進(jìn)一步實(shí)現(xiàn)。在本研究結(jié)果中,最優(yōu)參數(shù)組合的平均簡(jiǎn)化率達(dá)0.75以上,這表示問(wèn)卷調(diào)查的工作量可以節(jié)省到原先的25%,具有顯著的簡(jiǎn)化效果。
表4 不同模型的原理比較Table 4 Comparison of principles between different models
本研究通過(guò)訓(xùn)練數(shù)據(jù)集得到的貝葉斯網(wǎng)絡(luò),提出了一種老年綜合評(píng)估過(guò)程簡(jiǎn)化方法,經(jīng)測(cè)試集驗(yàn)證該方法優(yōu)于其他類似應(yīng)用的算法。該方法同樣可應(yīng)用于任何不同的問(wèn)卷評(píng)估流程,解決調(diào)查過(guò)程中全面準(zhǔn)確和簡(jiǎn)捷不可兼得的問(wèn)題。此外,也可基于該方法設(shè)計(jì)老人自助評(píng)估流程;數(shù)據(jù)分析者也可利用該方法對(duì)缺失數(shù)據(jù)進(jìn)行補(bǔ)全。本研究后續(xù)將考慮納入個(gè)人基本信息、各項(xiàng)客觀指標(biāo)等更多元的屬性變量,并嘗試更多的建模方法對(duì)性能進(jìn)行測(cè)試,對(duì)算法綜合性能進(jìn)行進(jìn)一步優(yōu)化。同時(shí),以本算法為核心開發(fā)的智能化老年綜合評(píng)估系統(tǒng)終端設(shè)備目前正在研制過(guò)程中。
本研究針對(duì)CGA準(zhǔn)確性與便捷性不可兼得的問(wèn)題,基于貝葉斯網(wǎng)絡(luò)提出了一種老年綜合評(píng)估過(guò)程簡(jiǎn)化方法,通過(guò)測(cè)試數(shù)據(jù)集初步驗(yàn)證,平均準(zhǔn)確率為0.983 6,AFβ為0.849 9,占用空間23 kB,均明顯優(yōu)于已報(bào)道的簡(jiǎn)化算法。在當(dāng)前老齡化日益嚴(yán)峻背景下,該方法對(duì)于基層社區(qū)和養(yǎng)老機(jī)構(gòu)提升CGA工作效率具有重要應(yīng)用價(jià)值。