岳紫蕊
摘 要 為了弄清醫(yī)療費(fèi)用的影響因素有哪些,本文以現(xiàn)存的醫(yī)療保險(xiǎn)公司數(shù)據(jù)資源為依托,進(jìn)行數(shù)據(jù)整合并加以利用,從而更加清楚地了解醫(yī)療成本的影響因素,為醫(yī)療保險(xiǎn)公司如何構(gòu)建其醫(yī)療保險(xiǎn)產(chǎn)品作出更有價(jià)值的判斷,分析醫(yī)療保險(xiǎn)公司是選擇向所有申請(qǐng)人提供保險(xiǎn),還是成為一家只向少數(shù)人提供保險(xiǎn)的精品保險(xiǎn)公司。本文應(yīng)用數(shù)據(jù)分析的方法從大量保險(xiǎn)行業(yè)數(shù)據(jù)中較為科學(xué)地取得有價(jià)值的信息,使用SPSS(Statistical Product and Service Solutions,即“統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案”軟件)對(duì)一家醫(yī)療保險(xiǎn)公司進(jìn)行數(shù)據(jù)分析,找出醫(yī)療成本影響因素。
關(guān)鍵詞 醫(yī)療費(fèi)用 影響因素 描述統(tǒng)計(jì)分析 假設(shè)檢驗(yàn)分析
一、問(wèn)題提出
隨著我國(guó)整體經(jīng)濟(jì)的飛速發(fā)展,人們的生活質(zhì)量得到了很大程度的改善,人們的目標(biāo)從原本的解決溫飽轉(zhuǎn)變?yōu)楝F(xiàn)在的追求更加綠色、健康、有保障的高質(zhì)量生活,除了經(jīng)濟(jì)條件的改善更多的是源于人們觀念上的轉(zhuǎn)變。在著名的馬斯洛需求層次理論中,我國(guó)已經(jīng)超越了追求生理需求的階段,大部分國(guó)民開(kāi)始追求安全層次需要,即人身安全、健康方面。當(dāng)人們醫(yī)療費(fèi)用過(guò)于高昂時(shí),人們往往會(huì)尋求醫(yī)療保險(xiǎn)公司來(lái)為自己承擔(dān)風(fēng)險(xiǎn),所以很多人都會(huì)選擇購(gòu)買保險(xiǎn)。而醫(yī)療保險(xiǎn)公司要怎樣構(gòu)建自己的醫(yī)療產(chǎn)品,是向所有申請(qǐng)人提供保險(xiǎn)還是成為一家只向少數(shù)人提供精品保險(xiǎn)的保險(xiǎn)公司?這個(gè)問(wèn)題值得我們思考。
在這個(gè)時(shí)候,對(duì)保險(xiǎn)公司來(lái)說(shuō),哪些因素會(huì)影響醫(yī)療費(fèi)用賬單就顯得至關(guān)重要,本文就依托保險(xiǎn)公司的數(shù)據(jù),進(jìn)行影響醫(yī)療費(fèi)用賬單的因素分析。
二、數(shù)據(jù)的收集
本文想要分析醫(yī)療費(fèi)用的影響因素,從而幫助醫(yī)療保險(xiǎn)公司構(gòu)建其產(chǎn)品。因?yàn)閭€(gè)人醫(yī)療費(fèi)用賬單和相關(guān)信息為個(gè)人隱私,國(guó)家相關(guān)的統(tǒng)計(jì)網(wǎng)站無(wú)法獲得,所以本文從美國(guó)某醫(yī)療保險(xiǎn)公司獲取數(shù)據(jù),原始數(shù)據(jù)從GitHub上獲得。
三、數(shù)據(jù)的預(yù)處理
(一)數(shù)據(jù)審核
拿到數(shù)據(jù)之后,對(duì)數(shù)據(jù)進(jìn)行了審核,檢查數(shù)據(jù)中是否有錯(cuò)誤。
(二)數(shù)據(jù)篩選
在檢查了數(shù)據(jù)之后,對(duì)數(shù)據(jù)進(jìn)行了挑選,挑選了幾個(gè)可能會(huì)影響醫(yī)療費(fèi)用的因素。
(三)數(shù)據(jù)整理與排序
挑選完變量之后,將相關(guān)數(shù)據(jù)導(dǎo)入SPSS并排序,因?yàn)橐獙?duì)數(shù)據(jù)進(jìn)行處理,所以要在SPSS軟件中對(duì)變量進(jìn)行重新命名便于更好地分析,命名結(jié)果如下:1.年齡:主要受益人的年齡;2.性別:女性1,男性0;3.標(biāo)準(zhǔn)體重:體重指數(shù),理想的體重指數(shù)是18.5~25;4.兒童:健康保險(xiǎn)覆蓋的兒童數(shù)量;5.糖尿病:如果是糖尿病患者則為1,否則為0;6.地區(qū):美國(guó)境內(nèi)居民的居住地,東北(1)、西北(2)、東南(3)、西南(4);7.費(fèi)用:如果健康保險(xiǎn)收取的個(gè)人醫(yī)療費(fèi)用很高則為1,否則為0。
四、數(shù)據(jù)分析
(一)頻數(shù)分析
通過(guò)對(duì)頻數(shù)的分析可以了解變量的取值情況。此次主要利用數(shù)據(jù)表分析性別、地區(qū)、糖尿病、健康保險(xiǎn)覆蓋的兒童數(shù)量、費(fèi)用這5個(gè)變量的分布特點(diǎn)。
1.性別。此次調(diào)查數(shù)據(jù)顯示男女的比例差距不大,男性為49.5%,女性為50.5%,女性略多于男性。
2.地區(qū)。此次調(diào)查數(shù)據(jù)顯示,分為來(lái)自東北、西北、東南、西南4個(gè)地區(qū),地區(qū)間的差距也不明顯,東南地區(qū)略多于其他3個(gè)地區(qū)。
3.糖尿病。由所取數(shù)據(jù)得知,未患糖尿病占79.5%,患糖尿病占20.5%,未患糖尿病的比例遠(yuǎn)高于患糖尿病。
4.兒童數(shù)量。由所取數(shù)據(jù)得知,健康保險(xiǎn)覆蓋的兒童數(shù)量為0的最多,健康保險(xiǎn)覆蓋的兒童數(shù)量為5的最少。
5.醫(yī)療費(fèi)用。由所取數(shù)據(jù)得知,醫(yī)療費(fèi)用不高占14.8%,醫(yī)療費(fèi)用很高占85.2%。保險(xiǎn)費(fèi)用整體較高。
(二)描述統(tǒng)計(jì)分析
在通過(guò)簡(jiǎn)單的頻數(shù)統(tǒng)計(jì)分析了解了性別、地區(qū)、糖尿病、健康保險(xiǎn)覆蓋的兒童數(shù)量的總體、費(fèi)用分布狀況后,我們還需要對(duì)數(shù)據(jù)中的BMI(身體質(zhì)量指數(shù))、健康保險(xiǎn)覆蓋的兒童數(shù)量、地區(qū)、年齡這4個(gè)變量的特征有更為精確的認(rèn)識(shí)。
1. BMI。如表1所示,BMI均值為30.663,超過(guò)了理想的體重指數(shù)(18.5~25)的范圍;標(biāo)準(zhǔn)差不大,說(shuō)明離散程度小,數(shù)據(jù)的代表性好;SK=0.284>0,表明BMI的分布為右偏分布,但偏斜程度不大;K=﹣0.51,表明BMI扁平分布更分散。
2.健康保險(xiǎn)覆蓋的兒童數(shù)量。如表2所示,健康保險(xiǎn)覆蓋的兒童數(shù)量的標(biāo)準(zhǔn)差不大,說(shuō)明離散程度小,數(shù)據(jù)的代表性好;SK=0.938>0,表明健康保險(xiǎn)覆蓋的兒童數(shù)量的分布為右偏分布,但偏斜程度不大;K=0.202,表明健康保險(xiǎn)覆蓋的兒童數(shù)量的分布尖峰分布更集中。
3.地區(qū)分布。如表3所示,地區(qū)分布的標(biāo)準(zhǔn)差不大,說(shuō)明離散程度小,數(shù)據(jù)的代表性好;SK=﹣0.38<0,表明地區(qū)分布為左偏分布,但偏斜程度不大;K=﹣1.328,表明地區(qū)分布扁平分布更分散。
4.年齡分布。如表4所示,年齡均值為42.21,標(biāo)準(zhǔn)差不大,說(shuō)明離散程度小,數(shù)據(jù)的代表性好;SK=0.056>0,表明年齡的分布為右偏分布,但偏斜程度不大;K=﹣1.245,表明年齡分布為扁平分布更分散。
(三)假設(shè)檢驗(yàn)分析
1.糖尿病因素。經(jīng)過(guò)初步統(tǒng)計(jì),根據(jù)SPSS所得圖表來(lái)看,我們所關(guān)心的是在這些變量中哪些變量在作出決定時(shí)最重要,于是可以假設(shè):
H0:糖尿病不會(huì)影響醫(yī)療費(fèi)用成本
H1:糖尿病會(huì)影響醫(yī)療費(fèi)用成本
根據(jù)SPSS分析數(shù)據(jù)可得,P值=0<α=0.05,拒絕H0,說(shuō)明糖尿病會(huì)對(duì)醫(yī)療成本造成影響。
2.年齡因素。當(dāng)未患糖尿病時(shí),我們假設(shè):
H0:當(dāng)年齡≤47時(shí)對(duì)費(fèi)用沒(méi)有顯著性差異
H1:當(dāng)年齡>47時(shí)對(duì)費(fèi)用有顯著性差異
如表5所示,根據(jù)SPSS分析數(shù)據(jù)可得,P值=0<α=0.05,拒絕H0,說(shuō)明當(dāng)年齡>47時(shí)對(duì)費(fèi)用有顯著性差異,年齡>47時(shí)影響醫(yī)療費(fèi)用因素。
當(dāng)患糖尿病時(shí),我們假設(shè):
H0:當(dāng)BMI≥30.360對(duì)費(fèi)用沒(méi)有顯著性差異
H1:當(dāng)BMI<30.360對(duì)費(fèi)用有顯著性差異
如表6所示,根據(jù)SPSS分析數(shù)據(jù)可得,P值=0<α=0.05,拒絕H0,說(shuō)明當(dāng)BMI≥30.360時(shí)對(duì)費(fèi)用有顯著性差異。
3.性別因素。當(dāng)我們想研究性別與費(fèi)用之間的關(guān)系時(shí),可以假設(shè):
H0:性別對(duì)費(fèi)用沒(méi)有顯著性差異
H1:性別對(duì)費(fèi)用有顯著性差異
如表7所示,根據(jù)SPSS分析數(shù)據(jù)可得,P值=0.06>α=0.05,不拒絕H0,說(shuō)明方差相等。根據(jù)SPSS分析數(shù)據(jù)可得,P值=0.06>α=0.05,不拒絕H0,說(shuō)明性別對(duì)費(fèi)用沒(méi)有顯著性差異。
4.兒童數(shù)量因素。當(dāng)我們想研究?jī)和瘮?shù)量與費(fèi)用之間的關(guān)系時(shí),可以假設(shè):
H0:兒童數(shù)量對(duì)費(fèi)用沒(méi)有顯著性差異
H1:兒童數(shù)量對(duì)費(fèi)用有顯著性差異
如表8所示,根據(jù)SPSS分析數(shù)據(jù)可得,P值=0.218>α=0.05,不拒絕H0,說(shuō)明兒童數(shù)量對(duì)費(fèi)用沒(méi)有顯著性差異。
5.地區(qū)分布因素。當(dāng)我們想研究地區(qū)與費(fèi)用之間的關(guān)系時(shí),可以假設(shè):
H0:地區(qū)對(duì)費(fèi)用沒(méi)有顯著性差異
H1:地區(qū)對(duì)費(fèi)用有顯著性差異
如表9所示,根據(jù)SPSS分析數(shù)據(jù)可得,P值=0.011<α=0.05,拒絕H0,說(shuō)明地區(qū)對(duì)費(fèi)用有顯著性差異。
五、得出結(jié)論
由上述分析可知,導(dǎo)致較高保險(xiǎn)成本的主要因素有糖尿病、年齡≥47、BMI≥30.360、健康保險(xiǎn)覆蓋的兒童數(shù)量。所以對(duì)保險(xiǎn)公司來(lái)說(shuō),從上文的數(shù)據(jù)分析可以看出來(lái),保險(xiǎn)公司可以利用數(shù)據(jù)分析來(lái)對(duì)自己的產(chǎn)品進(jìn)行設(shè)計(jì),讓自己的產(chǎn)品帶來(lái)的利益更高,而且可以向少數(shù)的特定人群來(lái)進(jìn)行產(chǎn)品銷售。
保險(xiǎn)公司可用數(shù)據(jù)分析技術(shù),對(duì)現(xiàn)有的投保人信息進(jìn)行分析,得到購(gòu)買保險(xiǎn)的客戶特征,做到精確定位,對(duì)客戶對(duì)象更有針對(duì)性地進(jìn)行銷售,不僅可以節(jié)省時(shí)間,而且能夠在一定程度上提高效益,預(yù)測(cè)客戶需求,定制個(gè)性化方案。由于現(xiàn)在市面上的保險(xiǎn)企業(yè)眾多,如何長(zhǎng)久地在保險(xiǎn)行業(yè)立足,靠的就是企業(yè)自身的能力與客戶的口碑,所以為了給客戶提供更好的體驗(yàn),建立穩(wěn)定的客戶群體,預(yù)測(cè)客戶的需求,定制其個(gè)性化選擇方案,使用大數(shù)據(jù)分析技術(shù)就可以分析出什么特征的人群對(duì)哪些險(xiǎn)種的需求量較大,從而對(duì)客戶進(jìn)行更加準(zhǔn)確的種類推薦。
(作者單位為四川大學(xué)錦城學(xué)院金融學(xué)8班)
參考文獻(xiàn)
[1] 陳祺琦.大數(shù)據(jù)分析在保險(xiǎn)行業(yè)中的應(yīng)用[J].電子世界,2020(10):36-38.