潘安
【摘要】 隨著大數(shù)據(jù)技術(shù)的發(fā)展,大數(shù)據(jù)技術(shù)正在廣泛的應(yīng)用于各行各業(yè)。隨著國(guó)家相關(guān)政策的出臺(tái)以及人民生活水平的提高,健康險(xiǎn)的發(fā)展面臨著巨大的前景。健康險(xiǎn)和大數(shù)據(jù)的結(jié)合能夠在健康險(xiǎn)中數(shù)據(jù)的收集、處理、分析和應(yīng)用起到巨大的作用。大數(shù)據(jù)技術(shù)在健康險(xiǎn)的應(yīng)用能夠促進(jìn)健康險(xiǎn)的發(fā)展,使得健康險(xiǎn)能夠更好的服務(wù)人民。
【關(guān)鍵詞】 大數(shù)據(jù) 健康險(xiǎn) 收集 處理 分析 應(yīng)用
當(dāng)今信息技術(shù)的快速發(fā)展帶動(dòng)了各行各業(yè)的發(fā)展,催生了物聯(lián)網(wǎng)、互聯(lián)網(wǎng)、電子商務(wù)等新興產(chǎn)業(yè)的發(fā)展。各行各業(yè)的業(yè)務(wù)帶來的數(shù)據(jù)正在以幾何級(jí)的形式爆發(fā),傳統(tǒng)的數(shù)據(jù)收集、存儲(chǔ)、分析和應(yīng)用技術(shù)已經(jīng)不能滿足要求,這點(diǎn)在互聯(lián)網(wǎng)行業(yè)尤為突出?;ヂ?lián)網(wǎng)行業(yè)面臨著海量的數(shù)據(jù)資源、快速的數(shù)據(jù)增長(zhǎng),現(xiàn)有的大數(shù)據(jù)技術(shù)已經(jīng)在互聯(lián)網(wǎng)企業(yè)得到了探索和應(yīng)用。
隨著新醫(yī)改的推出以及人民群眾的實(shí)際需求,健康險(xiǎn)得到了迅猛的發(fā)展[1]。但是,健康險(xiǎn)在發(fā)展過程中面臨著海量的數(shù)據(jù)資源,如何收集、處理、分析和應(yīng)用這些數(shù)據(jù)資源更好的服務(wù)健康險(xiǎn)成為亟待解決的問題。
一、當(dāng)前現(xiàn)狀
傳統(tǒng)健康險(xiǎn)當(dāng)前得到了迅猛的發(fā)展,但是當(dāng)前健康險(xiǎn)面臨兩大問題:大部分健康險(xiǎn)業(yè)務(wù)處在虧損狀態(tài)和健康險(xiǎn)不能滿足用戶的要求。從健康險(xiǎn)公司的角度,當(dāng)前需要利用大數(shù)據(jù)技術(shù)[2]對(duì)醫(yī)療數(shù)據(jù)等數(shù)據(jù)進(jìn)行分析降低醫(yī)療風(fēng)險(xiǎn)和經(jīng)營(yíng)風(fēng)險(xiǎn)。從用戶的角度,健康險(xiǎn)公司能夠?qū)τ脩舻男袨楹歪t(yī)療數(shù)據(jù)進(jìn)行分析,不僅做到理賠保障的作用,還能夠?qū)τ脩舻慕】禒顩r進(jìn)行干預(yù),減少用戶產(chǎn)生醫(yī)療風(fēng)險(xiǎn)的概率,使得健康險(xiǎn)成為用戶的健康管家。
二、技術(shù)架構(gòu)
全面的數(shù)據(jù)資源是大數(shù)據(jù)技術(shù)應(yīng)用的基礎(chǔ),數(shù)據(jù)的處理是大數(shù)據(jù)技術(shù)應(yīng)用的關(guān)鍵,數(shù)據(jù)的分析是大數(shù)據(jù)技術(shù)應(yīng)用的核心,歸根結(jié)底,大數(shù)據(jù)技術(shù)都是為應(yīng)用服務(wù)的。本節(jié)將從健康險(xiǎn)數(shù)據(jù)的收集、數(shù)據(jù)的處理、數(shù)據(jù)的分析和數(shù)據(jù)的應(yīng)用四個(gè)方面進(jìn)行展開介紹。
2.1數(shù)據(jù)的收集
傳統(tǒng)的保險(xiǎn)數(shù)據(jù)存在數(shù)據(jù)量小、數(shù)據(jù)來源單一、數(shù)據(jù)收集慢的問題?,F(xiàn)有包含的數(shù)據(jù)主要來源于客戶的保單信息以及發(fā)生理賠時(shí)的理賠信息。因此,首先,健康險(xiǎn)公司要與外部醫(yī)療機(jī)構(gòu)合作獲取客戶部分醫(yī)療信息;其次,需要借助物聯(lián)網(wǎng)中可穿戴設(shè)備等技術(shù),實(shí)時(shí)并且全面的獲取客戶的血壓、心率等健康信息;最后,借助互聯(lián)網(wǎng)工具(APP、微信公眾號(hào))獲取客戶的用戶社交信息、喜好信息等等。通過這些信息能夠建立全方位的客戶視圖,為數(shù)據(jù)分析做好基礎(chǔ)。
2.2數(shù)據(jù)的處理
數(shù)據(jù)的處理主要包括對(duì)收集的數(shù)據(jù)如何組織以及如何存儲(chǔ)?,F(xiàn)有的數(shù)據(jù)資源不僅包含傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),還包含實(shí)時(shí)產(chǎn)生的大量半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù),因此需要借助現(xiàn)有的工具及方法(OCR技術(shù)等)把非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為有價(jià)值的結(jié)構(gòu)化數(shù)據(jù)。在數(shù)據(jù)的存儲(chǔ)上,傳統(tǒng)的集中式存儲(chǔ)已經(jīng)不能滿足要求,需要借助HBase等適用于海量數(shù)據(jù)實(shí)時(shí)存儲(chǔ)的數(shù)據(jù)存儲(chǔ)技術(shù)。
2.3數(shù)據(jù)的分析
首先,數(shù)據(jù)的分析需要對(duì)各種健康險(xiǎn)數(shù)據(jù)、醫(yī)療數(shù)據(jù)建立分析模型。用深度學(xué)習(xí)[3]等機(jī)器學(xué)習(xí)方法進(jìn)行數(shù)據(jù)的挖掘。例如,利用無(wú)標(biāo)定的醫(yī)療數(shù)據(jù)進(jìn)行無(wú)監(jiān)督訓(xùn)練,分層訓(xùn)練模型各層參數(shù)。
具體的,先用無(wú)標(biāo)定數(shù)據(jù)訓(xùn)練第一層,訓(xùn)練時(shí)先學(xué)習(xí)第一層的參數(shù),在學(xué)習(xí)得到第n-1層后,將n-1層的輸出作為第n層的輸入,訓(xùn)練第n層,由此分別得到各層的參數(shù);基于上一步得到的各層參數(shù)進(jìn)行自頂向下的監(jiān)督學(xué)習(xí)(就是通過帶標(biāo)簽的數(shù)據(jù)去訓(xùn)練,誤差自頂向下傳輸,對(duì)網(wǎng)絡(luò)進(jìn)行微調(diào)),對(duì)學(xué)習(xí)到的各層參數(shù)進(jìn)一步優(yōu)化。
其次,數(shù)據(jù)分析需要借助強(qiáng)大的計(jì)算平臺(tái)實(shí)現(xiàn)分布式并發(fā)計(jì)算和實(shí)時(shí)計(jì)算。傳統(tǒng)的單服務(wù)器模式已經(jīng)不能滿足處理海量數(shù)據(jù)的要求。在處理海量數(shù)據(jù)的時(shí)候借助Hadoop等計(jì)算平臺(tái)實(shí)現(xiàn)對(duì)大量數(shù)據(jù)的分布式并發(fā)計(jì)算。Hadoop通過數(shù)據(jù)分塊及自恢復(fù)機(jī)制,能支持PB級(jí)的分布式的數(shù)據(jù)存儲(chǔ),以及基于MapReduce分布式處理模式對(duì)這些數(shù)據(jù)進(jìn)行分析和處理。
MapReduce編程模型可以很容易的將多個(gè)通用批數(shù)據(jù)處理任務(wù)和操作在大規(guī)模集群上并行化,而且有自動(dòng)化的故障轉(zhuǎn)移功能。Hadoop以一種可靠、高效、可伸縮的方式進(jìn)行處理依靠橫向擴(kuò)展,通過不斷增加廉價(jià)的商用服務(wù)器來提高計(jì)算和存儲(chǔ)能力。
除此之外,借助Spark等實(shí)時(shí)數(shù)據(jù)分析系統(tǒng)實(shí)現(xiàn)海量數(shù)據(jù)的實(shí)時(shí)計(jì)算。Spark不僅啟用內(nèi)存分布數(shù)據(jù)集,提供交互式查詢,同時(shí)還可以優(yōu)化迭代工作負(fù)載。利用Spark可以支持分布式數(shù)據(jù)集上的迭代作業(yè),構(gòu)建大型的、低延遲的數(shù)據(jù)分析應(yīng)用程序。
2.4數(shù)據(jù)的應(yīng)用
基于數(shù)據(jù)分析可以從以下方面的應(yīng)用促進(jìn)健康險(xiǎn)的發(fā)展:
第一,通過建立慢病管理等疾病模型實(shí)現(xiàn)對(duì)用戶的健康狀況進(jìn)行干預(yù),減少用戶的發(fā)病幾率,做用戶的健康管家;
第二,通過建立醫(yī)療付費(fèi)模型對(duì)用戶的醫(yī)療行為進(jìn)行干預(yù),一方面降低用戶過度醫(yī)療的可能性,另一方面減少用戶不必要的醫(yī)療費(fèi)用支出;
第三,通過建立醫(yī)療風(fēng)險(xiǎn)以及經(jīng)營(yíng)風(fēng)險(xiǎn)模型,健康險(xiǎn)公司能夠有效防止保險(xiǎn)欺詐以及控制經(jīng)營(yíng)風(fēng)險(xiǎn)。
三、技術(shù)難點(diǎn)
大數(shù)據(jù)已經(jīng)成為健康險(xiǎn)公司發(fā)展的隱形資產(chǎn)。但是大數(shù)據(jù)在健康險(xiǎn)的應(yīng)用存在以下難點(diǎn):
第一,數(shù)據(jù)的互聯(lián)互通與數(shù)據(jù)共享問題?,F(xiàn)有的保險(xiǎn)公司面臨的數(shù)據(jù)資源有限,多維度的數(shù)據(jù)資源是進(jìn)行數(shù)據(jù)挖掘的關(guān)鍵,如何實(shí)現(xiàn)與醫(yī)療機(jī)構(gòu)、社交網(wǎng)絡(luò)等數(shù)據(jù)的互聯(lián)互通是需要解決的問題;
第二,大數(shù)據(jù)模型的應(yīng)用問題。以神經(jīng)網(wǎng)絡(luò)等為代表的機(jī)器學(xué)習(xí)模型在各行各業(yè)掀起了學(xué)習(xí)的浪潮,但是如何結(jié)合醫(yī)療知識(shí)和大量歷史數(shù)據(jù)結(jié)合設(shè)計(jì)相對(duì)準(zhǔn)確實(shí)用的模型是需要解決的問題;
第三,數(shù)據(jù)安全性問題。大數(shù)據(jù)技術(shù)在健康險(xiǎn)中的應(yīng)用涉及到用戶的醫(yī)療信息等敏感數(shù)據(jù),如何保護(hù)數(shù)據(jù)的存儲(chǔ)安全以及用戶隱私是需要解決的問題。
四、結(jié)束語(yǔ)
健康險(xiǎn)和大數(shù)據(jù)技術(shù)有機(jī)結(jié)合是健康險(xiǎn)發(fā)展的必然趨勢(shì)。健康險(xiǎn)和大數(shù)據(jù)技術(shù)有機(jī)結(jié)合能夠促進(jìn)健康險(xiǎn)的快速健康的發(fā)展。
大數(shù)據(jù)技術(shù)能夠助力健康險(xiǎn)公司整合健康險(xiǎn)的保險(xiǎn)保障、健康管理等功能,進(jìn)一步打造大健康生態(tài)圈,實(shí)現(xiàn)健康險(xiǎn)更好的服務(wù)人民的目標(biāo)。
參 考 文 獻(xiàn)
[1]劉彥欣. 我國(guó)商業(yè)健康保險(xiǎn)發(fā)展機(jī)遇與挑戰(zhàn)[J]. 對(duì)外經(jīng)貿(mào), 2015(4):51-54.
[2]徐子偉, 張陳斌, 陳宗海. 大數(shù)據(jù)技術(shù)概述[C]. 系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)論文集. 2014.
[3]孫志軍, 薛磊, 許陽(yáng)明,等. 深度學(xué)習(xí)研究綜述[J]. 計(jì)算機(jī)應(yīng)用研究, 2012, 29(8):2806-2810.