曾 娟,吳興華,張洪昌
(武漢理工大學 汽車工程學院,湖北 武漢 430070)
針對細分市場設計差異化費率體系,實現(xiàn)保險業(yè)務的差異化、精細化管理是保險經(jīng)營的終極目標。近年來,從短租型個人用車,到長租型營運車輛,再到以家庭為單位的長租型非營運汽車,汽車租賃業(yè)務的發(fā)展對保險定價提出新的要求。由于租賃汽車所有權與使用權的分離,以擬合風險分布函數(shù)為核心的定價方式不再適用。針對租賃汽車多人、分時的運營特點,保費定價如何從后驗估費機制轉化為使用過程中的風險估費機制,是目前需要研究的重要問題。
20世紀40年代以前,先驗保費定價機制以擬合風險分布函數(shù)為核心,定價因子包括人的靜態(tài)因素,如年齡、駕齡、職業(yè)等。20世紀50年代開始引入賠付記錄作為費率調整因子,稱為后驗估費機制。VICKREY[1]指出了這種機制的弊端,認為其(無賠款優(yōu)待(NCD))既沒有反映事故的外部成本,也沒有提供駕駛員調整行程和駕駛習慣的激勵,而且強迫低里程的駕駛員向高里程的駕駛員補貼保費?;诖?,VICKREY首次從理論上探討將行駛里程引入保險定價中;BUTLER等[2]探討了在保險定價中引入行駛里程的實際操作方式;LEMAIRE[3]證實了越是忽略重要的定價因子(如使用狀況),依據(jù)索賠記錄調整浮動保費的風險錯配機會成本就越高。20世紀末以使用(usage)為基礎的保險定價UBI開始進入商業(yè)化運營階段。第一代UBI產(chǎn)品即UBP,從加油表或里程計獲得實際里程的數(shù)值,并計入保費。這種計費方式誤差較大。目前比利時Corona Direct和荷蘭Polis Direct保險公司仍然使用這種方式[4]。第二代UBI產(chǎn)品又稱TBI,是通過車載信息系統(tǒng)獲取數(shù)值??紤]里程數(shù)計入費率調整因子稱為PAYD[5],考慮駕駛習慣計入費率調整因子稱為PHYD。由于信號采集技術和數(shù)據(jù)挖掘算法的局限性,第二代UBI產(chǎn)品都存在風險因子過多、結果失真的問題。
近年來,隨著車險費率市場化改革和車聯(lián)網(wǎng)、大數(shù)據(jù)等新技術的發(fā)展,加快實現(xiàn)車險費率的差異化已成為車險市場發(fā)展的必然趨勢[6]?,F(xiàn)有保險費率設計方法主要有基于廣義線性模型的先驗保費模式與基于用量的后驗保險模式。先驗保費模式費率的厘定是基于車和人的靜態(tài)特征,如車齡、車型、新車購置價格、駕駛員性別、年齡及駕齡等[7]。這些特征較易獲得[8],在一定程度上確實有顯著的解釋風險的能力[9]。但是這種模式下的車險費率差異化較低,難以實現(xiàn)車險費率厘定的差異化和個性化,因此對駕駛行為的分析與風險評估成為學者研究的重點。如AL-SULTAN等[10]利用貝葉斯網(wǎng)絡構建了一種駕駛行為狀態(tài)分析模型,通過預測駕駛人行為動作發(fā)生的概率來對駕駛安全等級進行評估。該方法的缺陷在于每個因子均為二元賦值,而離散化數(shù)值很難擬合風險的連續(xù)性變化,因此無法識別駕駛員真正的意圖;WAHLSTR?M等[11]提出了一種基于智能手機的駕駛行為分析方法,該方法利用智能手機的GNSS接收器、慣性測量單元獲取車輛位置、速度、橫擺角速度等信息,通過相關算法實現(xiàn)對駕駛員的分類,并減少測量誤差,進而實現(xiàn)對駕駛行為的識別與風險評估;彭江琴[12]提出了一種對疲勞駕駛、變速行為和轉彎行為等駕駛行為的識別算法,并在此基礎上,提出了一種改進型熵權層次分析法計算駕駛行為相關指標的權重值。該方法可以依據(jù)較為精細的指標對駕駛行為做出綜合評價,但該評價結果不能直接用于車險費率的厘定。在風險評價方面,米紅甫等[13]等將模糊層次分析法適用于風險評價,將風險等級分為很安全、一般安全、較不安全等模糊指標,但這種方式對于以人為中心的精細化費率厘定精度不足。
針對以上問題,筆者提出一種改進的因子分析與K-means聚類耦合的風險分類方法,并將風險分類結果引入保費定價模型。該模型的優(yōu)化基于3點:①采用因子分析法提取駕駛行為因子,解決聚類算法無法識別駕駛行為因子相關性的問題;②以方差貢獻率加權均值為權重,構建駕駛員綜合風險評價因子S;③設計基于K-means聚類算法的分時保費風險因子分級方法。
K-means聚類算法是一個迭代算法,其主要思想是根據(jù)屬于該簇每個點的位置計算該簇的中心位置,然后將這些點劃分到距離其最近的中心,重復直到足夠收斂。其基本過程為:①為每一個聚類確定一個初始聚類中心,即隨機選擇k個樣本μ1,μ2,…,μk作為初始聚類中心;②將樣本按照最小距離原則分配到最鄰近聚類,即使目標函數(shù)(式(1))減小,其中樣本間距離采用歐式距離,如式(2)所示;③使用每個聚類中的樣本均值作為新的聚類中心,聚類中心更新公式如式(3)所示;④重復步驟②和步驟③,直到聚類準則函數(shù)(式(4))達到最小值。⑤結束,得到k個聚類。
(1)
(2)
(3)
(4)
式中:xi為聚類樣本;μj為聚類中心;d為樣本的維度;d(xi,xj)為樣本間歐式距離;Cj為聚類簇;V為聚類準則函數(shù)。
但該聚類過程的缺陷在于不考慮因子的多重共線性,僅依據(jù)樣本間距離進行迭代,最終可能導致聚類結果失真。
數(shù)據(jù)來源于某大型租賃公司,采集樣本為19輛純電動通勤車,且車型和行車路線一致。行車路線為武漢城市主干道,交通路況復雜。單程路線長12.782 km,為期45天,原始數(shù)據(jù)達400多萬條。去除車輛怠速時的數(shù)據(jù),剩余數(shù)據(jù)為有效數(shù)據(jù)。采集指標包括車速與行車時間。采集頻率為1 Hz。采用駕駛行為特征值評價駕駛行為安全程度,駕駛行為特征值構成如表1所示,計算結果如表2所示。
為了消除特征值量綱的不同對分析結果的影響,并使得不同屬性的特征值之間有可比性,采用Z-score標準化方法對特征值數(shù)據(jù)進行標準化。然后采用SPSS19.0對駕駛行為的特征值進行測量。KMO測度值為0.739,Bartlett檢驗的相伴概率p<0.000 1,說明問題變量間有共享因子的可能性,需要進行因子分析以去除因子相關性。
2.2.1 主成分的提取
采用SPSS19.0對駕駛行為的8個特征值實施主成分提取。結果表明駕駛行為的8項特征值可提取為3個因子,因子分析碎石圖如圖1所示。方差解釋表如表3所示,從提取平方和載入一欄可知,提取后的3個因子方差總解釋率達到94.532%(>85.000%),原有變量信息丟失較少,因子分析效果較理想。
所提取的3個因子的載荷矩陣如表4所示,可看出主因子1(M1)與加速度標準差(載荷0.971)、正加速度均值(載荷0.964)、負加速度均
表1 駕駛行為特征值構成
表2 駕駛行為特征值計算結果
圖1 因子分析碎石圖
值(載荷-0.929)、負加速度標準差(載荷0.914)密切相關;主因子2(M2)與速度均值(載荷0.828)、超速時間占比(載荷0.943)密切相關;主因子3(M3)既與速度標準差有關聯(lián)(載荷0.408),又與正加速度有關聯(lián)(載荷0.593),且關聯(lián)度都不大。由于3個因子實際含義模糊,需要做因子旋轉。
表3 方差解釋表
表4 因子載荷矩陣表(旋轉前)
2.2.2 因子的解釋
筆者采取最大方差法對因子載荷矩陣進行正交旋轉,保證新因子的不相關性[14]。表3旋轉平方和載入一欄表明因子旋轉后,累計方差貢獻率沒有改變(94.532%),但重新分配了各因子解釋原有變量的方差,使得因子更易于解釋。旋轉后因子載荷矩陣表如表5所示,結果表明,旋轉后的因子N1主要與正加速度均值(載荷0.831)、正加速度標準差(載荷0.966)密切相關,而急加速、加速度范圍變化對應正加速度標準差、正加速度均值的變化,因此N1是加速行為的綜合表現(xiàn);因子N2主要與負加速度均值(載荷-0.780)、負加速度標準差(載荷0.816)密切相關,而急減速、負加速度變化范圍對應負加速度均值、負加速度標準差的變化,因此N2是減速行為的綜合表現(xiàn);因子N3主要與速度均值(載荷0.706)、速度標準差(載荷0.820)、超速時間占比(0.980)密切相關,是駕駛員速度行為的綜合表現(xiàn)。
表5 因子載荷矩陣表(旋轉后)
2.2.3 駕駛行為綜合評價因子的構建
過猛、頻繁踩踏板均容易出現(xiàn)違章或引發(fā)交通事故。因此,N1、N2、N3可作為駕駛行為安全性評價因子。由于方差貢獻率反映了因子的重要性,以方差貢獻率的加權均值為權重,設計駕駛行為綜合風險評價因子S,如式(5)所示。S值越高,表明駕駛行為對應的風險成本越高。19位駕駛員駕駛行為綜合風險評價值如表6所示。
S=0.38×|N1|+0.33×|N2|+0.29×|N3|
(5)
其中,N1、N2、N3的計算可在SPSS中進行,先采用回歸法估計因子得分系數(shù),再通過計算因子得分系數(shù)與對應駕駛行為特征值的乘積總和,即可得到N1、N2、N3的值。
表6 駕駛行為綜合風險評價值
對表6中樣本S值進行K-means聚類處理。分別取K=3,K=5,K=8,聚類結果分別如表7~表9所示。可以看出隨著分組數(shù)K的增加,風險劃分越來越細致,同組樣本的風險特征越接近;隨著S值的增大,對應組別的綜合風險等級上升。
表8 基于S的駕駛行為聚類(K=5)
表9 基于S的駕駛行為聚類(K=8)
從不同組別采樣,其違章及出險事故數(shù)據(jù)如表10所示。數(shù)據(jù)來源于某保險公司和交警部門。通過對比表9和表10可以看出:聚類結果顯示的駕駛員風險狀況分布與其交通違規(guī)、交通事故頻數(shù)、重大交通事故發(fā)生次數(shù)反映出的風險狀況分布基本吻合,說明該聚類方法對駕駛員風險狀況的識別過程基本符合實際情況,是可行的。
表10 駕駛員2014—2016年違章及出險事故數(shù)據(jù)
綜上所述,聚類結果與駕駛員風險特性基本吻合,K-means聚類結果可直接作為費率因子分層設計的依據(jù)。分時保費設計思路可以表述為:分時保費=基礎保費×行駛里程因子系數(shù)×駕駛行為因子系數(shù)[15];因子系數(shù)等級形式如0.9,1.0,1.1,1.2,以此區(qū)分個體風險,實現(xiàn)個體保費的上浮或下調。
該研究為駕駛行為因子系數(shù)設計提供思路:①以S值為依據(jù),聚類的分組數(shù)即為費率等級數(shù)。②由于K-means聚類算法可以調整分類數(shù),保險公司可以依據(jù)細分市場需求調整費率因子層級數(shù)。層級數(shù)受投保金額、風險因素復雜度的影響。對應關系如表11所示。
表11 投保金額、風險因素與費率分級層數(shù)的對應關系
在電動客車細分市場中,由于保險標的的投保金額大,車輛損失險投保金額一般為30萬元~100萬元,第三者責任險的投保金額一般為100萬元左右,因子層級數(shù)上升或下調一個等級會導致保費變化1 000元甚至幾萬元不等。因此,設計更多的費率層級數(shù)有利于差異化保費擬定,聚類分組數(shù)K=8比K=5、K=3更符合保險公司對電動客車市場風險精細化管理的實際需求。基于此,設計駕駛行為因子系數(shù)調整體系:1.4,1.3,1.2,1.1,1.0,0.9,0.8,0.7。1.4對應聚類結果為一級,0.7對應聚類結果為八級,以此類推。
由于租賃汽車所有權與使用權分離,以擬合風險分布函數(shù)為核心的定價方式不再適用。筆者針對租賃汽車多人、分時的運營特點,利用車聯(lián)網(wǎng)所提供的海量駕駛數(shù)據(jù),通過對駕駛行為的風險分級,實現(xiàn)費率制定的精細化目標。
首先采用因子分析法從8項駕駛行為特征值中提取駕駛行為因子,去除因子之間的多重共線性;然后以方差貢獻率的加權均值為權重,構建駕駛員綜合風險評價因子S;最后基于該綜合風險評價因子,利用K-means聚類算法對駕駛員進行聚類,實現(xiàn)對駕駛員風險的自動分級,分級結果可作為費率分級的直接依據(jù)。以某大型租賃公司所提供的19位駕駛員1個多月的駕駛數(shù)據(jù)作為研究樣本,將所計算的綜合風險因子結果與交警和保險部門的違章和出險數(shù)據(jù)進行比對,發(fā)現(xiàn)二者結論基本吻合。由于K-means聚類數(shù)據(jù)來源于車體定位系統(tǒng),因此該方法對于研究互聯(lián)網(wǎng)使用環(huán)境下的風險估費機制,推動以人為中心的保費定價模式發(fā)展,實現(xiàn)保險業(yè)務的差異化、精細化管理,具有積極的理論參考價值。
筆者的創(chuàng)新之處在于將因子分析與K-means聚類耦合的方法首次用于保費定價領域,在利用因子分析提取駕駛行為因子的基礎上,提出了駕駛員的綜合風險評價因子;利用K-means聚類算法實現(xiàn)對駕駛員風險的自動分級,保證了費率制定依據(jù)的客觀性;同時K-means聚類具有收斂快的優(yōu)點,特別適用于對車聯(lián)網(wǎng)海量數(shù)據(jù)的處理。但不足之處在于:駕駛行為風險因子較多,筆者只考慮了縱向因子,未考慮急轉彎等駕駛風險因子,另外樣本數(shù)僅19個,與實際操作中大樣本數(shù)據(jù)量有差異。
參考文獻:
[1] VICKREY W.Automobile accidents, tort law, externalities and insurance: an economist′s critique[J]. Law and Contemporary Problems,1968,33(3):464-487.
[2] BUTLER P, BUTLER T. Driver record: a political red herring that reveals the basic flaw in automobile insurance pricing[J]. Journal of Insurance Regulation,1989,8(2):200-203.
[3] LEMAIRE J. Bonus-malus systems in automobile insurance[M].[S.l.]: Kluwer Academic Publishers,1995:277-278.
[4] 郁佳敏.車聯(lián)網(wǎng)大數(shù)據(jù)時代汽車保險業(yè)的機遇和挑戰(zhàn)[J].南方金融,2013(12):89-95.
[5] LITMAN T. Distance-based vehicle insurance feasibility, benefits and costs: comprehensive technical report[R]. Chicago:Victoria Transport Policy Institute,2001.
[6] 朱爽.車聯(lián)網(wǎng)環(huán)境下基于UBI的車險費率厘定模式與方法研究[D].北京:北京交通大學,2015.
[7] 劉瑞剛.廣義線性模型在UBI車險費率厘定中的應用[D].天津:天津商業(yè)大學,2017.
[8] 孟生旺.精算師考試用書:非壽險精算學[M].北京:中國財政經(jīng)濟出版社,2011:98-115.
[9] 楊建.市場化背景下車險費率厘定方法探究[D].大連:東北財經(jīng)大學,2012.
[10] AL-SULTAN S, AL-BAYATTI A H, ZEDAN H. Context-aware driver behavior detection system in intelligent transportation systems[J]. IEEE Transactions on Vehicular Technology,2013,62(9):4264-4275.
[11] WAHLSTR?M J, SKOG I, HANDEL P. Driving behavior analysis for smartphone-based insurance telematics[C]∥ Proceedings of the 2nd Workshop on Workshop on Physical Analytics.Florence:ACM,2015:19-24.
[12] 彭江琴.基于GID的車聯(lián)網(wǎng)保險UBI費率與駕駛行為評分研究[D].南京:南京郵電大學,2016.
[13] 米紅甫,王文和,肖國清,等.基于FAHP的高層建筑火災風險評價研究[J].武漢理工大學學報(信息與管理工程版),2017,39(2):148-152.
[14] 薛薇.SPSS統(tǒng)計分析方法及應用[M].北京:電子工業(yè)出版社,2009:327-349.
[15] 孫茜.車險UBI定價模式研究[D].北京:中國人民大學,2017.