亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于支持向量機的車險購買意向識別方法

        2024-12-04 00:00:00邵延富謝大為
        自動化與信息工程 2024年6期

        摘要:針對傳統(tǒng)的人工方式判斷車主是否有意向購買車險存在效率低、缺乏預(yù)測性等問題,提出一種基于支持向量機的車險購買意向識別方法。首先,通過標準化處理與主成分分析降維,將30維的通話數(shù)據(jù)映射至10維空間,并采用欠抽樣策略解決數(shù)據(jù)樣本不平衡的問題;然后,利用SVM模型區(qū)分有、無意向車主。實驗結(jié)果表明,SNM模型的識別召回率和誤檢率分別為97.9%、4.3%。該方法可為車險公司個性化服務(wù)提供技術(shù)支持。

        關(guān)鍵詞:車險購買意向識別;主成分分析;支持向量機;通話數(shù)據(jù)

        中圖分類號:TP311.5 """"""""""文獻標志碼:A """""""""文章編號:1674-2605(2024)06-0013-06

        DOI:10.3969/j.issn.1674-2605.2024.06.013""""""""""""""""""""開放獲取

        A Method of Car Insurance Purchase Intention Recognition Based on """Support Vector Machine

        SHAO Yanfu "XIE Dawei

        (Guangzhou Joysim Technology Co., Ltd., Guangzhou 510000, China)

        Abstract: Aiming at the problems of low efficiency and lack of predictability in traditional manual methods of judging whether car owners intend to purchase car insurance, a car insurance purchase intention recognition method based on support vector machine is proposed. Firstly, through standardization and principal component analysis dimensionality reduction, the 30 dimensional call data is mapped to a 10 dimensional space, and under sampling strategy is adopted to solve the problem of imbalanced data samples; Then, use SVM model to distinguish between interested and uninterested car owners. The experimental results show that the recognition recall rate and 1 detection rate of the SNM model are 97.9% and 4.3%. This method can provide technical support for personalized services of car insurance companies.

        Keywords:"car insurance purchase intention recognition; principal component analysis; support vector machine; calling data

        0 引言

        據(jù)統(tǒng)計,2022年我國民用汽車保有量已突破3.8億輛[1]。同時,車險險種的結(jié)構(gòu)、費用費率不合理等問題也日漸浮現(xiàn)。自2015年第二次車險費用改革以來,我國車險行業(yè)通過市場化手段降低了車險費率,但仍存在經(jīng)營粗放、競爭失序和數(shù)據(jù)失真等問題[2],迫切需要深化改革,以滿足高質(zhì)量發(fā)展的要求。為此,利用車險公司積累的大量數(shù)據(jù),通過建立準確的數(shù)學(xué)模型,對車險產(chǎn)品進行精細化管理和定價非常重要。其中,對不同購買意向的車主提供個性化的保險方案與服務(wù),可提高車險的吸引力,促進車險行業(yè)向更合理、高效的方向發(fā)展。

        通過車主與車險公司的通話內(nèi)容,分析車主的車險購買意向,有助于車險公司為車主提供更好的服務(wù)。傳統(tǒng)的車險購買意向主要通過人工標注和調(diào)查問卷的方式來確定,不僅效率低,而且缺乏預(yù)測性。因此,開發(fā)基于大數(shù)據(jù)和機器學(xué)習(xí)算法的車險購買意向識別技術(shù),具有重要的理論意義和應(yīng)用價值[3]。

        目前,車主購買車險意向的研究主要分為4類:1) 根據(jù)車主過去的車險購買記錄,通過數(shù)據(jù)挖掘和模式識別技術(shù),預(yù)測車主未來購買車險的可能性和偏好,其優(yōu)點是直接利用已有的數(shù)據(jù)資源,具有較強的實證基礎(chǔ),但過度依賴歷史數(shù)據(jù),忽略了車主的偏好和市場環(huán)境的變化;2) 通過分析車主的駕駛行為和風(fēng)格,如駕駛速度、剎車習(xí)慣等,預(yù)測其購買車險的意向,其優(yōu)點是體現(xiàn)了車主的個性化需求,能更精準地匹配適合其特點的車險產(chǎn)品,但收集和分析駕駛行為數(shù)據(jù)需要較高的技術(shù)支持和成本,且可能涉及隱私問題;3) 通過分析車主的消費習(xí)慣和偏好,如車險價格敏感度、險種選擇偏好等,了解車主購買車險的行為模式,其優(yōu)點是從消費者的角度為車險產(chǎn)品的設(shè)計和營銷策略提供指導(dǎo),但消費習(xí)慣受多種因素的影響,變化較大,難以準確預(yù)測;4)"車險公司的產(chǎn)品質(zhì)量與服務(wù)態(tài)度,其優(yōu)點是直接反映車險公司在市場中的競爭力,為其提升產(chǎn)品質(zhì)量和改進服務(wù)提供指導(dǎo)方向,但評價標準主觀性強,且受限于車主的個人體驗和期望,可能存在一定的偏差[4]。

        本文利用車主與車險公司的通話數(shù)據(jù),提出一種基于支持向量機(support vector machine, SVM)的車險購買意向識別模型,分析車主購買或復(fù)購車險的意向程度。該模型利用主成分分析(principal component analysis, PCA)算法降低輸入特征的維度,減少計算復(fù)雜度;通過SVM在N維空間中尋找最大化超平面,將有意向車主與無意向車主有效分離。

        1 相關(guān)研究

        1.1 PCA

        PCA是一種經(jīng)典的數(shù)據(jù)降維技術(shù),基本思想是將原始數(shù)據(jù)線性映射到一個新的正交空間,使映射后數(shù)據(jù)的方差最大,并舍棄貢獻率較小的次要成分。具體做法是:計算數(shù)據(jù)協(xié)方差矩陣,求解其特征值和特征向量;選取前k個最大的特征值對應(yīng)的特征向量作為新空間的基底,將原始數(shù)據(jù)投影到新空間中實現(xiàn)降維。

        PCA具有算法簡單、無數(shù)據(jù)損失等特點,被廣泛應(yīng)用于圖像識別、信號處理、數(shù)據(jù)壓縮等領(lǐng)域。但它是一種無監(jiān)督學(xué)習(xí)方法,數(shù)據(jù)降維后可能會丟失有用的判別信息。

        1.2 SVM

        SVM是一種基于統(tǒng)計學(xué)習(xí)理論發(fā)展起來的有監(jiān)督學(xué)習(xí)模型,主要用于模式識別、數(shù)據(jù)分析等領(lǐng)域。其基本工作原理是在高維特征空間中尋找一個最大邊界超平面,將不同類別的樣本點分開,使兩類樣本點到超平面的距離最大,從而達到較好的分類效果,原理如圖1所示。

        SVM具有正則化的特點,能夠較好地控制模型的復(fù)雜度,避免過擬合;且泛化能力較強,在小樣本、高維、非線性等情況下仍能獲得較理想的性能。

        2 識別方法

        基于改進SVM的車險購買意向識別方法主要分為數(shù)據(jù)獲取、數(shù)據(jù)預(yù)處理、特征降維、SVM分類、模型預(yù)測5個環(huán)節(jié)。預(yù)先設(shè)定車主的車險購買意向為有意向車主和無意向車主2種類型。

        2.1 數(shù)據(jù)獲取

        在預(yù)先獲得授權(quán)的前提下,統(tǒng)計某車險公司半年內(nèi)的通話數(shù)據(jù),得出30個與車險購買意向相關(guān)的維度,包括是否撥打車險公司號碼、通話時長、是否為主叫方等。其中,車主的手機號碼經(jīng)過加密脫敏處理。最終,收集到無意向車主數(shù)據(jù)453 869條、有意向車主數(shù)據(jù)518條。通話原始數(shù)據(jù)維度如表1所示。

        無意向車主數(shù)據(jù)(453 869條)與有意向車主數(shù)據(jù)(518條)存在嚴重的數(shù)據(jù)不平衡。如果直接基于這種不平衡數(shù)據(jù)訓(xùn)練模型,將導(dǎo)致模型泛化性能較差。為解決這一問題,本文采用欠抽樣的策略,從無意向車主數(shù)據(jù)中隨機抽取518條,與有意向車主的518條數(shù)據(jù)組成平衡的混合數(shù)據(jù)集,并將該混合數(shù)據(jù)集按照1∶1的比例劃分為訓(xùn)練集和驗證集[6]。

        2.2 數(shù)據(jù)預(yù)處理

        由于通話數(shù)據(jù)特征維度的量綱不同,如是否主叫的取值范圍為{0,1},通話時長以秒為單位,因此需要對原始通話數(shù)據(jù)進行標準化處理,即將不同量綱的數(shù)據(jù)統(tǒng)一到同一數(shù)量級:

        2.3 特征降維

        由于標準化后的通話數(shù)據(jù)的特征維數(shù)較高(30個),且部分特征存在線性相關(guān)性,直接輸入模型可能會導(dǎo)致過擬合及計算效率降低。為此,采用PCA算法對標準化后的通話數(shù)據(jù)進行降維處理。

        由表2可知,前10個最大的特征值之和占全部特征值總和的比例為98.1%,即主成分保留98%以上,故選取前10個特征值替代通話數(shù)據(jù)的30個特征值。

        2.4 SVM分類

        經(jīng)初步分析發(fā)現(xiàn),有意向車主數(shù)據(jù)與無意向車主數(shù)據(jù)在一些字段上較為相似,用低維的曲線擬合容易導(dǎo)致欠擬合,用高維的多項式擬合容易出現(xiàn)過擬合。為此,采用SVM算法先把低維不可分的數(shù)據(jù)投射到高維空間,再用高維超平面進行是否有車險購買意向的二分類。

        2)"懲罰參數(shù)C:引入一個正的調(diào)整參數(shù)C,其決定了分類的嚴格程度。較大的懲罰參數(shù)C意味著模型會對錯誤分類的樣本給予更大的懲罰,從而可能導(dǎo)致模型過擬合;較小的懲罰參數(shù)C使模型對錯誤分類的樣本懲罰減小,從而可能導(dǎo)致模型欠擬合。

        2.5 模型預(yù)測

        利用驗證集的518條數(shù)據(jù)進行SVM模型預(yù)測驗證,其中288條數(shù)據(jù)為有意向車主數(shù)據(jù),占比為55.6%;230條為無意向車主數(shù)據(jù),占比為44.4%。

        對驗證集數(shù)據(jù)進行數(shù)據(jù)預(yù)處理、特征降維(10維)后,輸入SVM模型(公式12),得出的預(yù)測結(jié)果如表3混淆矩陣所示[10]。

        3 結(jié)論

        本文針對車主的車險購買意向識別問題,提出了一種基于支持向量機的車險購買意向識別方法。1) 根據(jù)車主與車險公司的通話數(shù)據(jù),統(tǒng)計需要分析的30個維度;2) 利用欠抽樣策略隨機抽取部分車主數(shù)據(jù),構(gòu)建平衡數(shù)據(jù)集,緩解模型訓(xùn)練過程中的數(shù)據(jù)偏差;3) 對30維的原始通話數(shù)據(jù)進行標準化預(yù)處理,消除不同特征量綱的影響;4) 采用PCA算法將30維數(shù)據(jù)映射到10維空間,并保留了98%以上的方差貢獻,有效降低了數(shù)據(jù)冗余;5) 采用SVM算法建立分類模型,將是否有意向購買車險的數(shù)據(jù)進行分類。經(jīng)驗證集測試,SVM模型的召回率為97.9%,誤檢率為4.3%,具有良好的分類性能。本文SVM模型還存在需要改進的地方,如模型進一步優(yōu)化、模型參數(shù)的自動調(diào)優(yōu)等。

        ?The author(s) 2024. This is an open access article under the CC BY-NC-ND 4.0 License (https://creativecommons.org/licenses/ by-nc-nd/4.0/)

        參考文獻

        [1]"楊怡.關(guān)于推動我國交通運輸高質(zhì)量發(fā)展的幾點思考[J].人民公交,2024(11):69-72.

        [2]"房弢,陳晨,華圓.中小財產(chǎn)車險公司差異化發(fā)展路徑與服務(wù)實踐研究[J].浙江工商職業(yè)技術(shù)學(xué)院學(xué)報,2024,23(1):13-17.

        [3] 唐金成,肖思文.新能源車險發(fā)展困境與創(chuàng)新策略[J].中國保險,2024(5):29-33.

        [4] 譚征.基于K-Means和SEM的消費者互聯(lián)網(wǎng)保險購買意愿研究——以TPB和TAM為分析框架[J].重慶理工大學(xué)學(xué)報(自然科學(xué)),2019,33(2):198-207.

        [5]"鄧育輝,李鵬,邵延富,等.基于神經(jīng)網(wǎng)絡(luò)與粒子群算法的騷擾電話識別研究[J].數(shù)據(jù)通信,2022(5):28-30.

        [6] HAN Jiawei, KAMBER Micheline, Pei Jian. Data mining: Concepts and techniques[M]. Waltham: Morgan Kaufmann Publishers, 2012:265-270.

        [7] 包研科.數(shù)據(jù)分析教程[M].北京:清華大學(xué)出版社,2011:68-76.

        [8] 王學(xué)民.應(yīng)用多元分析[M].4版.上海:上海財經(jīng)大學(xué)出版社, 2014:188-214.

        [9] TAN Pangning, STEINBACH Michael, Vipin Kumar. Mining W I D. Introduction to data mining[M]. New Jersey: Pearson Education, Inc, 2006:127-189.

        [10] 李文楷,劉原池,劉子越,等.基于正樣本-背景數(shù)據(jù)的校正混淆矩陣[J].海南大學(xué)學(xué)報(自然科學(xué)版),2023,41(3):293-302.

        [11] 高瑞.混淆矩陣在商業(yè)決策中的應(yīng)用研究[J].當代經(jīng)濟, 2021(4):110-113.

        作者簡介:

        邵延富,男,1972年生,碩士研究生,高級工程師,主要研究方向:軟件工程和大數(shù)據(jù)工程。E-mail: 13632102858@139.com

        謝大為,男,1991年生,本科,高級工程師,主要研究方向:大數(shù)據(jù)工程。E-mail: 13798088446@139.com

        呻吟国产av久久一区二区| 亚洲av在线观看播放| 亚洲国产精品美女久久 | 欧洲熟妇色 欧美| 国产美女白浆| 厕所极品偷拍一区二区三区视频| 少妇精品揄拍高潮少妇桃花岛| 天天躁夜夜躁av天天爽| 野花社区视频www官网| 亚洲 欧美 激情 小说 另类| 亚洲一区二区三区av无| 欧美a级毛欧美1级a大片| 中文字字幕在线精品乱码| 女性自慰网站免费看ww| 国产熟妇一区二区三区网站| 日本亚洲国产精品久久| 欧美大肥婆大肥bbbbb| 国产成人8x视频网站入口| 少妇呻吟一区二区三区| 人人妻人人添人人爽欧美一区 | 牛牛本精品99久久精品88m| 一区二区特别黄色大片| 刚出嫁新婚少妇很紧很爽| 日韩aⅴ人妻无码一区二区| 精品国产高清a毛片无毒不卡| 激情文学人妻中文字幕| 国产情侣亚洲自拍第一页| 免费a级毛片无码a∨中文字幕下载 | 免费在线观看蜜桃视频| 日本黑人亚洲一区二区| 免费拍拍拍网站| 无遮挡十八禁在线视频国产制服网站 | 国产av91在线播放| 91久久偷偷做嫩模影院| 亚洲精品久久久久中文字幕一福利| 国产精品亚洲А∨天堂免下载| 在线观看人成网站深夜免费| 国产香蕉视频在线播放| 四川老熟女下面又黑又肥| 91久久综合精品国产丝袜长腿| 中文字幕一区二区三区日日骚|