亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于金融大數(shù)據(jù)的個(gè)性化推薦技術(shù)研究

        2018-08-30 09:09:10唐向紅彭超陸見光
        價(jià)值工程 2018年20期
        關(guān)鍵詞:個(gè)性化推薦數(shù)據(jù)

        唐向紅 彭超 陸見光

        摘要: 隨著金融大數(shù)據(jù)的出現(xiàn)和發(fā)展,各種理財(cái)產(chǎn)品和貸款項(xiàng)目的種類和數(shù)量都爆炸式的增長(zhǎng)。如何有效地針對(duì)客戶推薦提高推薦成功率成了關(guān)鍵問題。針對(duì)這一問題,文章提取代表客戶興趣、相應(yīng)組群和相關(guān)項(xiàng)目的特征,然后利用神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè),從而達(dá)到了個(gè)性化推薦的目的。實(shí)驗(yàn)結(jié)果表明:所建模型能有效地進(jìn)行個(gè)性化推薦。

        Abstract: With the advent and development of financial big data, the types and quantities of all types of wealth management products and loan projects have exploded. How to effectively recommend for customers to improve the success rate of the recommendation has become a key issue. To solve the problem,we extract features which represent customers interests, corresponding groups and related items,and ultilize the neural net to predict to achieve the goal of personalized recommendation. The experiment result shows that the model can effectively acomplish the personalized recommendation.

        關(guān)鍵詞: 金融大數(shù)據(jù);個(gè)性化推薦;數(shù)據(jù)

        Key words: financial big data;personalized recommendation;data

        中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-4311(2018)20-0203-03

        0 引言

        隨著大數(shù)據(jù)時(shí)代的到來,各行各業(yè)的運(yùn)營(yíng)模式發(fā)生了巨大的變化。在大數(shù)據(jù)時(shí)代,金融業(yè)也隨著時(shí)代產(chǎn)生了一些根本性的變化,人們可以更好、更多地利用數(shù)據(jù)對(duì)信息進(jìn)行管理,對(duì)管理方式進(jìn)行創(chuàng)新。金融平臺(tái)正進(jìn)行著一場(chǎng)數(shù)據(jù)服務(wù)的變革,其中最凸顯的一項(xiàng)技術(shù)服務(wù)就是個(gè)性化推薦技術(shù)。針對(duì)不同的消費(fèi)者的不同屬性,提供相對(duì)應(yīng)的個(gè)性化服務(wù)[1]。這解決了客戶對(duì)于琳瑯滿目的商品難以選擇的問題,增加了用戶對(duì)金融平臺(tái)產(chǎn)品的興趣度,使金融平臺(tái)有了更多的機(jī)會(huì)提高產(chǎn)品的成交量,吸引了更多的用戶群體,也減少了平臺(tái)的運(yùn)營(yíng)成本[2]。

        根據(jù)個(gè)性化推薦模型的特點(diǎn)來說,個(gè)性化推薦方法通常分為基于規(guī)則的推薦、基于內(nèi)容的推薦、基于協(xié)同過濾的推薦三種基本的方法[3]。 基于規(guī)則的推薦以關(guān)聯(lián)規(guī)則挖掘方法為核心,通過從大量的客戶購(gòu)買商到客戶的購(gòu)買模式,結(jié)合客戶的歷史購(gòu)買行為,產(chǎn)生對(duì)目標(biāo)客戶的推薦列表?;趦?nèi)容的推薦通過分析客戶已購(gòu)買產(chǎn)品或已評(píng)價(jià)對(duì)象的特征獲取相應(yīng)客戶的興趣描述,通過比較客戶與產(chǎn)品或?qū)ο笾g的相似性實(shí)現(xiàn)推薦?;趨f(xié)同過濾推薦是尋找與目標(biāo)客戶相似的客戶集的購(gòu)買產(chǎn)品或評(píng)分情況來預(yù)測(cè)目標(biāo)客戶對(duì)產(chǎn)品的購(gòu)買興趣或評(píng)分,以此來進(jìn)行推薦?;谝?guī)則的、基于內(nèi)容的以及基于協(xié)同過濾的推薦算法由于自身算法的特點(diǎn),在實(shí)際應(yīng)用中都存在相應(yīng)的缺陷,所以對(duì)于如今的個(gè)性化推薦系統(tǒng)一般都是由這三種推薦方法混合而成的推薦模型。

        通過了解,大多數(shù)個(gè)性化推薦系統(tǒng)中所用到的數(shù)據(jù)都是通過個(gè)性化信息服務(wù)應(yīng)用的相關(guān)技術(shù)來提取得到的[4],其中提取的方法和推薦模型的建立都是比較復(fù)雜耗時(shí)的。針對(duì)這點(diǎn)文章提出了一種更為可靠高效的推薦模型。其中對(duì)數(shù)據(jù)和特征的選擇和提取更為方便。我們使用MySQL數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)的篩選,得到我們想要的數(shù)據(jù);再?gòu)男碌臄?shù)據(jù)鏈表中提取我們所需要的特征;最后通過調(diào)試神經(jīng)網(wǎng)絡(luò)的參數(shù),訓(xùn)練并建立好預(yù)測(cè)模型。通過實(shí)驗(yàn)數(shù)據(jù)的表明,新生產(chǎn)的個(gè)性化推薦模型的推薦質(zhì)量有更好的表現(xiàn)。

        1 個(gè)性化推薦模型的建立

        1.1 個(gè)性化推薦模型特征的提取

        相對(duì)于大多數(shù)基于大數(shù)據(jù)的個(gè)性化服務(wù)應(yīng)用的主要技術(shù),如數(shù)據(jù)挖掘技術(shù)、協(xié)同過濾技術(shù)等都需從客戶對(duì)項(xiàng)目的瀏覽情況、對(duì)項(xiàng)目的評(píng)分或其他可代表客戶對(duì)項(xiàng)目興趣的數(shù)據(jù)用來分析[5],作為特征建模。這些數(shù)據(jù)的收集、處理一般都是比較復(fù)雜和耗時(shí)的。針對(duì)這個(gè)問題本次實(shí)驗(yàn)選用的特征是比較方便收集和表示的。

        1.1.1 用戶類型特征的選取

        平臺(tái)對(duì)于所有用戶一般有一個(gè)分類的管理。分類的方法一般是平臺(tái)按某種算法對(duì)用戶進(jìn)行分類,或者是用戶自己選擇自己適合的類型。這些類型數(shù)據(jù)經(jīng)過分析可以反應(yīng)出用戶的某種購(gòu)買特征,對(duì)于個(gè)性化推薦是十分重要的。

        1.1.2 用戶購(gòu)買特征的選取

        參考用戶以往的購(gòu)買記錄也是對(duì)個(gè)性化推薦系統(tǒng)十分有價(jià)值的。用戶以往的購(gòu)買記錄往往包含著用戶一直以來的購(gòu)買習(xí)慣和興趣項(xiàng)目,所以對(duì)用戶購(gòu)買項(xiàng)目的數(shù)據(jù)進(jìn)行提取和分析,將得到很多重要的信息。通過對(duì)比其他個(gè)性化推薦方法,也涉及用到這類數(shù)據(jù)進(jìn)行特征的提取。

        1.2 預(yù)測(cè)模型的選擇

        鑒于本次實(shí)驗(yàn)所需預(yù)測(cè)的關(guān)系比較直觀,該個(gè)性化推薦方案使用BP神經(jīng)網(wǎng)絡(luò)來進(jìn)行興趣項(xiàng)目的預(yù)測(cè)。

        BP神經(jīng)網(wǎng)絡(luò)模型[6]:

        BP神經(jīng)網(wǎng)絡(luò)是當(dāng)前功能強(qiáng)大、理論體系完善的一種機(jī)器學(xué)習(xí)算法,也是人工神經(jīng)網(wǎng)絡(luò)中使用最廣泛的神經(jīng)網(wǎng)絡(luò)模型。

        BP神經(jīng)網(wǎng)絡(luò)一般層數(shù)較少、網(wǎng)絡(luò)結(jié)構(gòu)較為簡(jiǎn)單。其中每個(gè)(除輸出層的神經(jīng)元)神經(jīng)元可以連接多個(gè)神經(jīng)元,每個(gè)連接通道都對(duì)應(yīng)著連接權(quán)系數(shù)wij和偏置參數(shù)bij。通過對(duì)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,也即是對(duì)wij和bij的調(diào)整來使神經(jīng)網(wǎng)絡(luò)的輸出能達(dá)到預(yù)期的目標(biāo)值[7]。

        2 實(shí)驗(yàn)方法和過程

        本次實(shí)驗(yàn)使用Prosper貸款平臺(tái)數(shù)據(jù)進(jìn)行研究分析,找出用戶感興趣的項(xiàng)目類型,以此作為依據(jù)給用戶推薦。其中涉及數(shù)據(jù)的選擇與提取、特征的提取、訓(xùn)練和預(yù)測(cè)及實(shí)驗(yàn)等環(huán)節(jié)。

        2.1 數(shù)據(jù)的選擇與提取

        我們拿到的Prosper貸款平臺(tái)的數(shù)據(jù)①是xml格式的大文件,不方便讀取和操作;所以我們使用MySQL數(shù)據(jù)庫(kù)對(duì)原始數(shù)據(jù)進(jìn)行讀取和數(shù)據(jù)的拆分。原始數(shù)據(jù)的讀取得到的信息非常雜亂,而對(duì)于本次個(gè)性化推薦方案,我們只需從數(shù)據(jù)中選擇能代表用戶興趣的原始數(shù)據(jù)來做分析。最后提取了5個(gè)數(shù)據(jù)鏈表用于后續(xù)實(shí)驗(yàn)。

        5個(gè)數(shù)據(jù)鏈表如表1。

        2.2 特征的提取

        對(duì)已提取的數(shù)據(jù)進(jìn)行特征的提取,為后面預(yù)測(cè)模型的輸入做準(zhǔn)備。

        其中篩選出具有200個(gè)項(xiàng)目以上(更具代表性)的用戶作為樣本,樣本特征的提取主要是從5個(gè)已提取的數(shù)據(jù)鏈表中提取,得到3個(gè)特征。其中的3個(gè)特征分別是:

        2.2.1 用戶所在組的類別特征

        客戶一般會(huì)在平臺(tái)新建用戶的時(shí)候,選擇自己感興趣的組(一個(gè)組一般有一個(gè)或者多個(gè)感興趣的類別),所以組的信息中有代表用戶興趣的特征。

        該特征的表現(xiàn)形式是(9,1)的向量,因?yàn)榻M里包含的類別信息最多9個(gè)。

        2.2.2 用戶參與項(xiàng)目的類別特征

        這一特征的信息包含的是用戶以往參與平臺(tái)各個(gè)類型項(xiàng)目的數(shù)據(jù)統(tǒng)計(jì)。

        項(xiàng)目類別總共有20個(gè),所以以(20,1)的向量表示該特征。

        2.2.3 用戶感興趣項(xiàng)目類別;(選擇了用戶參加項(xiàng)目數(shù)量前三名的類別作為用戶感興趣的的項(xiàng)目類別,其余的為不感興趣的類別)。

        預(yù)測(cè)模型主要針對(duì)這一特征進(jìn)行判斷,判斷用戶是否對(duì)該項(xiàng)目有興趣。

        該特征表示的是20個(gè)項(xiàng)目類別的其中一個(gè),采用(1,1)的向量表示。

        2.3 實(shí)驗(yàn)結(jié)果與分析

        本次實(shí)驗(yàn)的目的是使用購(gòu)買項(xiàng)目多的用戶數(shù)據(jù)進(jìn)行訓(xùn)練,來預(yù)測(cè)項(xiàng)目少的用戶的興趣類型。

        通過MySQL數(shù)據(jù)庫(kù)對(duì)數(shù)據(jù)的整理,得到的可訓(xùn)練樣共3000個(gè),抽取2400個(gè)作為訓(xùn)練樣本,600個(gè)作為測(cè)試樣本,實(shí)驗(yàn)每次100個(gè)樣本輸入模型,預(yù)計(jì)訓(xùn)練2000次(查準(zhǔn)率趨于穩(wěn)定,自動(dòng)結(jié)束本次訓(xùn)練)。使用交叉驗(yàn)證的方式進(jìn)行實(shí)驗(yàn)。

        根據(jù)個(gè)性化推薦方案模型預(yù)測(cè)的結(jié)果,分析該推薦系統(tǒng)的推薦質(zhì)量。

        選用的分析指標(biāo)有:

        2.3.1 查準(zhǔn)率[8]

        該指標(biāo)表明預(yù)測(cè)模型對(duì)客戶的個(gè)性化推薦與客戶興趣的相關(guān)性。

        2.3.2 迭代時(shí)間

        該指標(biāo)表明模型訓(xùn)練所耗時(shí)間。(主要針對(duì)客戶數(shù)據(jù)更新時(shí),模型的重新建立所需消耗資源的體現(xiàn))

        本文主要以查準(zhǔn)率和迭代時(shí)間表示個(gè)性化推薦系統(tǒng)的推薦質(zhì)量,并使用了交叉驗(yàn)證保證其可靠性。

        通過圖3、圖4,我們可以計(jì)算出:

        5次模型訓(xùn)練的查準(zhǔn)率 =[0.96173042,0.96333331,

        0.96333331,0.96333331,0.96327209]

        5次模型訓(xùn)練的(達(dá)到最高查準(zhǔn)率的)迭代時(shí)間= [2.7099998,8.81200004,

        9.95000005,3.18400002,6.27800012]

        5次模型訓(xùn)練的平均查準(zhǔn)率=0.96300,平均訓(xùn)練時(shí)間=6.186800,平均迭代次數(shù)=149.600。

        其中考慮到神經(jīng)網(wǎng)絡(luò)訓(xùn)練中加入了dropout函數(shù),其函數(shù)的隨機(jī)性對(duì)訓(xùn)練影響,我們選用了多次模型訓(xùn)練中耗時(shí)最長(zhǎng)的一次實(shí)驗(yàn)作為參考,根據(jù)數(shù)據(jù)分析,可以看到個(gè)性化推薦模型的推薦質(zhì)量較為理想,其查準(zhǔn)率高達(dá)96.3%,訓(xùn)練時(shí)間最長(zhǎng)也不超過10s。較短的訓(xùn)練時(shí)長(zhǎng)對(duì)于個(gè)性化推薦系統(tǒng)以后的模型更新也是非常方便的。

        本次實(shí)驗(yàn)由于選擇了更具代表性的特征進(jìn)行訓(xùn)練,通過不斷調(diào)參的神經(jīng)網(wǎng)絡(luò),訓(xùn)練出的預(yù)測(cè)模型在查準(zhǔn)率和迭代時(shí)間兩個(gè)指標(biāo)上更為良好。

        3 結(jié)語(yǔ)

        隨著大數(shù)據(jù)時(shí)代的到臨,各行各業(yè)信息過載將越來越凸顯。如何根據(jù)用戶個(gè)人習(xí)慣來找出用戶的興趣特征進(jìn)行個(gè)性化推薦是一個(gè)重要的研究領(lǐng)域。本文是針對(duì)Prosper貸款平臺(tái)數(shù)據(jù)的個(gè)性化推薦方案,解決購(gòu)買項(xiàng)目少、興趣特征不明顯的用戶的個(gè)性化推薦問題;并且還具有模型訓(xùn)練快速,推薦質(zhì)量高的特點(diǎn)。

        還需要說明的是,該方案僅是依據(jù)實(shí)驗(yàn)中所提的3個(gè)特征,對(duì)于用戶而言還有其他數(shù)據(jù)中隱含著代表用戶興趣特征的數(shù)據(jù)可供使用。利用更多類型的數(shù)據(jù)有可能會(huì)提高個(gè)性化推薦質(zhì)量,這可以在日后工作中進(jìn)行鉆研和完善。

        注釋:

        ①原始數(shù)據(jù)參考網(wǎng)址:https://www.prosper.com/Downloads/Services/Documentation/ProsperDataExport_Details.html。

        參考文獻(xiàn):

        [1]喬嵐.基于大數(shù)據(jù)技術(shù)的個(gè)性化推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].信息與電腦(理論版),2017(21):70-72.

        [2]胡一.基于大數(shù)據(jù)的電子商務(wù)個(gè)性化信息推薦服務(wù)模式研究[D].吉林大學(xué),2015.

        [3]葉紅云.面向金融營(yíng)銷問題的個(gè)性化推薦方法研究[D].合肥工業(yè)大學(xué),2011.

        [4]韓莉.大數(shù)據(jù)時(shí)代的個(gè)性化推薦技術(shù)分析[J].晉中學(xué)院學(xué)報(bào),2016,33(03):74-77.

        [5]馬相春,鐘紹春,徐妲.大數(shù)據(jù)視角下個(gè)性化自適應(yīng)學(xué)習(xí)系統(tǒng)支撐模型及實(shí)現(xiàn)機(jī)制研究[J].中國(guó)電化教育,2017(04):97-102.

        [6]周志華.機(jī)器學(xué)習(xí)[M].北京:清華大學(xué)出版社,2016:97.

        [7]戚德虎,康繼昌.BP神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)[J].計(jì)算機(jī)工程與設(shè)計(jì),1998(02):47-49.

        [8]余力,劉魯.電子商務(wù)個(gè)性化推薦研究[J].計(jì)算機(jī)集成制造系統(tǒng),2004(10):1306-1313.

        猜你喜歡
        個(gè)性化推薦數(shù)據(jù)
        基于遠(yuǎn)程教育的個(gè)性化知識(shí)服務(wù)研究
        東方教育(2016年8期)2017-01-17 19:47:27
        基于鏈?zhǔn)酱鎯?chǔ)結(jié)構(gòu)的協(xié)同過濾推薦算法設(shè)計(jì)與實(shí)現(xiàn)
        個(gè)性化推薦系統(tǒng)關(guān)鍵算法探討
        基于協(xié)同過濾算法的個(gè)性化圖書推薦系統(tǒng)研究
        溫室控制系統(tǒng)及控制方法的研究
        公路工程試驗(yàn)檢測(cè)存在的問題及措施
        文本數(shù)據(jù)挖掘在電子商務(wù)網(wǎng)站個(gè)性化推薦中的應(yīng)用
        商(2016年34期)2016-11-24 16:28:51
        焊接工藝仿真訓(xùn)練系統(tǒng)中焊點(diǎn)數(shù)據(jù)的建立方法
        一種借助數(shù)據(jù)處理構(gòu)建的智能食堂管理系統(tǒng)
        數(shù)據(jù)化藝術(shù)的生成探究
        亚洲成av人综合在线观看 | 正在播放东北夫妻内射| 在线a免费观看| 欧美一级人与嘼视频免费播放| 国产女主播免费在线观看| 男男亚洲av无一区二区三区久久| 久久天天躁夜夜躁狠狠85麻豆| 久久久av精品波多野结衣| 一级片久久| 又色又爽又黄的视频网站| 亚洲无av高清一区不卡| 亚洲乱码中文字幕在线| 夜先锋av资源网站| 先锋影音av资源我色资源| 国产资源在线视频| 国产一区二区美女主播| 神马影院日本一区二区| s级爆乳玩具酱国产vip皮裤| 亚洲欧美国产日韩字幕| 亚洲中文字幕高清乱码毛片| 一区二区三区人妻少妇| 久久夜色精品国产噜噜亚洲av| 国产精品6| 国产激情视频在线观看你懂的| 真实夫妻露脸爱视频九色网| 人人妻人人澡人人爽人人精品97| 8av国产精品爽爽ⅴa在线观看| 偷拍一区二区三区黄片| 成年美女黄的视频网站| 播放灌醉水嫩大学生国内精品| 亚洲精品国产综合久久一线| 四虎在线中文字幕一区| 青青草免费在线爽视频| 一边吃奶一边摸做爽视频| 亚洲国产精品线观看不卡| 人妻有码中文字幕在线| 国产一区二区三区在线观看完整版 | 精品蜜桃视频在线观看| 亚洲乱码中文在线观看| 欧美成免费a级毛片| 试看男女炮交视频一区二区三区|