亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于模型融合的網絡用戶數據預測優(yōu)化

        2019-05-06 09:08:14任金虎李亞楠王艷玲
        科技創(chuàng)新導報 2019年36期

        任金虎 李亞楠 王艷玲

        摘? ?要:目前互聯(lián)網軟件的功能調整和改進方案主要以用戶的行為習慣為依據進行調整。為了高效利用現(xiàn)有用戶數據進行用戶行為、用戶傾向等分析與預測,本文通過對包括多種用戶在線行為的數據進行分析。首先對用戶傾向評估產生較大影響的屬性值進行權值分析,將已有的特征值綜合整合后生成全面的用戶行為數據;再對行為數據中的同類行為進行細化分級,強化行為指向。通過使用模型融合的方法針對單模型進行優(yōu)化和處理,進一步提高預測準確率。

        關鍵詞:模型融合? 滑窗法? XGBoost? BI-LSTM

        如何建立新的運營處理模式、有效利用現(xiàn)有數據制定合適的營銷機制、改進和調整軟件的功能,達到吸引目標用戶、保持用戶粘度的目的,將是每個互聯(lián)網企業(yè)在大數據時代的核心問題。而對“活躍用戶”(將會在未來一段時間內登錄軟件的用戶)的行為數據進行有效分析和預測是軟件功能改進和企業(yè)服務質量提升的重要途徑之一。

        本文以短視頻APP的用戶數據為例進行分析與預測,以前30d的用戶數據作為數據集,以后7d登錄的用戶id作為測試集,以XGBoost模型、LGB模型和BI-LSTM模型作為子模型進行模型融合建立綜合預測模型,預測將會在未來7天內登錄的“活躍用戶”。在進行用戶數據的分析過程中,由于行為分類較為復雜,需將行為因素分級考慮。一方面對于主動動作用戶(主動發(fā)起點贊、轉發(fā)、拉黑等動作的用戶)自身,針對連續(xù)較長時間活動的用戶進行篩選并增加其優(yōu)先級。另一方面對于被動動作用戶(被動接受上述動作的用戶),針對不同分類的動作進行分類處理。

        1? 模型融合技術簡介

        模型融合( Model Ensemble )是一種通過構建并融合多個模型來完成學習任務,從而提高機器學習效率的方法。

        圖1是一種常見的模型融合結構。其主要包含兩個階段:構建若干單模型( Single Model)和模型融合。單模型通常是由基本的學習算法在訓練集上學習得到的,它們可以是決策樹、神經網絡或者其他類型的學習算法。

        在單模型多樣性較大情況下,嘗試模型融合極有可能取得顯著的效果提升。因此,選擇一些單模型特征與多個單模型融合在一起進行訓練,融合模型的泛化能力在某些場景下效果會更好。但應注意,線上系統(tǒng)對預測或分類服務的響應速度通常要求較高,線上特征獲取和模型預測會消耗一定時間,而多階模型融合只能以串行的方式來運算。因此,在線上系統(tǒng)使用模型融合要謹慎。

        2? 單模型建立與處理

        2.1 數據分析與處理

        2.1.1 用戶數據說明

        主要數據集信息如下:

        注冊日志(user_register_log.txt):包括用戶注冊時的基礎信息。

        APP啟動日志(app_launch_log.txt):包括前30天內用戶登錄的精確時間。

        拍攝行為日志(video_create_log.txt):包括用戶使用APP拍攝功能的日期等。

        用戶行為日志(user_activity_log.txtt):包括用戶的點贊、轉發(fā)等各種行為記錄。

        2.1.2 滑窗法劃分數據集

        使用滑窗法來構造樣本格式,不僅能給數據賦予標簽值,同時還可以劃分多個訓練測試集用以完善模型。針對數據量較小的情況,通過滑動窗口增加樣本數量,可覆蓋更多數據,提高模型學習效率。

        2.1.3 特征提取

        若僅用表中所給的數據作為目標值進行預測,結果準確率有限。因此需要在四個表中分別提取特征、添加目標值。在拍攝行為日志中,對其次數進行統(tǒng)計并將創(chuàng)建視頻相隔的天數的均值,方差,峰度等提取作為新的七個特征;在啟動日志和用戶行為日志中,在page列里統(tǒng)計0 1 2 3 4的個數并且統(tǒng)計其占總個數的頻次,以該方式提取100余個特征。

        由于注冊方式來源、登錄拍攝與行為次數值極值相差過大或數據過于離散,此時采用歸一化的方法對數據集進行處理更有利于分類和預測。

        2.2 兩個基于GBDT的模型實現(xiàn)——以XGBoost為例

        在數據集中,不同的用戶的行為是不一樣的,在此選取其中的多個維度、多種特征,可通過 GBDT綜合分析它們對用戶活躍度結果產生的影響。其改進后的XGBoost模型可在相對短的時間內對大型數據源做出良好的效果;而LGB模型因其更快的訓練效率、更低的內存使用、更高的準確率等優(yōu)勢,更適用于處理較大規(guī)模數據。在此以XGBoost模型的處理過程為例。

        (1)XGBoost模型的參數調節(jié)與優(yōu)化。

        XGBoost在訓練開始時進行一次預處理后,使用平均絕對誤差對結果進行衡量,從而提高之后每次迭代的效率。在進行交叉驗證得到第一個基準后,建立數量為100的樹模型,得到比前者數據0.45更加可靠的新紀錄 MAE = 0.445。樹的最大深度(max_depth)和正則化參數(min_child_weight)對XGBoost性能影響最大,應優(yōu)先進行調整。

        在得到目前最好的結果后,降低學習速度,同時增加更多的估計量。對比后發(fā)現(xiàn),學習率較低的效率提升更明顯。

        2.3 BI-LSTM模型實現(xiàn)

        2.3.1 時序特征處理

        對記錄數進行可視化分析發(fā)現(xiàn)其頻次變動的模式有很強的非線性趨勢性,因此選擇對輸入序列分別進行加一取對數處理的方法,更有易于觀察變化趨勢而且能夠有效防止過擬合。

        2.3.2 參數調整

        優(yōu)化學習速率和動量因子。選取一組較小學習速率和動量因子的取值范圍:從0.2到0.8,步長為0.2,以及0.9。調優(yōu)Dropout正則化。采用取值范圍為0.0-0.9(1.0無意義)的dropout percentages和范圍為0-5的最大范數權值約束(maxnorm weight constraint)。

        3? 模型融合

        對已有三個模型結果進行分析,具體分析包括了每個模型的精確率,召回率與F1值。

        最后將XGB模型、LGB模型與BI-LSTM模型作為三個單模型進行模型融合,以三種模型的最終F1值作為參考,調整融合權重比:

        XGB:LGB:BI-LSTM≈ 0.31:0.31:0.38

        之后通過調整閾值得到最終預測模型,預測準確率保持在90%左右。

        4? 結語

        本文采用的算法通過使用XGBoost處理普通特征、基于LGB和神經網絡的算法優(yōu)化和模型融合處理,精確預測得到未來一段時間內的“活躍用戶”id,為互聯(lián)網企業(yè)進行軟件功能調整以及提出可靠的用戶推送方案提供準確數據參考。

        參考文獻

        [1] 韓家煒. 數據挖掘概念與技術[M].北京:機械工業(yè)出版社,2007.

        [2] 美 Megan Squire.干凈的數據—數據清洗入門與實踐[M].北京:人民郵電出版社,2016.

        [3] 梁軍,柴玉梅,原慧斌,等.基于極性轉移和LSTM遞歸網絡的情感分析[J].中文信息學報,2015,29(5):152-159.

        [4] 連克強.基于Boosting的集成樹算法研究與分析[D].中國地質大學(北京),2018

        [5] 王華勇,楊超,唐華.基于LightGBM改進的GBDT短期負荷預測研究[J].自動化儀表,2018,39(9):76-78,82.

        [6] 周飛燕,金林鵬,董軍.卷積神經網絡研究綜述[J].計算機學報,2017,40(6):1229-1251.

        [7] 林珠,邢延.數據挖掘中適用于分類的時序數據特征提取方法[J].計算機系統(tǒng)應用,2012,21(10):224-229.

        [8] 王毅,謝娟,成穎.結合BI-LSTM和CNN混合架構的深度神經網絡語言模型[J].情報學報,2018,37(2):194-205.

        国产精品人妻一码二码尿失禁| 麻豆亚洲av熟女国产一区二| 亚洲av成人无码久久精品老人| 无码av中文一区二区三区桃花岛| 成午夜精品一区二区三区| 国产成本人片无码免费2020| 性色av无码一区二区三区人妻| 风流少妇又紧又爽又丰满| 在线观看亚洲AV日韩A∨| 国产成人综合亚洲精品| 本道无码一区二区久久激情| 无码高潮少妇毛多水多水免费| 精品亚亚洲成av人片在线观看| 亚洲一区二区日韩精品| 在线观看麻豆精品视频| 精品午夜福利在线观看| 久久精品女人天堂av| 久久久精品2019中文字幕之3| 亚洲国产一区二区三区,| 精品久久精品久久精品| 国产一区二区三区我不卡| 亚洲精品无码久久久影院相关影片 | 无码国产福利av私拍| 丰满人妻被中出中文字幕| 好吊妞人成免费视频观看| 午夜亚洲国产精品福利| 色偷偷亚洲女人的天堂| 91熟女av一区二区在线| 九九九免费观看视频| 亚洲熟妇少妇任你躁在线观看无码 | 成人美女黄网站色大免费的| 久久青草免费视频| 99精品国产自产在线观看| 日本高清无卡一区二区三区| 国产亚洲午夜精品久久久| 午夜精品久久久久久久99老熟妇 | 亚洲熟女熟妇另类中文| 免费国产自拍在线观看| 夜夜躁狠狠躁日日躁2022| 免费a级毛片出奶水| 久久99精品波多结衣一区|