亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于異源集成算法的用戶購(gòu)買(mǎi)行為預(yù)測(cè)分析

        2022-07-11 07:44:18陳靜靜
        電子技術(shù)與軟件工程 2022年10期
        關(guān)鍵詞:神經(jīng)網(wǎng)絡(luò)森林深度

        陳靜靜

        (阿里巴巴集團(tuán)控股有限公司 浙江省杭州市 311121)

        在電子商務(wù)時(shí)代背景下,互聯(lián)網(wǎng)與物聯(lián)網(wǎng)得到了廣泛地普及,越來(lái)越多的人習(xí)慣在網(wǎng)上進(jìn)行購(gòu)物,在此背景下,更好地了解用戶的購(gòu)物偏好,成為了電商為用戶提供精準(zhǔn)服務(wù)、提升自身經(jīng)濟(jì)效益的重要舉措?,F(xiàn)階段,為了更好地滿足電商的發(fā)展需要,以異源集成算法為基礎(chǔ),對(duì)用戶的購(gòu)買(mǎi)行為加以分析,成為了一項(xiàng)極為必要的舉措。

        1 預(yù)測(cè)分析用戶購(gòu)買(mǎi)行為的意義

        電子商務(wù)在中國(guó)發(fā)展二十余年,中國(guó)的電子商務(wù)占全球互聯(lián)網(wǎng)零售總額的50%以上,但并沒(méi)有止步于此,目前中國(guó)電子商務(wù)的發(fā)展速度仍快于其他地區(qū)。電商上市公司數(shù)量不斷增加,電商平臺(tái)商品種類(lèi)越發(fā)豐富,切實(shí)滿足了人們的產(chǎn)品消費(fèi)需要,這一情況的出現(xiàn)很可能增大用戶商品購(gòu)買(mǎi)的倦怠感,進(jìn)而降低商品的成交率。現(xiàn)階段,為切實(shí)解決上述問(wèn)題,電商平臺(tái)方面可以通過(guò)合理應(yīng)用異源集成算法,對(duì)用戶購(gòu)買(mǎi)行為數(shù)據(jù)進(jìn)行調(diào)查分析,對(duì)用戶的購(gòu)買(mǎi)習(xí)慣進(jìn)行合理預(yù)測(cè),并借助平臺(tái),自動(dòng)為用戶推薦符合用戶使用需要的商品的方式,進(jìn)一步加快用戶搜尋所需商品的速度,在提升用戶購(gòu)物體驗(yàn)的同時(shí),提高了電商平臺(tái)的商品轉(zhuǎn)化率,從而為電商企業(yè)長(zhǎng)期穩(wěn)定發(fā)展提供有效的支持。

        2 預(yù)測(cè)分析用戶購(gòu)買(mǎi)行為的方法

        對(duì)于當(dāng)前的電商行業(yè)來(lái)說(shuō),預(yù)測(cè)是為用戶提供商品推薦的基礎(chǔ)。近年來(lái),隨著信息技術(shù)的飛速發(fā)展,電商平臺(tái)可以應(yīng)用異源集成算法對(duì)用戶的歷史購(gòu)買(mǎi)行為進(jìn)行挖掘與分析,找出用戶的購(gòu)買(mǎi)行為特征、消費(fèi)偏好,總結(jié)用戶的行為發(fā)生規(guī)律,并以此為基礎(chǔ)對(duì)用戶未來(lái)的購(gòu)買(mǎi)行為加以預(yù)測(cè),為商品的精準(zhǔn)推送、營(yíng)銷(xiāo)提供可靠的依據(jù),從而達(dá)到切實(shí)提升平臺(tái)服務(wù)質(zhì)量的目的。

        2.1 機(jī)器學(xué)習(xí)算法

        在當(dāng)前的用戶購(gòu)買(mǎi)行為預(yù)測(cè)分析過(guò)程中,機(jī)器學(xué)習(xí)算法理論得到了廣泛的應(yīng)用,并且相較于用戶購(gòu)物行為預(yù)測(cè)算法,機(jī)器學(xué)習(xí)算法可以有效提升用戶購(gòu)物行為預(yù)測(cè)的準(zhǔn)確度。

        2.1.1 邏輯回歸

        2.1.2 支持向量機(jī)

        表1: 2017 年12 月-2021 年12 月我國(guó)網(wǎng)購(gòu)用戶規(guī)模及使用情況

        2.1.3 隨機(jī)森林

        隨機(jī)森林算法是一種以決策樹(shù)作為基本單元的算法,在實(shí)際應(yīng)用過(guò)程中,利用集成學(xué)的思想對(duì)多個(gè)相互不存在關(guān)聯(lián)性的樹(shù)進(jìn)行集成,在新樣本進(jìn)入隨機(jī)森林時(shí),每棵樹(shù)都會(huì)與樣本進(jìn)行比對(duì),并應(yīng)用集合策略對(duì)最終結(jié)果加以預(yù)測(cè)?,F(xiàn)階段,隨機(jī)森林算法較為常用的場(chǎng)景包括判斷用戶是否存在購(gòu)買(mǎi)行為、用戶下次購(gòu)買(mǎi)商品的日期歸屬等。在隨機(jī)森林算法構(gòu)建時(shí),首先要以原始訓(xùn)練樣本集N 誒基礎(chǔ),利用自助法,隨機(jī)從N 中有放回的選取n 個(gè)樣本,并將這n 個(gè)樣本做成一個(gè)新的訓(xùn)練集;其次,從樣本所有特征中隨機(jī)選取K 個(gè)特征值,并以決策樹(shù)學(xué)習(xí)算法為基礎(chǔ),從K 中計(jì)算、選擇出最優(yōu)化分特征,使之行為新的決策樹(shù);最后,重復(fù)上述兩個(gè)步驟m 次,生成由m 棵決策樹(shù)構(gòu)成的隨機(jī)森林。

        2.1.4 梯度提升決策樹(shù)

        2.1.5 卷積神經(jīng)網(wǎng)絡(luò)

        卷積神經(jīng)網(wǎng)絡(luò)作為一種深度學(xué)習(xí)算,是由深度卷積計(jì)算以及具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò)共同組成的,在實(shí)際應(yīng)用過(guò)程中,這一算法區(qū)別于輸入層與隱藏層全連接的傳統(tǒng)神經(jīng)網(wǎng)絡(luò)算法,可以通過(guò)引入卷積層與池化層的方式,實(shí)現(xiàn)特征的自我選擇,同時(shí)該卷積神經(jīng)網(wǎng)絡(luò)可以通過(guò)局部連接的神經(jīng)元、下采樣技術(shù)、權(quán)值共享技術(shù)簡(jiǎn)化網(wǎng)絡(luò)系統(tǒng),提升算法訓(xùn)練的性能。

        2.1.6 深度森林2017 年,深度森林這一概念被首次提出,同時(shí)提出了以隨機(jī)森林微積分類(lèi)器的多粒度級(jí)聯(lián)森林深度樹(shù)集成方法,并且這一算法與一些和深度神經(jīng)網(wǎng)絡(luò)競(jìng)爭(zhēng)的領(lǐng)域表現(xiàn)出了較強(qiáng)的分類(lèi)性能。在實(shí)際應(yīng)用過(guò)程中,深度森林算法的成功離不開(kāi)神經(jīng)網(wǎng)絡(luò)逐層處理、內(nèi)部變化存在特征、復(fù)雜度足夠這三大特點(diǎn)。

        2.2 基于時(shí)間滑窗的特征構(gòu)建

        2.2.1 數(shù)據(jù)介紹

        對(duì)于電商平臺(tái)來(lái)說(shuō),用戶購(gòu)買(mǎi)行為數(shù)據(jù)預(yù)測(cè)的真實(shí)性、數(shù)據(jù)量的大小與預(yù)測(cè)評(píng)估模型質(zhì)量之間存在著直接的聯(lián)系,真實(shí)的數(shù)據(jù)集可以有效提升模型的質(zhì)量,強(qiáng)化模型的說(shuō)服力,并且在模型構(gòu)建過(guò)程中獲取的數(shù)據(jù)量與模型的穩(wěn)定性之間存在著正比例關(guān)系。本文在進(jìn)行用戶購(gòu)買(mǎi)行為數(shù)據(jù)預(yù)測(cè)模型設(shè)計(jì)時(shí),以京東平臺(tái)的真實(shí)用戶歷史行為數(shù)據(jù)作為基礎(chǔ)數(shù)據(jù)集,該數(shù)據(jù)集可以被分成商品基本信息表,用戶基本信息表,用戶行為表,用戶訂單表,評(píng)論分?jǐn)?shù)數(shù)據(jù)表這五個(gè)數(shù)據(jù)表,并且在進(jìn)行平臺(tái)模型構(gòu)建過(guò)程中,為避免用戶隱私的泄露,可以用User_ID 表示用戶標(biāo)識(shí)、sku_ID 表示商品標(biāo)識(shí)、用o_ID 表示下單標(biāo)識(shí)。

        2.2.2 數(shù)據(jù)分析

        對(duì)用戶的購(gòu)買(mǎi)行為進(jìn)行分析,可以發(fā)現(xiàn)在電商平臺(tái)挑選貨品時(shí),大部分用戶會(huì)先使用平臺(tái)的搜索功能,找出與自身所需購(gòu)買(mǎi)的商品,并瀏覽平臺(tái)頁(yè)面上展示出的不同品牌、不同規(guī)格、不同價(jià)格的商品,然后對(duì)商品的性價(jià)比加以比較,同時(shí),在商品比較挑選的過(guò)程中,用戶會(huì)產(chǎn)生諸如將商品加入購(gòu)物車(chē)、瀏覽商品用戶評(píng)價(jià)等一系列的操作行為。對(duì)當(dāng)前電商平臺(tái)用戶行為進(jìn)行收集比較后可以發(fā)現(xiàn),用戶的采購(gòu)習(xí)慣之間存在著一定的差異性,比方說(shuō),部分用戶要達(dá)到一定的瀏覽次數(shù)后才會(huì)產(chǎn)生購(gòu)買(mǎi)行為,也有部分用戶習(xí)慣先對(duì)心儀物品進(jìn)行關(guān)注,然后在關(guān)注列表中對(duì)這些商品進(jìn)行進(jìn)一步的分析與購(gòu)買(mǎi)。在當(dāng)前的用戶購(gòu)買(mǎi)行為預(yù)測(cè)過(guò)程中,可以通過(guò)可視化分析的方式對(duì)用戶的購(gòu)買(mǎi)習(xí)慣進(jìn)行收集與整理,從中挖掘出用戶的購(gòu)買(mǎi)規(guī)律與購(gòu)買(mǎi)偏好,從而使用戶購(gòu)買(mǎi)行為預(yù)測(cè)模型的構(gòu)建更有針對(duì)性,也更全面。若用購(gòu)買(mǎi)行為的稀疏度表示用戶在過(guò)去一年內(nèi)的購(gòu)買(mǎi)次數(shù);用戶的活躍度以及行為的重密度表示用戶瀏覽行為的發(fā)生次數(shù),那么在某段時(shí)間內(nèi),京東平臺(tái)上購(gòu)買(mǎi)次數(shù)在六次以內(nèi)的用戶數(shù)占比接近70%,用戶瀏覽關(guān)注行為在60次以內(nèi)的用戶數(shù)超過(guò)了七萬(wàn)人,用戶占比超過(guò)了70%,上述數(shù)據(jù)表示,當(dāng)前大部分電商平臺(tái)用戶瀏覽、關(guān)注、購(gòu)買(mǎi)的歷史行為數(shù)相對(duì)較少,數(shù)據(jù)集在整體上表現(xiàn)較為稀疏。同時(shí)用戶對(duì)牙膏、牙刷、衛(wèi)生紙等日用品類(lèi)的商品購(gòu)買(mǎi)行為存在一定的規(guī)律性,從理論上講,一個(gè)用戶兩次購(gòu)買(mǎi)行為的時(shí)間差,大多在某一時(shí)間范圍內(nèi),對(duì)用戶購(gòu)買(mǎi)同類(lèi)商品的持續(xù)規(guī)律進(jìn)行準(zhǔn)確分析,計(jì)算出用戶購(gòu)買(mǎi)該類(lèi)商品的間隔時(shí)間,可以為后續(xù)產(chǎn)品的推送、銷(xiāo)售工作的順利推進(jìn)提供有效的支持。同樣對(duì)某段時(shí)間內(nèi)京東平臺(tái)上用戶購(gòu)買(mǎi)行為的平均時(shí)間間隔進(jìn)行分析可以發(fā)現(xiàn),若用戶瀏覽或關(guān)注某商品的時(shí)長(zhǎng)小于20d,那么用戶購(gòu)買(mǎi)行為出現(xiàn)的可能性相對(duì)較高,若關(guān)注或?yàn)g覽的時(shí)長(zhǎng)在30-90d 內(nèi),那么用戶購(gòu)買(mǎi)該商品的可能性與時(shí)間長(zhǎng)短之間呈反比例關(guān)系。通過(guò)對(duì)用戶購(gòu)買(mǎi)行為的時(shí)間數(shù)據(jù)進(jìn)行橫向?qū)Ρ确治龊?,可以確定當(dāng)前電商平臺(tái)的時(shí)間滑動(dòng)窗口可以設(shè)置為三個(gè),其大小分別為30 天,90 天與180 天,并且窗口的權(quán)重依次遞減,分別設(shè)置為2、1.5 與1。

        2.2.3 數(shù)據(jù)處理

        完成用戶購(gòu)買(mǎi)行為數(shù)據(jù)集的采集后,為進(jìn)一步提升用戶采購(gòu)行為預(yù)測(cè)模型的準(zhǔn)確度,需要對(duì)數(shù)據(jù)進(jìn)行去除唯一屬性、數(shù)據(jù)去重、樣本均衡化、缺失值處理,從而得到一個(gè)更為準(zhǔn)確的特征數(shù)據(jù)集。在數(shù)據(jù)集處理完成后,需要對(duì)其中的正負(fù)樣本進(jìn)行統(tǒng)計(jì),在數(shù)據(jù)層面可以通過(guò)采樣技術(shù)達(dá)到數(shù)據(jù)的類(lèi)別平衡,現(xiàn)階段較為常用的數(shù)據(jù)采樣方法為SMOTE 采樣法,這一方法在實(shí)際使用過(guò)程中可以通過(guò)生成新的負(fù)樣本數(shù)對(duì)數(shù)據(jù)集加以平衡。

        2.3 基于深度森林的復(fù)購(gòu)預(yù)測(cè)模型

        在完成數(shù)據(jù)特征提取工作后,可以進(jìn)入用戶購(gòu)買(mǎi)行為預(yù)測(cè)模型的構(gòu)建與實(shí)驗(yàn)階段。

        2.3.1 實(shí)驗(yàn)準(zhǔn)備

        為保證模型搭建的可靠性,應(yīng)當(dāng)在正式構(gòu)建模型前,對(duì)其評(píng)估指標(biāo)加以確認(rèn),然后在明確數(shù)據(jù)提取特征的基礎(chǔ)上,選定合適的訓(xùn)練集與測(cè)試集的劃分方法。

        2.3.2 深度森林模型

        相較于其他模型構(gòu)建方式,深入森林算法可以利用多粒度掃描模塊進(jìn)一步增強(qiáng)輸入特征的差異性,同時(shí),由于深度神經(jīng)網(wǎng)絡(luò)有著較強(qiáng)的處理特征關(guān)系的能力,在深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的啟發(fā)下,深度森林模型在構(gòu)建應(yīng)用過(guò)程中,可以以多粒度掃描結(jié)構(gòu)為基礎(chǔ),對(duì)原始輸入數(shù)據(jù)特征進(jìn)行轉(zhuǎn)換,以便實(shí)現(xiàn)進(jìn)一步提升級(jí)聯(lián)森林特征提取工作質(zhì)量、提高初始特征表達(dá)能力的目的。同時(shí)受到深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中,表征學(xué)習(xí)需要對(duì)原始特征進(jìn)行逐層處理的影響,深度森林采用級(jí)聯(lián)結(jié)構(gòu),實(shí)現(xiàn)表中學(xué)習(xí)功能的完工。在實(shí)際應(yīng)用過(guò)程中,首先,每一層級(jí)聯(lián)結(jié)構(gòu)在工作前,都需要先接收并處理前一層聯(lián)機(jī)結(jié)構(gòu)輸出的特征數(shù)據(jù),然后對(duì)本層數(shù)據(jù)進(jìn)行處理,將綜合處理結(jié)果輸入到下一層。其次,該級(jí)聯(lián)結(jié)構(gòu)的每一集都是由若干個(gè)隨機(jī)森林組成,每個(gè)森林又有若干個(gè)決策樹(shù)集成而成,因此當(dāng)前的級(jí)聯(lián)森林結(jié)果可以被看作是集成的集成。

        2.3.3 復(fù)購(gòu)預(yù)測(cè)模型

        在完成用戶購(gòu)買(mǎi)行為預(yù)測(cè)分析模型的初步構(gòu)建后,可以通過(guò)對(duì)用戶復(fù)購(gòu)行為進(jìn)行預(yù)測(cè)的方式,進(jìn)一步提升用戶網(wǎng)購(gòu)行為預(yù)測(cè)的準(zhǔn)確性。在開(kāi)展深入森林構(gòu)建工作的過(guò)程中,模型構(gòu)建是森林構(gòu)建的核心。而森林的建立離不開(kāi)決策樹(shù)的支持,而構(gòu)成森林的決策的質(zhì)量與數(shù)量會(huì)對(duì)模型的訓(xùn)練效果與分類(lèi)效果產(chǎn)生直接的影響。現(xiàn)階段在購(gòu)進(jìn)深度森林模型時(shí),可以聯(lián)合多種模型、從多個(gè)角度對(duì)用戶的購(gòu)買(mǎi)行為進(jìn)行預(yù)測(cè)分析,以便為后續(xù)級(jí)聯(lián)模型種類(lèi)與超參數(shù)的設(shè)定提供有效的支持。經(jīng)過(guò)對(duì)上述京東某段時(shí)間內(nèi)用戶網(wǎng)購(gòu)行為進(jìn)行數(shù)據(jù)分析后,可以發(fā)現(xiàn)各森林模型整體均呈現(xiàn)新增加后續(xù)平穩(wěn)的發(fā)展趨勢(shì),同時(shí)在對(duì)模型的超參數(shù)進(jìn)行設(shè)置時(shí),不同的模型所選取的超參數(shù)也應(yīng)有所不同。

        2.3.4 實(shí)驗(yàn)分析

        在完成用戶購(gòu)買(mǎi)行為預(yù)測(cè)模型的初步搭建以及超參數(shù)值的確定工作后,可以通過(guò)實(shí)驗(yàn)分析的方式,多角度的對(duì)模型的表現(xiàn)情況進(jìn)行分析,調(diào)整預(yù)測(cè)模型帶入的參數(shù)值,為后續(xù)實(shí)驗(yàn)的開(kāi)展提供最優(yōu)的預(yù)測(cè)模型。具體來(lái)說(shuō),本文搭建的用戶購(gòu)買(mǎi)行為預(yù)測(cè)分析平臺(tái)為以Python 語(yǔ)言為基礎(chǔ),實(shí)驗(yàn)硬件環(huán)境為8g 內(nèi)存的英特爾i7-770cpu@3.60 兆赫茲,系統(tǒng)的處理器為Win 10 專(zhuān)業(yè)版。為更好地了解該用戶購(gòu)買(mǎi)行為預(yù)測(cè)分析模型的使用效果,可以通過(guò)引入傳統(tǒng)機(jī)器算法,并將兩者的邏輯回歸情況,支持向量機(jī)情況,決策數(shù),深度卷積神經(jīng)網(wǎng)絡(luò)集成算法隨機(jī)森林等內(nèi)容進(jìn)行預(yù)測(cè)與比對(duì)。通過(guò)比對(duì)后可以發(fā)現(xiàn),深度森林模型在用戶復(fù)購(gòu)行為預(yù)測(cè)上有著較好的效果,但相較于深度卷積神經(jīng)網(wǎng)絡(luò),深度森林模型優(yōu)勢(shì)并不明顯,但這一情況的存在并不影響深度森林模式,在電商平臺(tái)應(yīng)用場(chǎng)景下仍存在著較高的應(yīng)用優(yōu)勢(shì)。

        2.4 基于Stacking的日期預(yù)測(cè)模型

        為實(shí)現(xiàn)用戶一段時(shí)間內(nèi)購(gòu)買(mǎi)行為發(fā)生的時(shí)間范圍的準(zhǔn)確預(yù)測(cè),可以在完成用戶購(gòu)買(mǎi)行為細(xì)粒度預(yù)測(cè)后,以Stacking學(xué)習(xí)法思想為基礎(chǔ),搭建更為精準(zhǔn)的集成學(xué)習(xí)法框架,為預(yù)測(cè)工作的順利推進(jìn)提供有效的支持。

        2.4.1 Stacking 模型的介紹

        Stacking 是一種多層異源集成框架,兩層Stacking 算法是這一模型中應(yīng)用頻率較高的算法模型。對(duì)兩層Stacking 模型進(jìn)行分析后可以發(fā)現(xiàn),多個(gè)不同類(lèi)型的基學(xué)習(xí)機(jī)器共同組成了該模型的第一層,在這一模型的實(shí)際應(yīng)用過(guò)程中,訓(xùn)練時(shí)可以先向第一層輸入原始數(shù)據(jù)集,第一層基學(xué)習(xí)器會(huì)將自身訓(xùn)練得到的一次訓(xùn)練結(jié)果傳到第二層,由第二層模型對(duì)一次訓(xùn)練結(jié)果進(jìn)行二次訓(xùn)練處理,在兩次訓(xùn)練工作完成后,將會(huì)得到最終的訓(xùn)練結(jié)果。Stacking 模型集中了對(duì)多個(gè)不同模型的優(yōu)點(diǎn),相較于相互獨(dú)立的預(yù)測(cè)模型,這種多層異源集成模型非線性表達(dá)能力更為強(qiáng)大,在數(shù)據(jù)處理過(guò)程中,可以有效降低泛化誤差的出現(xiàn)概率。

        2.4.2 模型選擇

        在實(shí)際的用戶購(gòu)買(mǎi)行為預(yù)測(cè)體系構(gòu)建過(guò)程中,為降低模型的構(gòu)建難度,可以先試用較為簡(jiǎn)單的SVM、決策樹(shù)模型等傳統(tǒng)機(jī)器學(xué)習(xí)模型,但對(duì)這些模型的分析結(jié)果進(jìn)行整合研究后可以發(fā)現(xiàn),這些模型的輸入特征的利用率偏低,使得得到的模型存在欠擬合的問(wèn)題。面對(duì)這一情況,可以應(yīng)用CBDT、XGBoosts 等主流集成學(xué)習(xí)框架,使模型的非線性表達(dá)能力得到有效的增強(qiáng),需要注意的是,由于集成學(xué)習(xí)模型由多棵決策樹(shù)共同組成,在進(jìn)行分析時(shí),每棵樹(shù)都需要在節(jié)點(diǎn)分裂時(shí)掃描所有數(shù)據(jù)的計(jì)算分裂增益,并從中選出分裂正義最大的特征,并對(duì)其進(jìn)行分裂處理,這使得決策模型在應(yīng)用過(guò)程中需要對(duì)大量數(shù)據(jù)進(jìn)行多次情景處理,這在一定程度上增大了模型使用過(guò)程中的資源消耗、延長(zhǎng)了數(shù)據(jù)處理的時(shí)間、降低了模型的收斂速度。現(xiàn)階段,為切實(shí)解決上述問(wèn)題,在構(gòu)建模型的過(guò)程中,可以將LightGBM 集成學(xué)習(xí)算法引入其中,在進(jìn)一步提升訓(xùn)練速度的基礎(chǔ)上,有效降低了模型在數(shù)據(jù)分析時(shí)消耗的內(nèi)存,這一情況的出現(xiàn)使得該模型的長(zhǎng)期使用過(guò)程中,即便后期數(shù)據(jù)量持續(xù)增大,但仍能維持著較高穩(wěn)定性。需要注意的是,在以異源集成算法為基礎(chǔ),分析用戶購(gòu)買(mǎi)行為時(shí),為進(jìn)一步提升集成方法的準(zhǔn)確性,推動(dòng)基礎(chǔ)學(xué)習(xí)器的多樣化發(fā)展,成為了一項(xiàng)極為必要的工作。現(xiàn)階段,在模型構(gòu)建過(guò)程中,為進(jìn)一步提升基礎(chǔ)學(xué)習(xí)器的多樣性,可以將基于Bagging 的隨機(jī)森林算法引入模型體系搭建過(guò)程中,使LightGBM 與隨機(jī)森林算法模型共同組成Stacking 集成算法的第一層,通過(guò)這種方式,可以有效提升Stacking 模型的基礎(chǔ)學(xué)習(xí)器種類(lèi),并且通過(guò)對(duì)這些基礎(chǔ)學(xué)習(xí)器進(jìn)行整合處理的方式,可以有效避免因模型較為單一而出現(xiàn)較為明顯偏向性的問(wèn)題,進(jìn)一步提升預(yù)測(cè)結(jié)果的可靠性。

        2.4.3 算法描述

        在進(jìn)行模型構(gòu)建過(guò)程中,可以先輸入249 維特征向量數(shù)據(jù),并將這一數(shù)據(jù)作為輸入數(shù)據(jù)直接輸入到模型的第一層中,在模型構(gòu)建過(guò)程中,Stacking 算法框架第一層有3 個(gè)基于決策樹(shù)的模型,其中一個(gè)為隨機(jī)森林模型,另兩個(gè)為L(zhǎng)ightGBM 模型,這兩個(gè)模型的超參數(shù)設(shè)計(jì)不同,這種多樣化的模型構(gòu)建方式,有效提升了模型的數(shù)據(jù)分析準(zhǔn)確度。在模型工作時(shí),模型可以得到輸出結(jié)果Di,再對(duì)上述三個(gè)模型得到的輸出結(jié)果進(jìn)行拼接處理,則可以得到第一層的最終輸出D’,然后將D’輸入到第二層模型中,由第二層模型對(duì)輸出權(quán)重進(jìn)行計(jì)算,從而達(dá)到得出最終輸出結(jié)果的目的。

        2.4.4 日期預(yù)測(cè)評(píng)價(jià)函數(shù)

        3 結(jié)論

        總而言之,在互聯(lián)網(wǎng)技術(shù)飛速發(fā)展的背景下,人們的網(wǎng)購(gòu)行為越發(fā)頻繁,這一情況的出現(xiàn)增加了人們網(wǎng)購(gòu)的信息數(shù)據(jù),基于異源集成算法,對(duì)這些數(shù)據(jù)進(jìn)行細(xì)致地分析,可以使電商方面更好地了解用戶的購(gòu)物需要,更好地滿足用戶的購(gòu)物行為需求,從而為電商產(chǎn)品轉(zhuǎn)化率以及自身市場(chǎng)競(jìng)爭(zhēng)力的提升,提供有效的支持。

        猜你喜歡
        神經(jīng)網(wǎng)絡(luò)森林深度
        深度理解一元一次方程
        神經(jīng)網(wǎng)絡(luò)抑制無(wú)線通信干擾探究
        電子制作(2019年19期)2019-11-23 08:42:00
        深度觀察
        深度觀察
        深度觀察
        哈Q森林
        哈Q森林
        哈Q森林
        基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
        哈Q森林
        国产在线视频网友自拍| 超薄肉色丝袜一区二区| 国产免费一区二区三区最新不卡| 97久久综合区小说区图片区| 男女啪啪在线视频网站| 国产69精品久久久久app下载| 久久人人玩人妻潮喷内射人人| 美女一级毛片免费观看97| 国产自拍精品视频免费观看| 最新中文字幕人妻少妇| 亚洲精品久久久久中文字幕一福利| 97性视频| 亚洲国产精品午夜一区| av熟妇一区二区三区| 疯狂撞击丝袜人妻| 久久频精品99香蕉国产| 久久婷婷国产色一区二区三区| 亚洲国产a∨无码中文777| 国产在线精品成人一区二区三区| 日韩欧美第一区二区三区| 亚洲女人天堂成人av在线| 国产69精品久久久久9999apgf| 天堂√中文在线bt| 91极品尤物在线观看播放| 男女性行为免费视频网站 | 久久成人影院精品777| 国产精品片211在线观看| 亚洲区一区二区三区四| 老熟妇乱子伦牲交视频| 真实国产老熟女粗口对白| 亚洲三级在线播放| 久草中文在线这里只有精品| 亚洲视频在线观看| 中文字幕第一页亚洲| 亚洲国产丝袜美女在线| 一边摸一边抽搐一进一出口述| 亚洲欧美日韩一区二区三区在线| 中文字幕无码日韩专区免费| 久久久久久中文字幕有精品| 国产亚洲日本精品二区| 在教室伦流澡到高潮hgl动漫|