亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于客戶行為數(shù)據(jù)卷煙推薦算法設(shè)計(jì)

        2022-06-20 14:51:00張曉博
        合作經(jīng)濟(jì)與科技 2022年13期
        關(guān)鍵詞:用戶

        □文/張曉博

        (河南省煙草公司新鄉(xiāng)市公司卷煙營(yíng)銷中心 河南·新鄉(xiāng))

        [提要] 為推動(dòng)河南煙草商業(yè)數(shù)字化轉(zhuǎn)型,提升資源要素配置效率,本文以客戶行為數(shù)據(jù)為分析對(duì)象,構(gòu)建卷煙推薦算法。首先闡述推薦技術(shù)的分類和特點(diǎn),論述協(xié)同過濾算法的實(shí)現(xiàn)路徑和基本原理,以零售客戶卷煙推薦為場(chǎng)景,從數(shù)據(jù)獲取、相似度計(jì)算、生成推薦策略、結(jié)果修正等方面論述基于用戶的協(xié)同過濾推薦算法(UserCF)和基于項(xiàng)目的協(xié)同過濾推薦算法(ltemCF)構(gòu)建過程,論證相似度系數(shù)對(duì)算法“馬太效應(yīng)”的影響,通過復(fù)雜度分析得出ltemCF 在擴(kuò)展性方面優(yōu)于UserCF 的推論,通過編程和離線實(shí)驗(yàn),驗(yàn)證推論的正確性、算法的可行性,揭示推薦結(jié)果的流行度、覆蓋率與鄰居數(shù)量k 的關(guān)系。

        引言

        在信息技術(shù)的推動(dòng)下,新一輪科技革命和產(chǎn)業(yè)變革快速發(fā)展,推動(dòng)著社會(huì)進(jìn)步,深刻影響著人們的工作和生活。2019 年,我國(guó)數(shù)字經(jīng)濟(jì)增加值達(dá)到35.8 萬(wàn)億元,占GDP 比重達(dá)到36.2%?!笆奈濉币?guī)劃和2035 年遠(yuǎn)景目標(biāo)綱要對(duì)“加快數(shù)字化發(fā)展,建設(shè)數(shù)字中國(guó)”謀篇布局,強(qiáng)調(diào)要“迎接數(shù)字時(shí)代,激活數(shù)據(jù)要素潛能”,煙草行業(yè)作為國(guó)家經(jīng)濟(jì)體系的重要組成部分,同樣在加快自身的數(shù)字化轉(zhuǎn)型步伐,2021 年全國(guó)煙草工作會(huì)議的精神之一就是要“推進(jìn)實(shí)施數(shù)字化轉(zhuǎn)型戰(zhàn)略”。 煙草行業(yè)經(jīng)過多年信息化建設(shè),已基本實(shí)現(xiàn)了數(shù)據(jù)資源的原始積累,如何聚焦新場(chǎng)景、新服務(wù)、新要求,進(jìn)而發(fā)揮數(shù)據(jù)要素潛能、優(yōu)化資源配置,是行業(yè)在數(shù)字化轉(zhuǎn)型過程中需要解決的突出問題。

        一、推薦技術(shù)

        客戶行為數(shù)據(jù)是企業(yè)最具價(jià)值的數(shù)據(jù)資源之一,蘊(yùn)含著客戶的消費(fèi)軌跡和個(gè)性偏好,通過對(duì)此類數(shù)據(jù)的分析、挖掘,從數(shù)據(jù)角度建立對(duì)客戶行為的理解,企業(yè)可以更深入地洞察客戶消費(fèi)心理、發(fā)現(xiàn)潛在需求、提高商品銷售。在行業(yè)外,客戶行為數(shù)據(jù)的主要使用途徑是推薦系統(tǒng)。電子商務(wù)推薦系統(tǒng)(Recommendation Systems for E-Commerce)是“利用電子商務(wù)網(wǎng)站向客戶提供商品信息和建議,幫助用戶決定應(yīng)該購(gòu)買什么產(chǎn)品,模擬銷售人員幫助客戶完成購(gòu)買的過程”。推薦系統(tǒng)的研究?jī)?nèi)容包括:用戶信息的獲取和建模、推薦技術(shù)研究、推薦算法評(píng)價(jià)三個(gè)方面。其中,推薦技術(shù)是構(gòu)成推薦系統(tǒng)的核心,決定著推薦效果,根據(jù)其所采用的算法原理,推薦技術(shù)可分為以下幾類:

        (一)基于規(guī)則的推薦技術(shù)。通過預(yù)置一系列觸發(fā)條件或規(guī)則,根據(jù)條件判斷生成推薦結(jié)果。例如,數(shù)據(jù)挖掘領(lǐng)域的關(guān)聯(lián)規(guī)則(Association Rule),其原理是通過多次迭代構(gòu)造出頻繁項(xiàng)集,根據(jù)提升度、置信度、支持度等指標(biāo)建立關(guān)聯(lián)規(guī)則,從而幫助企業(yè)給顧客提供購(gòu)買建議、制訂合理的交叉銷售方案。簡(jiǎn)單關(guān)聯(lián)規(guī)則屬于無(wú)監(jiān)督學(xué)習(xí)算法,當(dāng)前項(xiàng)數(shù)量和項(xiàng)目集元素?cái)?shù)量過多時(shí),會(huì)造成運(yùn)算速度慢、資源開銷大的問題,同時(shí)規(guī)則質(zhì)量也難以保證。

        (二)基于內(nèi)容的推薦技術(shù)。核心原理是通過標(biāo)簽庫(kù)、隱語(yǔ)義向量等技術(shù)分別對(duì)用戶和商品進(jìn)行畫像,根據(jù)畫像結(jié)果計(jì)算出用戶和商品之間的關(guān)聯(lián)性,再根據(jù)關(guān)聯(lián)性的高低進(jìn)一步的排序和篩選得出推薦方案,該技術(shù)的推薦結(jié)果具有良好的解釋性,缺點(diǎn)是很難為用戶推薦其關(guān)注點(diǎn)之外的商品,對(duì)用戶的潛在興趣挖掘有限。

        (三)基于鄰域的推薦技術(shù)。其基本原理是kNN,根據(jù)相關(guān)性尋找與客戶最相似的k 個(gè)鄰居,將鄰居最感興趣的若干物品推薦給客戶。協(xié)同過濾算法是鄰域推薦技術(shù)的典型代表,其能夠以類似“愛屋及烏”的方式將相似物品推薦給用戶,更容易挖掘潛在需求。缺點(diǎn)是當(dāng)用戶或物品數(shù)量規(guī)模較大時(shí),相似性計(jì)算的效率會(huì)變的非常低,除此之外還存在數(shù)據(jù)稀疏性、冷啟動(dòng)、可擴(kuò)展性三大問題。

        以上算法中,協(xié)同過濾技術(shù)以其較為優(yōu)秀的需求挖潛效果和良好的“效率-質(zhì)量”平衡性,在電子商務(wù)領(lǐng)域得到了廣泛應(yīng)用,例如Netflix、YouTube、亞馬遜等。在煙草行業(yè),浙江省局在構(gòu)建“互聯(lián)網(wǎng)+”煙草商業(yè)模式的過程中將協(xié)同過濾技術(shù)用于卷煙商品推薦,取得了良好成效。但目前,河南煙草商業(yè)在零售客戶卷煙商品推薦方面主要還是采用傳統(tǒng)的“專家系統(tǒng)”(即客戶經(jīng)理口頭宣傳),主觀性較強(qiáng),缺乏從數(shù)據(jù)角度分析客戶潛在需求的能力??蛻粜袨閿?shù)據(jù)涉及方方面面,本文以其中的卷煙訂購(gòu)數(shù)據(jù)為例,論述了協(xié)同過濾推薦算法的實(shí)現(xiàn)過程,分析了算法存在的“馬太效應(yīng)”,在理論推導(dǎo)的基礎(chǔ)上,通過實(shí)驗(yàn)論證了基于物品的協(xié)同過濾推薦算法的可行性和運(yùn)算優(yōu)勢(shì)。

        二、協(xié)同過濾算法的原理

        (一)實(shí)現(xiàn)路徑。推薦系統(tǒng)基本通過三種途徑建立用戶與物品的聯(lián)系:(1)用戶-用戶-物品。即若用戶A 與用戶B 具有相似的興趣,則可認(rèn)為用戶B 喜歡的物品對(duì)用戶A 來(lái)說同樣喜歡,可將B 用戶購(gòu)買過的物品推薦給A。(2)用戶-物品-物品。即若用戶喜歡某個(gè)物品,則可將與該物品相似的物品推薦給用戶。(3)用戶-特征-物品。利用人與物的聯(lián)系,即若用戶具有某種特征或標(biāo)簽,可將與該特征或標(biāo)簽相似的物品推薦給用戶。以上(1)、(2)即是協(xié)同過濾技術(shù)的基本思想。當(dāng)需要為目標(biāo)用戶推薦商品時(shí),可以先找到與目標(biāo)用戶相似的用戶(或與目標(biāo)用戶購(gòu)物籃物品相似的物品),然后將相似用戶喜歡的物品(或與購(gòu)物籃中物品相似的物品)推薦給目標(biāo)用戶。根據(jù)相似對(duì)象的不同,協(xié)同過濾技術(shù)總體可分為兩類:以路徑(1)為代表的基于用戶的協(xié)同過濾(User-based Collaborative Filtering,UserCF),以及路徑(2)為代表的基于項(xiàng)目的協(xié)同過濾(Item-based Collaborative Filtering,ItemCF)。

        (二)算法模型。無(wú)論是UserCF 還是ItemCF,其主要實(shí)現(xiàn)過程可分為以下兩步:(1)計(jì)算用戶相似度或物品相似度。(2)根據(jù)相似度和用戶歷史行為數(shù)據(jù)生成推薦策略。下面以卷煙商品推薦為例,論述算法模型構(gòu)建步驟:

        1、構(gòu)建客戶-卷煙數(shù)據(jù)矩陣。假設(shè)全市有n 個(gè)卷煙零售客戶,用集合U={U1,U2,…,Un}表示,銷售i 個(gè)規(guī)格的卷煙,用集合M={M1,M2,…,Mi}表示,構(gòu)建矩陣R=(rni),rni表示客戶Un在卷煙Mi上的特征(其中,Un∈U,Mi∈M),該特征可以是訂購(gòu)量,也可以是訂購(gòu)次數(shù)、商品評(píng)分、銷售比重等各類客戶行為。矩陣Rn×i中的一行代表一個(gè)客戶在所有卷煙上的特征,每一列表示一個(gè)卷煙在所有客戶上的特征。

        2、構(gòu)建相似度矩陣。與聚類算法類似,協(xié)同過濾算法也使用“距離”作為用戶或物品之間的相似性度量。常見的“距離”計(jì)算方法有以下幾種:

        (1)歐氏距離。假設(shè)客戶Ua,Ub∈U,則兩者的歐氏距離可通過以下公式計(jì)算:

        (2)Jaccard 系數(shù)。若客戶Ua,Ub訂購(gòu)卷煙的集合分別是Ia,Ib(Ua,Ub∈U 且Ia,Ib∈M),則Jaccard 系數(shù)可表示為:

        (3)余弦距離。如果把用戶(或卷煙)的特征看作向量,則向量的余弦距離等于向量的內(nèi)積與向量長(zhǎng)度乘積的商。如果兩個(gè)向量長(zhǎng)度相近,同時(shí)方向相同或相反,則其余弦距離的絕對(duì)值接近1;若兩個(gè)向量長(zhǎng)度區(qū)別較大,或相互垂直接近正交,則余弦距離的絕對(duì)值接近0。假設(shè)用戶Ua,Ub∈U,余弦距離可表示為:

        除此之外,還可以采用歐式距離的平方、皮爾遜相關(guān)系數(shù)等。無(wú)論采用哪種算法,歸根到底是要對(duì)相似度進(jìn)行量化,為相似性判斷提供客觀的、可比的數(shù)值依據(jù)。

        對(duì)于式(2)和式(3),特征矩陣R 的元素取值將直接決定距離的計(jì)算結(jié)果。一般的,rni通常取用戶對(duì)商品的評(píng)分,但由于目前新商盟系統(tǒng)尚未集成卷煙評(píng)分功能,所以本文對(duì)rni的取值采用以下規(guī)則:當(dāng)用戶訂購(gòu)了某卷煙時(shí),對(duì)應(yīng)的rni為1,否則rni為0。在距離算法方面,采用式(3)的余弦距離作為相似性度量標(biāo)準(zhǔn)。

        構(gòu)建矩陣W=(wi,j)作為相似度矩陣。若采用UserCF,則wa,b(wa,b∈W)表示零售戶a 與零售戶b 的相似度,若采用ItemCF,wa,b(wa,b∈W)表示卷煙a 與卷煙b 的相似度。W 為方陣,其維數(shù)與零售客戶或卷煙規(guī)格的數(shù)量相同。

        3、生成推薦策略。如前文所述,協(xié)同過濾技術(shù)采用了kNN,推薦策略基于k 個(gè)最相近鄰居生成。選擇鄰居的過程即是算法字面中“協(xié)同”的過程,在把鄰居喜好的卷煙正式推薦給客戶前,需要將推薦列表中目標(biāo)客戶已訂購(gòu)的卷煙“過濾”掉,只留下目標(biāo)客戶未訂購(gòu)過的卷煙,以提高推薦策略的有效性。具體過程是,當(dāng)用UserCF 算法為客戶Ua推薦卷煙時(shí),首先從用戶相似度矩陣W 中檢索wa,j(j=1,2,…,n),根據(jù)wa,j找出k 個(gè)與Ua相似度高的客戶,k 個(gè)客戶與目標(biāo)客戶的相似度用集合w={w1,w2,…,wk}表示,然后建立這k 個(gè)客戶訂購(gòu)過的卷煙的集合i={i1,i2,…,im},并從i 中移除Ua已經(jīng)訂購(gòu)過的卷煙。接著對(duì)集合i中的每個(gè)卷煙計(jì)算推薦度pi,計(jì)算公式見式(4)。最后將集合i 按照pi降序排列,生成推薦結(jié)果。

        ItemCF 生成推薦策略的過程與UserCF 類似,可按照式(5)計(jì)算推薦度pi。其中,N(Ua)表示客戶Ua已訂購(gòu)的卷煙規(guī)格種類數(shù)量。

        式(4)和式(5)中帶有下標(biāo)的r 是相似度修正系數(shù),假如其取值為訂購(gòu)量,以ItemCF 為例,其作用可解釋為:即使客戶已訂購(gòu)的卷煙ia和備選卷煙ib有較高的相似度,但如果客戶對(duì)ia的興趣度較低(表現(xiàn)為訂購(gòu)量少或訂購(gòu)次數(shù)少),則仍不能將ib推薦給客戶,因此要對(duì)給w 進(jìn)行修正,得出一個(gè)較低的pi值。需要注意的是,若r 取值不當(dāng),不但不能起到修正效果,反而會(huì)進(jìn)一步放大薦算法的“馬太效應(yīng)”,也就是說算法會(huì)更傾向于向目標(biāo)客戶推薦熱門卷煙,而忽視處于“長(zhǎng)尾”的卷煙,不利于挖掘潛在需求。

        例如,假如表1 為計(jì)算得出的物品相似度矩陣,客戶訂購(gòu)了卷煙I2和I3,數(shù)量分別是40 條和5 條,采用ItemCF 生成推薦策略,如果將訂購(gòu)量作為r 值,那么pi1=0.8×40+0.2×5=33,pi4=0.2×40+0.8×5=12,算法將優(yōu)先推薦I1。但實(shí)際情況很可能是I1和I2屬于熱門主銷規(guī)格,而I3和I4屬于補(bǔ)充規(guī)格,但由于客戶對(duì)I3的訂購(gòu)量少,使得在r 的作用下,其他卷煙很難從I3得到相對(duì)較高的推薦度,這種“連坐”懲罰明顯會(huì)讓“強(qiáng)者更強(qiáng),弱者更弱”,即“馬太效應(yīng)”。為降低這種效應(yīng),讓所有卷煙獲得相對(duì)公平的推薦幾率,本文將r 取值為1,重新計(jì)算得到,pi1=0.8+0.2=1,pi4=0.2+0.8=1,在計(jì)算結(jié)果上,讓I1和I4有了均等的“出鏡”機(jī)會(huì),從而使算法能更好地發(fā)現(xiàn)客戶的“尾部”需求。(表1)

        表1 物品相似度矩陣一覽表

        三、算法的評(píng)價(jià)和復(fù)雜度分析

        推薦算法最終要應(yīng)用于實(shí)際場(chǎng)景。在實(shí)際使用前應(yīng)當(dāng)對(duì)算法的可用性、準(zhǔn)確性、運(yùn)算性能等進(jìn)行評(píng)估,以確定最優(yōu)運(yùn)行參數(shù)、確保使用效果。推薦算法不但要對(duì)高維度的用戶和商品數(shù)據(jù)進(jìn)行運(yùn)算,而且要將推薦結(jié)果快速呈現(xiàn)給用戶,所以對(duì)計(jì)算速度有著較高要求。

        (一)評(píng)價(jià)指標(biāo)。協(xié)同過濾算法可以通過以下幾個(gè)指標(biāo)進(jìn)行評(píng)價(jià):

        1、系統(tǒng)性能。包括算法的時(shí)間復(fù)雜度和空間復(fù)雜度。時(shí)間復(fù)雜度是指算法的時(shí)間開銷,常見的時(shí)間復(fù)雜度包括常數(shù)階、對(duì)數(shù)階、線性階等;空間復(fù)雜度體現(xiàn)了算法的存儲(chǔ)資源開銷,與算法采用的數(shù)據(jù)結(jié)構(gòu)密切相關(guān)。

        2、準(zhǔn)確率。指在推薦結(jié)果集中有多少比例的卷煙被零售客戶實(shí)際訂購(gòu)。

        3、招回率。指在零售客戶的訂單中有多少比例的商品來(lái)自推薦結(jié)果集。

        4、流行度。如果流行度很高,說明推薦結(jié)果偏熱門,不太能夠?yàn)榭蛻魩?lái)新穎的推薦結(jié)果。卷煙Im的流行度按照式(6)計(jì)算,其中N(Im)指訂購(gòu)卷煙Im的客戶。算法的流行度用推薦結(jié)果集的平均流行度表示,即其中n 為推薦結(jié)果集中的元素個(gè)數(shù)。

        5、覆蓋率。表示推薦結(jié)果集中的卷煙規(guī)格占規(guī)格總數(shù)的比例,如果所有的卷煙都被至少推薦給了1 個(gè)客戶,那么該算法的覆蓋率就是100%。覆蓋率越高,就有越多的卷煙進(jìn)入客戶的推薦列表,算法就越能發(fā)挖長(zhǎng)尾需求。

        由于目前尚不具備將推薦算法植入新商盟在線運(yùn)行的條件,無(wú)法驗(yàn)證算法的準(zhǔn)確率和招回率,所以本文對(duì)算法的評(píng)測(cè)主要基于離線實(shí)驗(yàn),并選擇流行度、覆蓋率作為評(píng)價(jià)標(biāo)準(zhǔn)。

        (二)算法復(fù)雜度。如引言部分所述,當(dāng)用戶或物品的數(shù)量規(guī)模較大時(shí),協(xié)同過濾算法的資源開銷會(huì)急劇增大,尤其在相似性計(jì)算上,效率會(huì)變得非常低,這個(gè)問題被稱為算法的“擴(kuò)展性”。

        根據(jù)復(fù)雜度的定義及算法原理易知,UserCF 的運(yùn)算用時(shí)和存儲(chǔ)空間開銷與用戶數(shù)的平方成正比,而ItemCF 在此方面則與卷煙規(guī)格數(shù)成正比。就地市級(jí)煙草公司來(lái)說,零售客戶的基本在104數(shù)量級(jí),卷煙規(guī)格的數(shù)量級(jí)在102,客戶的月平均品牌寬度數(shù)量級(jí)在101。所以,可以推斷,當(dāng)零售客戶數(shù)量增大時(shí),UserCF 的資源開銷將遠(yuǎn)高于IterCF,在擴(kuò)展性方面,ItemCF 將優(yōu)于UserCF。

        四、實(shí)驗(yàn)設(shè)計(jì)

        按照前述算法模型編寫程序代碼,計(jì)算流行度、覆蓋率、算法運(yùn)行時(shí)間三個(gè)關(guān)鍵數(shù)據(jù),記錄不同k 值(即鄰居數(shù)量)下的算法表現(xiàn),評(píng)估算法的可行性和運(yùn)算效能。

        (一)實(shí)驗(yàn)環(huán)境。本文實(shí)驗(yàn)的軟件環(huán)境為Windows7 操作系統(tǒng)、Python3.8.7 編程語(yǔ)言,硬件環(huán)境為CPU Croe i5-3470,8G DDR3 1600內(nèi)存。

        (二)實(shí)驗(yàn)步驟

        1、數(shù)據(jù)準(zhǔn)備。抽取新鄉(xiāng)市2021 年4 月5 日至4 月30 日零售客戶卷煙訂購(gòu)數(shù)據(jù),共669,538 行,保存為csv 格式,第1 列是許可證號(hào),第2 列是卷煙代碼,第3 列是訂購(gòu)量。

        2、編寫代碼。編寫數(shù)據(jù)讀取、相似度計(jì)算、卷煙推薦、流行度計(jì)算、覆蓋率計(jì)算5 個(gè)功能模塊,對(duì)代碼進(jìn)行優(yōu)化,對(duì)每個(gè)模塊進(jìn)行單元測(cè)試,確保功能正常、結(jié)果準(zhǔn)確。

        3、復(fù)雜度實(shí)驗(yàn)。分別取前0.05%、1%、2%、3%、4%、5%、100%的原始數(shù)據(jù),形成7 個(gè)分組,每個(gè)分組進(jìn)行1 次實(shí)驗(yàn),記錄客戶數(shù)、平均品牌寬度、相似度矩陣運(yùn)算耗時(shí)數(shù)據(jù)。

        4、流行度和覆蓋率實(shí)驗(yàn)。采用全量數(shù)據(jù),計(jì)算并記錄不同k 值下推薦結(jié)果的流行度和覆蓋率,觀察三者之間的關(guān)系。

        (三)實(shí)驗(yàn)結(jié)果。在原始數(shù)據(jù)中,用戶數(shù)u 等于20,543,戶均品牌寬度i 等于32.59,規(guī)格總量I 等于133。圖1 為便于觀察曲線走勢(shì),圖中4 個(gè)指標(biāo)各自做了0~100 標(biāo)準(zhǔn)化,展示了UserCF 和ItemCF 耗時(shí)隨數(shù)據(jù)條件的變化趨勢(shì),圖2 是不同k 值下ItemCF 推薦結(jié)果的流行度和覆蓋率的變化曲線。(圖1、圖2)

        圖1 不同分組的耗時(shí)曲線圖

        圖2 不同K 值下ItemCF 推薦結(jié)果流行度和覆蓋率變化趨勢(shì)圖

        (四)實(shí)驗(yàn)結(jié)論。從圖1 和圖2 不難看出,UserCF 的耗時(shí)曲線與u2走勢(shì)基本一致,呈指數(shù)增長(zhǎng),ItemCF 耗時(shí)曲線與u×i2高度吻合,呈線性增長(zhǎng),從而證明了當(dāng)用戶數(shù)量遠(yuǎn)高于商品數(shù)量時(shí),ItemCF 要比UserCF有著更好的擴(kuò)展性。

        k 值的選擇對(duì)推薦結(jié)果的流行度和覆蓋率有直接影響。隨著K 逐漸變大,流行度逐漸下降,這種下降可以解釋為k 值的增大為更多冷門卷煙提供了進(jìn)入到推薦列表的機(jī)會(huì),同時(shí)也從側(cè)面印證了協(xié)同過濾算法本身更傾向于推薦相對(duì)熱門的商品。覆蓋率隨k 值逐漸上升,并且覆蓋率的上升速度隨k 值增大而逐漸放緩。可見,k 值的選擇并非越高越好,一方面k 值對(duì)提升覆蓋率的邊際效用遞減;另一方面如果推薦列表中的商品過多,反而會(huì)失去其對(duì)客戶訂購(gòu)行為的指導(dǎo)意義。

        結(jié)語(yǔ)

        由于新商盟系統(tǒng)功能的限制,煙草行業(yè)對(duì)客戶行為數(shù)據(jù)的收集能力仍十分有限,在大數(shù)據(jù)快速發(fā)展的今天,不得不說是一種遺憾。協(xié)同過濾推薦算法作為互聯(lián)網(wǎng)時(shí)代最為流行的推薦算法之一,有著廣闊的應(yīng)用前景和改進(jìn)空間,開源組織Apache 甚至已將協(xié)同過濾算法作為功能模塊之一集成到了Mahout 項(xiàng)目當(dāng)中。筆者通過編寫代碼實(shí)現(xiàn)協(xié)同過濾算法,一方面考慮了煙草業(yè)務(wù)的特殊性;另一方面也希望通過動(dòng)手實(shí)踐對(duì)算法原理有更加深入地體會(huì)和了解。本文所述算法模型和實(shí)驗(yàn)代碼僅涉及了協(xié)同過濾的基礎(chǔ)功能,對(duì)冷啟動(dòng)、數(shù)據(jù)稀疏性、代碼優(yōu)化、相似性懲罰等問題并未做深入研究,在實(shí)際應(yīng)用前,仍需要進(jìn)一步完善和優(yōu)化。

        猜你喜歡
        用戶
        雅閣國(guó)內(nèi)用戶交付突破300萬(wàn)輛
        車主之友(2022年4期)2022-08-27 00:58:26
        您撥打的用戶已戀愛,請(qǐng)稍后再哭
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        關(guān)注用戶
        商用汽車(2016年5期)2016-11-28 09:55:15
        兩新黨建新媒體用戶與全網(wǎng)新媒體用戶之間有何差別
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        挖掘用戶需求尖端科技應(yīng)用
        Camera360:拍出5億用戶
        100萬(wàn)用戶
        免费国产裸体美女视频全黄| 亚洲综合视频一区二区| 一个人看的视频在线观看| 看黄a大片日本真人视频直播| 日韩欧美在线综合网另类| 国产青草视频在线观看| 草莓视频一区二区精品| 婷婷色国产精品视频一区| 91精品亚洲一区二区三区| 麻豆夫妻在线视频观看| 深夜福利国产精品中文字幕| 免费av一区二区三区无码| 亚洲色偷偷综合亚洲av伊人| 91亚洲国产成人aⅴ毛片大全| 亚洲国产一区二区三区在观看| 亚洲中文字幕一区二区在线| 奇米影视7777久久精品| 又大又粗弄得我出好多水| 国产精品白浆视频一区| 精品国产一品二品三品| 国产一区二区黑丝美胸| 又紧又大又爽精品一区二区| 国产av国片精品| 国产自产21区激情综合一区| 一区二区三区在线观看人妖| 亚洲综合激情另类小说区| 久久国产精品二国产精品| 中文字幕av一区二区三区| 亚洲伊人伊成久久人综合| 亚洲另类无码专区首页| a级黑人大硬长爽猛出猛进 | 99久久这里只精品国产免费| 亚洲av乱码国产精品观| 色综合av综合无码综合网站| 97夜夜澡人人爽人人喊中国片| 91麻豆精品激情在线观看最新| 婷婷五月亚洲综合图区| 国产激情一区二区三区不卡av | 亚洲天堂av黄色在线观看| 美女脱了内裤张开腿让男人桶网站| 中文字幕无码不卡一区二区三区 |