亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于網(wǎng)絡(luò)嵌入的農(nóng)產(chǎn)品銷售推薦系統(tǒng)

        2022-10-24 01:39:14臧璣珣徐鑫航
        計算機技術(shù)與發(fā)展 2022年10期
        關(guān)鍵詞:銷售用戶模型

        臧璣珣,徐鑫航

        (1.西安外國語大學(xué) 信息技術(shù)中心,陜西 西安 710061; 2.西安電子科技大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,陜西 西安 710071)

        0 引 言

        農(nóng)業(yè)生產(chǎn)作為國家的第一產(chǎn)業(yè)支撐著國民經(jīng)濟(jì)的建設(shè)和發(fā)展。農(nóng)產(chǎn)品由于產(chǎn)地與保質(zhì)期等因素的限制導(dǎo)致其流通能力較差,不同品種的農(nóng)產(chǎn)品種植地區(qū)、口味、價格等屬性特征都有所差異,因此如何根據(jù)品種特征選擇合適的銷售區(qū)域和影響力最大化的銷售商,以及發(fā)現(xiàn)最具購買潛力的買家已經(jīng)成為農(nóng)業(yè)發(fā)展的重要問題[1]。在數(shù)字經(jīng)濟(jì)日益繁茂的時代,如何將農(nóng)產(chǎn)品在生產(chǎn)、流通、售后等各環(huán)節(jié)產(chǎn)生的海量歷史信息進(jìn)行收集整合和使用是一項重要的任務(wù)。

        推薦系統(tǒng)[2]是一種廣泛應(yīng)用的信息過濾系統(tǒng),它通過對歷史數(shù)據(jù)和物品屬性的分析來預(yù)測用戶偏好,已經(jīng)在網(wǎng)絡(luò)購物、內(nèi)容咨詢等線上平臺獲取了巨大的成功。傳統(tǒng)的推薦算法主要有基于內(nèi)容的推薦[3]、基于協(xié)同過濾的推薦[4]和混合推薦[5]等。此外,也有使用深度學(xué)習(xí)、知識圖譜等技術(shù)來解決推薦任務(wù)的嘗試。近年來,也有一些研究著眼于農(nóng)產(chǎn)品銷售的推薦系統(tǒng)。針對協(xié)同過濾在推薦時難以及時捕捉用戶興趣變化的問題,李建軍等[6]考慮用戶行為及用戶訪問數(shù)據(jù),提出基于改進(jìn)權(quán)值的用戶興趣推薦算法,深入挖掘用戶對農(nóng)產(chǎn)品的喜好趨勢。李亞峰等[7]借助K最鄰近算法構(gòu)建用戶瀏覽矩陣,進(jìn)而通過Jaccard相似度來實現(xiàn)對用戶的農(nóng)產(chǎn)品推薦過程。鄒詩雨等[8]利用PMI-VL算法分析農(nóng)產(chǎn)品評論的情感值以尋找潛在的購買者。蘇啟琛等[9]提出一種基于內(nèi)容的生鮮產(chǎn)品推薦算法,利用產(chǎn)品特征與購買記錄創(chuàng)建用戶模型以預(yù)測用戶喜愛的Top-N生鮮產(chǎn)品。這些方法提供了農(nóng)產(chǎn)品推薦算法的設(shè)計思路,但其推薦精度以及各銷售環(huán)節(jié)的完整性上仍有優(yōu)化空間。

        針對農(nóng)產(chǎn)品的推薦問題,結(jié)合數(shù)據(jù)挖掘、詞嵌入及網(wǎng)絡(luò)表示學(xué)習(xí)等技術(shù),該文構(gòu)建了農(nóng)產(chǎn)品銷售途徑推薦系統(tǒng)。該系統(tǒng)通過用戶輸入的預(yù)售農(nóng)產(chǎn)品特點向用戶推薦適合銷售的地區(qū)、銷售商及有潛力的買家,有效提升了農(nóng)產(chǎn)品銷售與流通環(huán)節(jié)的效率。最后通過對比實驗驗證了該方法的有效性。

        1 基于詞嵌入的AP-GloVe方法

        大規(guī)模生產(chǎn)農(nóng)產(chǎn)品的種類、品種、繁育地區(qū)、銷售區(qū)域往往具有較高的穩(wěn)定性。在進(jìn)行自然語言處理任務(wù)時需要將詞匯轉(zhuǎn)換為計算機可以理解的向量形式,如One-hot將每個詞匯轉(zhuǎn)換為一個詞表大小維度的、稀疏的獨熱向量。詞嵌入則將詞轉(zhuǎn)化成一種分布式表示,它使得離散表示的向量從高維空間映射為低維稠密的連續(xù)向量,不僅可以提升計算效率還使得嵌入后的詞匯特征可以表示詞與詞之間的關(guān)系。常用于詞嵌入的分布式表示方法包括Word2Vec[10]、BERT[11]以及Glove[12]。

        為了從非結(jié)構(gòu)化的文本信息中捕捉待售農(nóng)產(chǎn)品特點與地區(qū)等語義信息的詞向量,提出詞嵌入模型AP-GloVe(Global Word Vector Representation for Agricultural Products),可以在生成農(nóng)產(chǎn)品向量表示時保留全局詞頻統(tǒng)計信息與局部上下文信息。

        該方法首先從中國植物主題數(shù)據(jù)庫、中國國家地名信息庫以及爬取果蔬類文章等多個來源獲取農(nóng)產(chǎn)品類別的原始文本信息,并對得到的源數(shù)據(jù)進(jìn)行預(yù)處理,如數(shù)據(jù)清洗與數(shù)據(jù)集成等操作,目的是獲取標(biāo)準(zhǔn)、連續(xù)的農(nóng)業(yè)文本數(shù)據(jù),進(jìn)而建立“地區(qū)”與“果蔬品種”兩個專業(yè)詞庫。然后,對預(yù)處理后的文本進(jìn)行jieba分詞以獲取農(nóng)業(yè)領(lǐng)域的中文詞匯,進(jìn)而可以得到描述不同詞匯間臨近關(guān)系的共現(xiàn)矩陣。

        根據(jù)每個詞匯與其他詞匯在規(guī)定窗口中出現(xiàn)的次數(shù)構(gòu)造共現(xiàn)矩陣X,矩陣中的元素Xij表示詞匯j在中心詞i的上下文中出現(xiàn)的次數(shù)。當(dāng)詞j再次出現(xiàn)在中心詞i的上下文中時,通過Xi,j=Xi,j+1更新矩陣中的元素Xij,然后循環(huán)計算直到每個詞都作為中心詞更新過共現(xiàn)矩陣。例如分好詞的語料:“菠蘿,很,好吃”,“荔枝,和,菠蘿,很,甜”,“荔枝,非常,甜”,設(shè)置窗口大小為3,即取中心詞前后各一個詞作為上下文,分詞共現(xiàn)矩陣如圖1所示。

        設(shè)Pi,k代表詞k作為詞i上下文出現(xiàn)的概率,即:

        由于Pi,k=Xi,k/Xj,k會隨著單詞i、j、k之間相關(guān)度的變化而變化,所以GloVe設(shè)定了一個由詞向量計算得出的函數(shù)g(vi,vj,vk)來逼近Pi,k=Xi,k/Xj,k,使得詞向量同樣可以蘊含共現(xiàn)矩陣所蘊含的信息。GloVe中設(shè)計的g(vi,vj,vk)=exp((vi-vj)Tvk),即盡可能使得以下等式:

        圖2 函數(shù)f(x)圖像

        2 基于影響力的圖神經(jīng)網(wǎng)絡(luò)模型IAGNN

        社交影響力[13]是指一個人或事物會對網(wǎng)絡(luò)中另一個人的行為偏好產(chǎn)生影響,在網(wǎng)絡(luò)中尋找具有影響力的中心節(jié)點并刻畫其對鄰居節(jié)點產(chǎn)生的影響具有重要意義,其已被廣泛應(yīng)用于社交推薦[14]和廣告?zhèn)鞑15]等領(lǐng)域。為了在社交網(wǎng)絡(luò)中學(xué)習(xí)出緊湊的網(wǎng)絡(luò)信息特征,并使其保留復(fù)雜的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),提出了一個基于影響力的圖神經(jīng)網(wǎng)絡(luò)模型IAGNN (Influence-Aware Graph Neural Networks),如圖3所示。首先,IAGNN以圖數(shù)據(jù)作為輸入,根據(jù)節(jié)點間不同的拓?fù)浣Y(jié)構(gòu)關(guān)系得到拓?fù)湫畔,然后將入度作為節(jié)點vi的基本影響信息B。再集成節(jié)點vi的拓?fù)湫畔和基本影響信息B后獲得該節(jié)點的綜合影響力信息矩陣W,最終模型會從注意力層輸出學(xué)習(xí)到的節(jié)點表示形式并用于下游任務(wù)。

        圖3 IAGNN模型

        社交網(wǎng)絡(luò)中任意兩個節(jié)點vi和vj之間不同類型的邊可以表示節(jié)點vi在節(jié)點vj上的不同影響。如圖4所示,從左向右依次表示節(jié)點vi和vj之間存在三種類型的邊,即:vi單向跟隨或轉(zhuǎn)發(fā)vj,vj單向跟隨或轉(zhuǎn)發(fā)vi,以及vi和vj互相跟隨。在社交網(wǎng)絡(luò)中,大多數(shù)主動關(guān)注或轉(zhuǎn)發(fā)都可以視為接受另一方行為的影響,并且另一方應(yīng)對其自身施加影響。此外,節(jié)點vj對vi的影響還取決于vj被關(guān)注的數(shù)量[16]:

        圖4 節(jié)點vi和vj的三種不同拓?fù)?/p>

        其中a、b和c為常數(shù),Ii表示節(jié)點vi的直接前驅(qū)節(jié)點數(shù)量,并且根據(jù)上述分析的三種情況在實驗中分配了它們的值。該公式能表示當(dāng)vj受到更多關(guān)注時,vj對其他節(jié)點的影響更大。

        通過標(biāo)準(zhǔn)化wi={wij1,wij2,…,wijN}生成權(quán)重矩陣w∈Rn*n來獲得wij,該權(quán)重矩陣表示其他節(jié)點對網(wǎng)絡(luò)中每個節(jié)點vi的影響。

        在嵌入過程中,每個節(jié)點都通過注意力層實現(xiàn)自注意力機制。多頭注意力機制[17]先對權(quán)重矩陣進(jìn)行線性變換,然后將其輸入到按比例縮放的點積注意力。每個線性變換的參數(shù)W是不同的。此外,按比例縮放的點積注意力進(jìn)行了N次。該文的注意力層利用的注意力機制表示為:

        a:RF′×RF′→R

        之后計算相似系數(shù)eij:

        eij=a([Whi‖Whj])

        為了方便統(tǒng)計注意力系數(shù),經(jīng)過Softmax對節(jié)點vj和vi正則化:

        αij=softmax(eij)

        對于這樣一個單層前饋神經(jīng)網(wǎng)絡(luò),使用非線性函數(shù)LeakyReLU進(jìn)行激活,并通過規(guī)范化不同節(jié)點之間的注意力系數(shù)來獲得歸一化注意力。在IAGNN模型中,利用節(jié)點之間的關(guān)系以及節(jié)點vi本身的受眾規(guī)模來獲得相應(yīng)的節(jié)點綜合影響矩陣W。在通過注意力機制計算了影響力系數(shù)之后,對系數(shù)進(jìn)行正則化和激活函數(shù)操作。此外,每個頭的聚合特征被級聯(lián),并且進(jìn)一步通過非線性激活函數(shù)σ輸出低維節(jié)點表示:

        在卷積的每一層中,k個注意機制獨立工作,并最終將其計算串聯(lián)起來。IAGNN的算法流程如算法1所示。訓(xùn)練嵌入網(wǎng)絡(luò)后,所學(xué)習(xí)的節(jié)點表示不僅可以表征節(jié)點的潛在特征,還可以探索網(wǎng)絡(luò)中的影響信息。此外,學(xué)習(xí)低維節(jié)點表示會用于后續(xù)的節(jié)點分類和鏈接預(yù)測任務(wù)等下游任務(wù),建立各種農(nóng)產(chǎn)品與銷售商、銷售地區(qū)以及潛在買家等節(jié)點的關(guān)聯(lián)關(guān)系,進(jìn)而用于銷售推薦策略。

        算法1:IAGNN

        1:fori=1,2,…,ndo

        2:forjinNido

        αij=softmax(wijeij)

        4: end for

        5:end for

        3 基于AP-GloVe與IAGNN的農(nóng)產(chǎn)品銷售途徑推薦方法

        該文以農(nóng)產(chǎn)品特征數(shù)據(jù)和銷售數(shù)據(jù)為基礎(chǔ),實現(xiàn)了一個農(nóng)產(chǎn)品銷售途徑推薦系統(tǒng)。其中,銷售地推薦基于面向農(nóng)產(chǎn)品的全局詞向量表示方法AP-GloVe設(shè)計實現(xiàn);而銷售商推薦模塊在獲得待推薦銷售地的基礎(chǔ)上完成;潛在買家推薦則基于IAGNN模型實現(xiàn)。

        為實現(xiàn)銷售地與銷售商推薦,從構(gòu)建的數(shù)據(jù)集與自定義語料庫中提取文本特征,并計算根據(jù)提出的AP-GloVe方法所生成嵌入向量的相似度,為特定的農(nóng)產(chǎn)品推薦top-N個適合的銷售地點。該結(jié)果不僅成為最終展示給用戶的銷售地推薦結(jié)果,也會輸入銷售商推薦模塊成為銷售商推薦過程中的一個決定性因素,流程如圖5所示。

        圖5 銷售地銷售商推薦流程

        銷售商推薦主要負(fù)責(zé)在給定果蔬品種時,根據(jù)獲取的銷售商數(shù)據(jù)對銷售商進(jìn)行篩選,具體流程如圖6所示。輸入的銷售商信息經(jīng)過銷售品種過濾、銷量過濾、銷售額過濾以及銷售地過濾四個篩選環(huán)節(jié)輸出最終待推薦的top-N銷售商。在每個環(huán)節(jié)執(zhí)行前判斷待推薦列表大小,來防止推薦結(jié)果為空或過多的情況。如果列表為空則輸出該環(huán)節(jié)執(zhí)行前待推薦列表的前N行;如果大于N則繼續(xù)執(zhí)行下一個篩選環(huán)節(jié);否則直接輸出當(dāng)前待推薦列表。銷售地過濾是將先前在銷售地推薦模塊獲得的結(jié)果作為限制條件進(jìn)一步縮小待推薦銷售商范圍,使最終推薦結(jié)果盡可能符合預(yù)銷售方向和預(yù)售地區(qū),并且保證一定的銷量與口碑。

        圖6 銷售商推薦流程

        潛在買家推薦模塊根據(jù)給定社交網(wǎng)絡(luò)中節(jié)點與節(jié)點的社交關(guān)系以及節(jié)點的社交行為,通過設(shè)計的IAGNN模型得到蘊含行為與關(guān)系語義的節(jié)點特征表示向量,然后該向量通過相似度計算實現(xiàn)節(jié)點分類與鏈路預(yù)測任務(wù),完成對預(yù)售農(nóng)產(chǎn)品推薦有相似喜好和行為的潛在消費者,模型總體流程如圖7所示。

        圖7 潛在買家推薦流程

        4 實驗結(jié)果及分析

        4.1 基于AP-Glove的詞嵌入

        為驗證AP-GloVe模型生成詞嵌入的準(zhǔn)確性,將Word2Vec的CBOW和Skip-Gram、GloVe、Skip-Gram模型與提出的AP- GloVe模型,在SimLex-999、Wordsim-240和Wordsim-296等詞的相似性任務(wù)數(shù)據(jù)集上進(jìn)行了對比分析,這些數(shù)據(jù)集包含了詞對間的相似性評分。通過計算出詞向量間的余弦相似度與數(shù)據(jù)集中相似度評分的Pearson相關(guān)系數(shù)來評估詞嵌入的準(zhǔn)確性,相關(guān)系數(shù)越大表示嵌入結(jié)果相似度與詞對本身相似度越貼合,得出的Pearson相關(guān)系數(shù)如表1所示。

        表1 AP-GloVe方法在詞相似任務(wù)上的Pearson相關(guān)系數(shù)

        可以看出,提出的AP-GloVe在具有296組中文詞對的Wordsim-296數(shù)據(jù)集上明顯優(yōu)于其他方法,并且在其他數(shù)據(jù)集上與其他方法的差距也較小,說明該方法保留低共現(xiàn)詞對信息也可以得到效果相似的嵌入向量。GloVe也有較為穩(wěn)定的效果,說明GloVe綜合了全局詞匯的共現(xiàn)信息和Word2Vec局部窗口上下文的優(yōu)勢是有效的,而且不需要計算共現(xiàn)次數(shù)為0的詞對,在矩陣計算中有效的減少了計算量。

        4.2 基于IAGNN的節(jié)點表示

        為了驗證IAGNN模型生成節(jié)點表示的準(zhǔn)確性,在多個數(shù)據(jù)集上使用IAGNN與幾種相似的圖網(wǎng)絡(luò)進(jìn)行比對,具體通過節(jié)點分類與鏈路預(yù)測這兩個下游任務(wù)進(jìn)行衡量。

        實驗基本設(shè)置如下:當(dāng)應(yīng)用L2正則化時,α=0.2,λ=0.000 5。對于所有方法和數(shù)據(jù)集,epochs設(shè)置為10 000,dropout設(shè)置為0.6,初始學(xué)習(xí)率為0.005。根據(jù)樣本量,用于計算節(jié)點之間拓?fù)溆绊懙某?shù)a、b和c分別設(shè)置為60、10和40。為了公平起見,該文按照對比算法原文的默認(rèn)參數(shù)進(jìn)行設(shè)置,包括GAT[18]、GCN[19]、GraphSage[20]和AGNN[21]。

        表2顯示了在Twitter、Weibo、Digg和Cora四個數(shù)據(jù)集上的五種圖網(wǎng)絡(luò)表示學(xué)習(xí)方法在節(jié)點分類任務(wù)上的實驗結(jié)果。總體而言,實驗結(jié)果表明提出的IAGNN模型的性能優(yōu)于其他比較算法,這表明在節(jié)點嵌入訓(xùn)練過程中,IAGNN保留了網(wǎng)絡(luò)中節(jié)點的拓?fù)浣Y(jié)構(gòu)和基本影響。除此之外,由表中結(jié)果可以觀察到GAT的性能也較好,這可能是由于GAT和IAGNN涉及的注意力機制促進(jìn)了預(yù)測精度的提升。在非社交網(wǎng)絡(luò)形式的Cora和CiteSeer數(shù)據(jù)集上的結(jié)果表明,所提出的IAGNN可以適用于更為廣泛的業(yè)務(wù)領(lǐng)域。總之,IAGNN通過在生成影響信息矩陣時保留了圖的拓?fù)浣Y(jié)構(gòu)來提高節(jié)點嵌入的準(zhǔn)確性。

        表2 節(jié)點分類算法精度比較

        鏈路預(yù)測任務(wù)可以描述兩個節(jié)點之間建立連接關(guān)系的可能行。表3顯示了GAT、GCN以及提出的IAGNN三種算法在不同數(shù)據(jù)集上進(jìn)行鏈路預(yù)測任務(wù)的AUC性能比較??梢钥吹?,IAGNN模型的AUC性能在鏈路預(yù)測任務(wù)中明顯優(yōu)于所有基線。

        表3 鏈路預(yù)測算法AUC性能比較

        5 結(jié)束語

        針對農(nóng)產(chǎn)品銷售特征設(shè)計了一個農(nóng)產(chǎn)品銷售途徑推薦系統(tǒng)。系統(tǒng)通過 AP-GloVe方法為用戶推薦預(yù)售產(chǎn)品適合的銷售地,并借助銷售地模塊結(jié)果對銷售商等數(shù)據(jù)分析處理來為用戶推薦預(yù)售產(chǎn)品的銷售商,最終利用IAGNN網(wǎng)絡(luò)模型解決預(yù)售產(chǎn)品潛在買家推薦問題,在相關(guān)實驗中取得了優(yōu)于基線的效果。然而實際的農(nóng)產(chǎn)品銷售還面臨政策、資金、環(huán)境等多方面的影響,隨著數(shù)據(jù)越來越多元化與技術(shù)的不斷革新,農(nóng)產(chǎn)品線上銷售的道路上還有很多方面值得去研究。

        猜你喜歡
        銷售用戶模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        這四個字決定銷售成敗
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        3D打印中的模型分割與打包
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        如何獲取一億海外用戶
        銷售統(tǒng)計
        中國化妝品(2003年6期)2003-04-29 00:00:00
        在线看亚洲十八禁网站| 国产午夜无码片在线观看影院| 丰满女人又爽又紧又丰满| 亚洲ⅤA中文字幕无码| 国产亚洲精品综合在线网站| 中文字幕av久久亚洲精品| 五月综合激情婷婷六月色窝| 国产欧美精品一区二区三区–老狼| 亚洲国产日韩综一区二区在性色| 国内自拍偷国视频系列| 男女高潮免费观看无遮挡 | 亚洲国产av中文字幕| 国产精品黑丝美女啪啪啪| 无码人妻av一二区二区三区| 日本视频中文字幕一区在线| 亚洲av一区二区三区网站| 久久精品人妻少妇一二三区| 午夜内射中出视频| 综合色天天久久| 亚洲国产精品av麻豆一区| 国产精品久久久久久av| 久久久www成人免费无遮挡大片| 国产欧美日本亚洲精品一4区| 乳乱中文字幕熟女熟妇| 亚洲国产欧美在线观看| 欧美在线三级艳情网站| 精品亚洲一区二区视频| 国产日韩厂亚洲字幕中文| 日本高清h色视频在线观看| 久久国产热精品波多野结衣av| 亚洲一区二区视频免费看| 国产爆乳美女娇喘呻吟| 无码人妻丰满熟妇啪啪7774| 太大太粗太爽免费视频| 国产av精品麻豆网址| 无码日韩精品一区二区三区免费| 欧美中文字幕在线看| 日本免费大片一区二区三区| 99精品国产在热久久无码 | 自慰高潮网站在线观看| 美丽小蜜桃1一3在线观看|