亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于外賣數據的社區(qū)團購選品系統(tǒng)研究與應用

        2022-12-03 01:56:36劉云鵬
        計算機應用與軟件 2022年11期
        關鍵詞:分析

        李 瑾 劉云鵬 邱 虹

        (浙江萬里學院 浙江 寧波 315100)

        0 引 言

        網絡技術、移動技術與電子商務的發(fā)展,促進了網絡購物的迅速增加,使得網購成為生活模式中必需的一部分。團購是網購的一種模式,指部分消費者聯合起來形成一個消費團體,求得更優(yōu)價格的一種購物方式。社區(qū)團購則是團購演變后的一種新型模式,利用小區(qū)內的兼職用戶、物業(yè)人員或小店老板等作為團購團長,通過電商或供應鏈平臺將商品以較低的價格對社區(qū)內群體進行銷售的行為,具有明顯的區(qū)域性與小眾化的購物特色??梢钥闯?,通過團長這一穩(wěn)定的社區(qū)關鍵角色,使用微信等社交平臺獲取人氣,可以有效地將社區(qū)內固定用戶與電商平臺進行高粘性與深度的鏈接,利用預售和爆款等輕資產運作模式快速滿足小區(qū)用戶快消品的剛性需求,本質上是O2O的一種升級商業(yè)模式。

        社區(qū)團購在2015年已經出現萌芽,2018年開始迅猛發(fā)展,目前全國有300多家社區(qū)團購類的電商平臺或者企業(yè),社區(qū)團購微信小程序用戶規(guī)模已經突破500萬,融資金額超過40億。東南沿海的一線與二線城市是社區(qū)團購的活躍地區(qū),既包含全國性平臺,也有各種快速成長起來的地方團購平臺。如今社區(qū)團購的市場規(guī)模依然在不斷擴大,已經進入到競爭白熱化的階段。

        要做好社區(qū)團購,除了供應鏈和性價比之外,一個重中之重的工作就是選品,差異化的選品本身也是社區(qū)團購的一大優(yōu)勢。大量增加團購品類或者全品類反而會增加不必要的成本和減弱社區(qū)團購的優(yōu)勢,也會對小區(qū)用戶的下單頻次造成一定的影響。因此,要做好社區(qū)團購項目,要有對市場需求進行判斷的能力,必須明確當前時段下什么樣的產品適合在社區(qū)內營銷,如何對不同的社區(qū)進行差異化營銷。

        由于住戶數據的安全性與保密性等因素,對社區(qū)進行畫像和獲取豐富的數據特征并非一件易事,一種有效可行的方案就是依靠互聯網上的開放數據進行挖掘與分析。如今外賣產業(yè)已經深入到每個社區(qū)的家家戶戶,可以真實地反映出大多數家庭一日三餐消費的快消品,而快消品又是社區(qū)團購的主打商品,所以本文以外賣數據為切入點,通過對不同社區(qū)外賣數據的分析進行一種選品方案的設計,本質是針對社區(qū)進行個性化的商品推薦,從而提升社區(qū)用戶體驗,提高頁面轉化率。本文的主要貢獻包括:

        (1) 提出一種有效利用外賣數據對不同社區(qū)的購買力與食品喜好進行分析的方法,從而商家可以針對不同社區(qū)提供差異化的商品推薦與服務。

        (2) 使用最長公共子序列的匹配方法建立外賣菜品名與常見大眾菜譜的關聯,以及菜譜主料與有效商品名的關聯,從而找到外賣食品到實際商品的最終映射關系,給選品與競品分析提供數據支撐。

        本文利用爬取的“餓了么”外賣平臺數據進行分析,并在寧波某家做社區(qū)團購的電商企業(yè)進行了實際應用,根據分析結果對不同社區(qū)開展定制化商品推薦服務,企業(yè)經濟效益得到了提升,驗證了本文方法的價值與有效性。

        1 相關工作

        對于大型規(guī)模的電商平臺來講,可以根據系統(tǒng)長期積累的商品數據、用戶數據和用戶行為數據開發(fā)一個內部的選品系統(tǒng),這個系統(tǒng)既可以內部自己使用,也可以通過接口或軟件產品的方式開放部分或全部功能給需要的商家。

        針對亞馬遜的選品工具主要有亞馬遜船長和Sorftime,亞馬遜船長產品不僅包括基于大數據分析的選品功能,還包括經營分析、競品監(jiān)控、跟賣監(jiān)控和評價監(jiān)控等功能。選品的核心功能包括長尾關鍵詞、窺探競品詞、搜索選品調研、Reviews智能分析和產品監(jiān)控。Sorftime對所有亞馬遜的分類產品進行列出并對每一產品給予各種多維度的標簽,包括賣家數量、市場容量、賣家壟斷系數和品牌壟斷系數等,從而可以更好地以市場與自身匹配度為導向進行更加合理的選品,讓賣家更快找到合適的市場,從而獲得更高的投資收益。

        淘寶生意參謀可以對淘寶市場店鋪的經營數據進行了解,從而指導商家選品和更好的數據化運營。主要包括商品實時排行、流量分析、搜索關鍵詞分析、行業(yè)排名和交易分析等。阿里指數是阿里巴巴技術部依據阿里巴巴網站每日運營數據研發(fā)出的數據分析平臺,能以某個行業(yè)或某個地區(qū)為視角進行多維度的分析,比如針對熱門細分子行業(yè)的分析,某地區(qū)供應商與采購商交易分析等,從而可以對選品和采購渠道做出更加合理的判斷。

        事實上可以把單個社區(qū)刻畫成一個用戶,這個用戶是由社區(qū)內住戶的共性所組成,選品的本質就是針對社區(qū)的推薦,對于不同的社區(qū)推薦不同的產品。由于深度學習強大的學習能力,越來越多的研究開始使用深度學習進行推薦系統(tǒng)的設計。一般是將用戶與商品相關信息作為深度神經網絡的輸入數據,通過深度學習發(fā)現其隱含表達,根據隱含表達特征進行商品推薦。

        Zheng等[1]提出深度協(xié)作神經網絡模型,在一定程度上緩解了推薦系統(tǒng)的數據稀疏問題。Chen等[2]在深度學習中將位置感知引入到個性化新聞推薦。Cheng等[3]提出一種深度與廣度學習結合的學習模型,利用多源異構數據來提高推薦的記憶能力和泛化能力。He等[4]提出一種神經協(xié)同過濾方法,可以對用戶與商品的交互函數進行學習。AutoML自動的學習能力也正在被應用到推薦系統(tǒng)。Naumov等[5]在基于推薦的深度模型中加入特殊的并行機制從而減少內存限制和加速訓練過程。Guan等[6]設計出一個深度多視模型來處理商品圖像、商品描述和評價等多種輸入的異構數據。Lee等[7]基于深度神經網絡提出一種可伸縮控制的協(xié)同濾波算法。

        知識圖譜與人類認知智能更加接近,這種知識賦能的推薦與深度學習的結合逐步會成為推薦系統(tǒng)的主流。Wang等[8]提出一種基于注意力模型的知識圖譜網絡,提高了推薦的準確性和可解釋性。Wang等[9]設計出一個多任務的深度學習框架,利用知識圖譜控制任務之間的知識交叉與遷移。Cao等[10]對推薦模型與知識圖譜進行聯合學習,突出了在理解用戶偏好方面的優(yōu)勢。同時在國內美團等大型餐飲平臺也都在積極構建自己的知識圖譜體系,用于客戶體驗更佳的推薦。

        對于沒有數據積累或業(yè)務數據量較少的中小電商企業(yè)來說,在冷啟動階段甚至在一個相當長的運營時間內都無法有效地利用內部的用戶和商品數據進行分析,也無法形成深度學習的大數據和產生有價值的知識圖譜體系,而其他大型平臺的選品工具不僅價格昂貴,而且系統(tǒng)很多時候不能真正地適應中小企業(yè)本地化的需求,尤其是地方特色很強的社區(qū)團購業(yè)務。針對這些問題,本文利用網絡開放的社區(qū)外賣數據,使用一種簡單有效的分析策略建立蛋肉、蔬菜和水果等快消品與社區(qū)的關聯,提供團購選品依據。

        2 研究內容

        2.1 整體框架與流程

        基本模式如圖1所示,核心思想是利用外部可以獲取到的大數據來初步分析一個社區(qū)或地區(qū)對于不同食品的喜好程度,比如社區(qū)附近的外賣數據、菜場數據、競品團購數據和超市數據等。把社區(qū)作為一個整體,分析社區(qū)的行為,獲取社區(qū)的共性。對于不同的社區(qū)推薦不同的菜譜與相關的食材,同時結合競品數據來分析菜譜主料對應單品的銷售和價格情況,從而指導選品。

        圖1 選品的基本模式

        整體業(yè)務流程包括線上業(yè)務和線下業(yè)務兩個部分。線下業(yè)務如圖2所示,主要是先對社區(qū)的外賣數據進行分析,從而得到小區(qū)喜愛食品的排名,然后將小區(qū)喜愛的食品與已有的菜譜數據進行關聯,從而得到小區(qū)喜愛菜譜的排名,將菜譜及排名信息與社區(qū)信息進行關聯;然后對競品數據進行分析,將菜譜中的主料與競品中的單品進行關聯。線下業(yè)務會提前處理,并根據需要定期地更新爬蟲數據與分析結果。線上業(yè)務如圖3所示,以菜譜數據為中心,可以根據菜譜的單個屬性以及多個屬性的組合進行查詢和展示,屬性主要包括:名稱、小區(qū)、類別、主題、主料、工藝、口味、難度和時間。為了選品,要分析菜譜中的主料與對應的單品,在選中單品后可以查看到單品在競品中的多維度的分析結果。

        圖2 線下業(yè)務基本流程 圖3 線上業(yè)務基本流程

        在實際業(yè)務中可以根據購物清單進行菜譜的推薦,這里需要推薦兩個方面的菜譜,一個是已有的所有單品可以組成的菜譜有哪些,另一個是使用部分購買的單品與系統(tǒng)可以購買的產品組合還可以產生哪些菜譜,這樣更有利于推薦用戶購買系統(tǒng)的其他商品。

        2.2 短文本相似度計算

        在本文方法中,菜譜名與外賣名的相關性度量以及菜譜主料與有效商品名的相關性度量都需要使用短文本相似度的計算,主要包括文本直接匹配和特征向量距離計算兩種方法。

        文本直接匹配的方法主要有最長公共子序列法(LCS)、編輯距離法和相同單詞個數法,編輯距離會忽略文字之間的連續(xù)性,對整體性差異進行度量。對于中文的處理,相同單詞個數法需要對短文本進行分詞處理,一方面分詞的準確性會直接影響到最終匹配的準確性;另一方面菜譜和食品等有較多的固定詞組,往往不太適合進行分詞。

        使用特征向量匹配的方法首先需要得到每個短文本的特征向量,然后使用歐氏距離或者余弦相似度等方法對向量的相似度進行度量。獲取文本的特征向量常見的有統(tǒng)計方法和機器學習訓練方法,統(tǒng)計方法主要是基于詞袋模型,比如文本的多熱向量編碼和TF-IDF統(tǒng)計編碼等,機器學習方法目前應用比較多的是基于深度學習的Word2Vec和Sentence2Vector方法。不管是統(tǒng)計方法和機器學習方法,都需要大量基于應用場景的語料庫,語料庫的豐富性和準確性決定了訓練出特征向量的價值,同時也有中文分詞準確性所帶來的問題,以及前文所提的菜譜與食品大量存在的固有詞匯,更容易導致分詞的錯誤,如果要避免分詞錯誤需要人工維護固有詞匯的字典,會帶來額外巨大的工作量,而且在本文方法中,主要是菜譜名和商品名的短文本,沒有大量上下文相關應用場景的語料庫。也可以考慮第三方訓練好可以直接使用的API接口,比如百度人工智能短文本相似度接口,除了收費價格問題以外,由于百度是通過大量的全文本的方式進行訓練,未必適用于本文所提的應用環(huán)境。

        還有一種混合法,不是一種獨立的算法,而是使用兩種或多種的結果,給予權重后混合度量結果。綜上所述可以看出,最長公共子序列法是適合于本文所提應用場景的最佳文本匹配方法,基本定義與算法描述如下。

        輸入兩個要匹配的中文序列X={x1,x2,…,xm}與Y={y1,y2,…,yn},|X|=m,|Y|=n,即長度分別為m與n(m≤n),LCS(X,Y)=lcs={l1,l2,…,lr},最長公共子序列為lcs,|lcs|=r。X1,i表示串x1x2…xi,1≤i≤m,Y1,i表示串y1y2…yj,1≤j≤m,則LCS(X1,i,Y1,j)=lcsi,j。該算法采用動態(tài)規(guī)劃思想,首先構造一個(m+1)×(n+1)矩陣,并進行初始化,如圖4(a)所示。

        (a) 初始化 (b) 得分過程圖4 得分矩陣L描述[11]

        然后按照式(1)來計算Li,j。

        式中:Li,j表示lcsi,j的長度,即|lcsi,j|=Li,j,Li,0=L0,j=0,0≤i≤m,0≤j≤n,|lcs|=Lm,n就是兩個中文序列最長公共子序列的長度。通過對Lm,n進行前向回溯,當回溯到L0,0時候就可以求出lcs。由于中文序列主要是菜名、食物名或食材名,所以不存在過于長的序列,可以使用該構造矩陣的方式進行求解,算法復雜度為o(mn)。圖4(b)例子中使用式(1)的計算函數構造出一個得分矩陣,通過自底向上回溯的方法求出兩個串的最長公共子串,圖4(b)中的箭頭表示LCS對應的關鍵路徑,當字符匹配的時候,矩陣中對應的分數會增加。

        2.3 數據預處理

        爬取的菜譜數據來自美食杰菜譜網站,一共有29 243條菜譜數據,主要字段包括菜譜名、主料、類別、輔料、粉絲數、點贊數、烹飪方法、烹飪時間、烹飪難度、菜譜圖片、制作過程、準備時間、特征標簽和味道等。預處理過程如下:

        1) 菜譜名查重:有4 924個有重復名的菜譜,只是配料和制作過程稍有不同。

        2) 重名處理方法:menu=argmax(fans(menu)),其中fans是獲取菜譜menu粉絲數的函數,即保留粉絲數最大的菜譜,其他重名菜譜去除。

        3) 字符串類型數字化:將字符串類型的烹飪時間與準備時間映射為整數類型,如式(2)所示。

        4) 缺失數據處理:有2 005條缺失烹飪時間數據,由于烹飪時間此處是分段的離散屬性,按照眾數的方法對缺失值進行填充,cooktimemiss=mode(cooktime)。

        爬取的外賣數據來自餓了么網站,一共有1 926 096條外賣數據,主要字段包括小區(qū)號、店鋪號、外賣商品名、價格、點贊、打分、月銷量等。預處理過程如下:

        1) 缺失數據處理:有5 361條數據存在缺失字段,由于外賣數據比較龐大,采用刪除處理的方法,只是保留字段完全的數據。

        2) 保留與菜譜關聯度高的外賣數據:去除缺失數據后依然有近兩百萬條數據,不僅包括各種食品,還包括各種各樣的日常消費品,比如礦泉水和飲料等。由于本文只是關注基于菜譜推薦的食材商品選品,所以需要去除在外賣品與食品無關的其他商品,在外賣數據的屬性中沒有對商品類型進行區(qū)分的字段,無法直接根據字段進行過濾去除。這里采用一種從菜譜開始的反向匹配策略:

        (1) 設置LCS匹配門限threshold=0.75。

        (2) 由于菜譜是必需的,從菜譜數據進行查詢,使用LCS匹配法計算每個菜譜名與所有外賣名的相似度simi(menu,takeout),如果大于等于threshold則保留。

        處理后與已有菜譜緊密相關的外賣品有89 872條。

        2.4 社區(qū)差異性分析

        2) 購買力歸一化:為了簡化表達,這里把社區(qū)的下標去除,sum=(sum-min)/(max-min),此處max和min分別表示所有sum中的最大與最小值。

        3) 去除銷售量過高的共性外賣:比如像炒土豆絲,炒白菜等由于價格低廉,又適合大眾口味,所以在每一個社區(qū)的銷量都會很高,需要去除。公式∩top20(

        4) 點贊數、打分和月銷量三個屬性歸一化:設thumb和score表示點贊與打分,針對每一個社區(qū),將三個屬性值標準化到0至1區(qū)間,thumb=(thumb-min)/(max-min),score=(score-min)/(max-min),sales=(sales-min)/(max-min)。

        5) 設置整體外賣受歡迎程度:popular=0.4×thumb+0.3×score+0.3×sales。

        6) 使用LCS匹配查找菜譜匹配的外賣食品:設置LCS匹配相似度門限threshold=0.75,超過門限值則匹配成功。find_takeout={simi(menu,takeout)≥0.75},find_takeout表示匹配成功的外賣食品,由于一個菜譜可能對應多個外賣食品,所以結果是一個集合。

        7) 計算單個菜譜受歡迎程度:menu_popular=mean(popular(find_takout)),使用多個匹配成功的外賣食品歡迎度的均值作為菜譜的歡迎度,這樣就可以計算出在某個時間段內每個社區(qū)整體上對于不同菜譜的喜好程度。

        8) 選品與推薦:針對每個社區(qū)選擇排名靠前的菜譜,菜譜的具體數量可以根據企業(yè)的業(yè)務能力進行自由調控,分析菜譜的具體食材,在對社區(qū)推薦喜愛菜譜的同時對菜譜所包括的食材商品同時進行推薦,通過差異化滿足不同社區(qū)的需求。

        2.5 競品分析

        本文分析的主要競品渠道來自其他團購平臺、電商和市場價平臺,具體如表1所示。

        表1 競品渠道

        本文在競品分析部分主要做的工作是找到與社區(qū)暢銷的菜譜主料所匹配的競品單品。在獲取的競品數據中,會對所有競品商品中的單品與小區(qū)暢銷的菜譜主料進行匹配,在使用最長公共子序列求串的相似度中發(fā)現,由于在競品單品中會出現名字較長的商品名,而與之對應的主料名較短,會導致相似度偏低,事實上該主料名是商品名中的核心詞匯,所以此處在匹配過程中增加單品名是否包含主料名的判斷,如果包含同樣認為是高度匹配。

        通過該方法,可以快速發(fā)現社區(qū)擬推薦的菜譜主料商品是否存在于當前階段的競品商品中,如果存在,則可以進一步對競品的該類商品數據進行統(tǒng)計分析,比如包括銷量分析、價格分析、渠道分析、區(qū)域分析等,為本團購平臺的選品提供決策指導,統(tǒng)計分析部分不是本文涉及內容。

        3 實驗與討論

        系統(tǒng)使用阿里云服務器ECS,8 vCPU,處理器型號為Intel Xeon(Cascade Lake) Platinum 8269CY,32 GB內存,操作系統(tǒng)為64位CentOS 7.7版本,數據庫采用MySQL 6.2版本,數據分析使用Python3.6.5版本。

        菜譜與外賣食品部分匹配結果如表2所示,對應關系基本上是一致的。

        表2 菜譜與外賣對應示例

        菜譜主料名與競品單品部分匹配結果如表3所示,對應關系基本上也是一致的。

        表3 菜譜主料與競品單品對應示例

        寧波市31個不同社區(qū)根據餓了么外賣數據分析出的購買力結果對比如表4所示,購買力使用歸一化后數值。

        表4 社區(qū)購買力對比

        選擇部分不同社區(qū)喜好菜譜所對應主料商品如表5所示。

        表5 社區(qū)商品推薦

        本項目所服務的團購平臺在試用系統(tǒng)后一個月內社區(qū)銷售增長率情況如表6所示,這里選擇5個增長率較高的社區(qū)進行顯示,對于31個不同社區(qū)的平均銷售額增長率為85.71%,平均有效訂單數增長率為70.45%,平均總銷售件數增長率為39.69%??梢钥闯鲈谝罁赓u數據分析基礎上進行選品推薦,可以有效地提高銷售額和訂單數。

        表6 社區(qū)銷售增長率對比(%)

        4 結 語

        社區(qū)團購是新零售時代下的電商產物,全國性與地方性的團購平臺依然在不斷地競爭和發(fā)展,正確的選品能夠幫助社區(qū)團購平臺提升客戶留存,體現社區(qū)團購的優(yōu)勢。由于住戶數據的安全性與保密性等因素,對社區(qū)進行畫像和獲取豐富的數據特征并非一件易事,尤其是對處于冷啟動階段的小型團購平臺企業(yè)。本文希望從可以獲取的外部開放平臺數據中來挖掘社區(qū)特征,利用社區(qū)的消費特征來引導差異化的選品,提升企業(yè)的經濟效益。當然本文方法不足以支撐一個完整的選品系統(tǒng),可以作為選品系統(tǒng)的數據補充與分析參考。

        猜你喜歡
        分析
        禽大腸桿菌病的分析、診斷和防治
        隱蔽失效適航要求符合性驗證分析
        電力系統(tǒng)不平衡分析
        電子制作(2018年18期)2018-11-14 01:48:24
        電力系統(tǒng)及其自動化發(fā)展趨勢分析
        經濟危機下的均衡與非均衡分析
        對計劃生育必要性以及其貫徹實施的分析
        GB/T 7714-2015 與GB/T 7714-2005對比分析
        出版與印刷(2016年3期)2016-02-02 01:20:11
        網購中不良現象分析與應對
        中西醫(yī)結合治療抑郁癥100例分析
        偽造有價證券罪立法比較分析
        在线亚洲欧美日韩精品专区| 亚洲av网站在线免费观看| 亚洲成人精品久久久国产精品| 777精品出轨人妻国产| 国产成人一区二区三区在线观看| 粗大挺进尤物人妻一区二区| 亚洲国产成人久久精品美女av| 激情综合五月| 男女一边摸一边做爽爽的免费阅读| 无码日韩人妻AV一区免费| av资源在线播放网站| 最新国产熟女资源自拍| 久久精品国产视频在热| 五月天国产精品| 一区二区中文字幕蜜桃| 久久精品国产亚洲av超清| 东北妇女xx做爰视频| 国产乱人伦AV在线麻豆A| 日本一区二区三区在线观看视频| 男人的天堂av高清在线| 日韩亚洲av无码一区二区不卡| 免费黄网站久久成人精品| 色婷婷av一区二区三区丝袜美腿| 午夜精品久久久久久久无码| 亚洲成在人线av| 国内自拍第一区二区三区| 日韩精品一区二区三区在线视频 | 亚洲精品国产av成拍色拍| 极品老师腿张开粉嫩小泬| 日日碰狠狠丁香久燥| 国产精品国产午夜免费看福利| 国产高潮流白浆视频在线观看 | 日产一区日产2区日产| 国产高潮视频在线观看| 欧美日韩精品福利在线观看| 国产熟妇一区二区三区网站| 亚洲乱码无人区卡1卡2卡3| 亚洲国产人在线播放首页| 无码视频一区=区| 亚洲午夜精品一区二区麻豆av| 西西人体444www大胆无码视频|