徐慧琴,郝風(fēng)平,方志偉,聶莉娟
(金肯職業(yè)技術(shù)學(xué)院,江蘇 南京 210000)
在當(dāng)今數(shù)字化時代,廣告?zhèn)鞑ヒ呀?jīng)從傳統(tǒng)的媒體平臺轉(zhuǎn)向了互聯(lián)網(wǎng)和新媒體渠道。這種轉(zhuǎn)變推動了個性化廣告?zhèn)鞑サ呐d起,為廣告主和消費者之間的互動提供了新的機(jī)遇和挑戰(zhàn)[1]。個性化廣告?zhèn)鞑ゼ夹g(shù)通過采集用戶行為、興趣和特征等數(shù)據(jù),能夠精確地向目標(biāo)受眾傳遞廣告信息,滿足他們多樣化的需求和興趣。相比傳統(tǒng)的廣告?zhèn)鞑シ绞?基于算法推薦的個性化廣告?zhèn)鞑ゾ哂懈叩木珳?zhǔn)度和效果,同時也可以減少資源浪費。本文旨在深入研究基于算法推薦的個性化廣告?zhèn)鞑?探討其原理、實現(xiàn)流程和效果評估等,并解決其中存在的問題與挑戰(zhàn)。通過對該領(lǐng)域的深入剖析和實證研究,希望為廣告行業(yè)提供有效的個性化廣告?zhèn)鞑ソ鉀Q方案,推動該技術(shù)的進(jìn)一步創(chuàng)新和發(fā)展。
個性化廣告推薦技術(shù)的核心思想是基于用戶的行為、興趣和社交等信息,對廣告進(jìn)行個性化推薦,提高廣告的效果和用戶滿意度。根據(jù)推薦算法的不同,個性化廣告推薦技術(shù)可以分為基于協(xié)同過濾的算法、基于內(nèi)容的算法、基于混合算法的算法等[2]。
基于協(xié)同過濾的算法是一種利用用戶之間的相似性和共同行為模式進(jìn)行推薦的方法,通過分析用戶的歷史行為找到與其相似的用戶或物品,從而推薦給用戶與其興趣相關(guān)的廣告。具體來說,基于協(xié)同過濾的算法分為基于用戶的協(xié)同過濾和基于物品的協(xié)同過濾。
基于用戶的協(xié)同過濾是通過分析用戶之間的相似度來找到興趣相似的用戶,從而推薦廣告。在具體實施時首先是計算用戶之間的相似度,通常采用余弦相似度、Jaccard相似度等指標(biāo)進(jìn)行計算;接著根據(jù)用戶相似度對廣告進(jìn)行推薦,通常采用最近鄰算法、基于矩陣分解的算法等進(jìn)行計算。
基于物品的協(xié)同過濾則是通過分析廣告之間的相似度,找到與目標(biāo)廣告相似的廣告,從而推薦給用戶?;谖锲返膮f(xié)同過濾算法在計算相似度推薦時通常采用基于物品的最近鄰算法等方法。
基于內(nèi)容的算法是一種基于廣告內(nèi)容的推薦算法,它通過分析廣告的特征和內(nèi)容,找到與用戶興趣相似的廣告,從而進(jìn)行推薦。基于內(nèi)容的算法分為以下幾個階段:
第一階段,對廣告的內(nèi)容進(jìn)行分析和特征提取。通常采用自然語言處理技術(shù)和機(jī)器學(xué)習(xí)技術(shù)對廣告進(jìn)行文本處理、特征提取和降維處理,從而得到廣告的特征向量。
第二階段,對用戶進(jìn)行興趣建模。通常采用協(xié)同過濾算法、聚類算法等技術(shù)對用戶的歷史行為和興趣進(jìn)行建模,從而得到用戶的興趣向量。
第三階段,計算廣告和用戶之間的相似度。通常采用余弦相似度、歐式距離、曼哈頓距離等指標(biāo)計算廣告和用戶之間的相似度。
第四階段,根據(jù)相似度對廣告進(jìn)行推薦。通常采用基于內(nèi)容的最近鄰算法、基于貝葉斯分類器的算法等對廣告進(jìn)行推薦。
基于混合算法的算法是一種將多種推薦算法進(jìn)行混合的推薦算法,旨在提高推薦準(zhǔn)確率和覆蓋率。基于混合算法的算法可以分為多種類型,如基于加權(quán)融合的算法、基于規(guī)則融合的算法、基于深度學(xué)習(xí)的算法等。將多種推薦算法進(jìn)行整合,從而提高推薦準(zhǔn)確率和覆蓋率?;诨旌纤惴ǖ乃惴ㄊ紫仁遣捎貌煌耐扑]算法對廣告進(jìn)行推薦,例如:基于協(xié)同過濾的算法、基于內(nèi)容的算法等;接著對推薦算法的結(jié)果進(jìn)行不同技術(shù)的融合,如加權(quán)融合、規(guī)則融合等,從而得到最終的推薦結(jié)果。
基于算法推薦的個性化廣告?zhèn)鞑ゼ夹g(shù)是一種利用用戶數(shù)據(jù)和算法模型進(jìn)行廣告精準(zhǔn)推薦的方法。該技術(shù)的實現(xiàn)流程主要包括以下幾個方面。
個性化廣告推薦系統(tǒng)的實現(xiàn)需要收集和處理用戶和廣告數(shù)據(jù),包括用戶的行為數(shù)據(jù)、興趣數(shù)據(jù)和社交關(guān)系數(shù)據(jù),以及廣告的內(nèi)容、結(jié)構(gòu)、語言風(fēng)格等數(shù)據(jù)。(1)從目標(biāo)數(shù)據(jù)源(如數(shù)據(jù)庫、網(wǎng)站等)獲取原始數(shù)據(jù),為了確保數(shù)據(jù)的準(zhǔn)確性和完整性,對原始數(shù)據(jù)進(jìn)行清洗操作。(2)進(jìn)行數(shù)據(jù)的轉(zhuǎn)換與整合,將不同格式和來源的數(shù)據(jù)進(jìn)行統(tǒng)一表示,完成數(shù)據(jù)的轉(zhuǎn)換與整合之后,通過特征選擇與構(gòu)建,從數(shù)據(jù)中提取出與研究目標(biāo)相關(guān)的有代表性的特征。(3)進(jìn)行特征縮放和特征歸一化,消除不同特征間的尺度差異。(4)對預(yù)處理后的數(shù)據(jù)集進(jìn)行劃分,將其分為訓(xùn)練集和測試集,并進(jìn)行必要的數(shù)據(jù)集平衡處理,以確保兩個數(shù)據(jù)集的樣本分布較為均衡。通過這些步驟,本研究得到了高質(zhì)量、適用于后續(xù)分析和建模的數(shù)據(jù)集,為研究提供了可靠的基礎(chǔ)。具體的數(shù)據(jù)采集及預(yù)處理運行流程如圖1所示。
圖1 數(shù)據(jù)采集及預(yù)處理運行流程
在用戶數(shù)據(jù)分析的基礎(chǔ)上,可以將用戶標(biāo)記為不同的興趣類別或特征標(biāo)簽。用戶標(biāo)簽建模的核心步驟涉及特征提取。特征提取通過分析用戶的歷史行為數(shù)據(jù)和其他相關(guān)信息,本研究采用邏輯回歸算法提取具有代表性和區(qū)分性的特征。
P(y=1|x)=1/(1+exp(-(wT×x+b)))
(1)
式(1)表達(dá)了目標(biāo)變量取值為1的概率,x是輸入特征向量,w和b是模型參數(shù)。wT表示w的轉(zhuǎn)置,exp表示自然指數(shù)函數(shù)。邏輯回歸算法的核心思想是通過對輸入特征進(jìn)行線性加權(quán)組合,并將結(jié)果通過一個特定的sigmoid函數(shù)映射到0和1之間的概率范圍內(nèi),在這里采用梯度下降算法迭代更新參數(shù)w和b的值,使其能夠最小化損失函數(shù)。
個性化廣告推薦的實現(xiàn)需要選擇合適的相似度計算方法和推薦算法,從而計算廣告和用戶之間的相似度,并將廣告進(jìn)行排序和推薦。目前,常用的相似度計算方法包括余弦相似度、歐式距離、曼哈頓距離等指標(biāo),常見的推薦算法包括協(xié)同過濾、內(nèi)容推薦和混合推薦等。協(xié)同過濾算法基于用戶行為的相似性進(jìn)行推薦,內(nèi)容推薦算法根據(jù)廣告內(nèi)容與用戶興趣的匹配程度進(jìn)行推薦,而混合推薦算法結(jié)合了多個算法的優(yōu)勢。選擇合適的算法可以提高廣告推薦的準(zhǔn)確性和效果。本研究選擇基于余弦相似度的協(xié)同過濾推薦算法進(jìn)行實現(xiàn)。基于余弦相似度的協(xié)同過濾推薦算法是利用用戶的歷史行為數(shù)據(jù),通過計算評分向量之間的余弦相似度來度量用戶之間的相似程度,進(jìn)而實現(xiàn)個性化推薦。
首先構(gòu)建用戶-物品評分矩陣:創(chuàng)建一個評分矩陣ratings,其中每一行代表一個用戶對物品的評分。這個評分矩陣可以根據(jù)實際情況進(jìn)行定義和填充。
下一步通過計算用戶之間評分向量的余弦相似度,找到與目標(biāo)用戶最相似的若干個用戶,余弦相似度是一種衡量向量之間相似性的方法。
(2)
式(2)中A和B表示兩個n維向量,A是 [A1,A2, …,An] ,B是 [B1,B2, …,Bn],‖A‖和‖B‖分別表示向量A和向量B的長度,A與B的夾角θ的余弦相似度的計算過程涉及將向量映射到高維空間并計算它們之間的夾角。結(jié)果范圍在-1到1之間,當(dāng)兩個向量的夾角接近于0°時,也就是它們的方向幾乎相同,此時余弦相似度接近于1,表示兩個向量非常相似。當(dāng)夾角接近于90°時,也就是它們的方向幾乎垂直,此時余弦相似度接近于0,表示兩個向量之間沒有明顯的相似性。當(dāng)夾角接近于180°時,也就是它們的方向完全相反,此時余弦相似度接近于-1,表示兩個向量完全不相似。
一旦找到最相似的用戶,算法就可以利用這些用戶的喜好和行為模式來預(yù)測目標(biāo)用戶對尚未評價的物品的喜好程度。通常情況下,該算法會根據(jù)最相似用戶對尚未評價物品的平均評分或加權(quán)平均評分,將這些物品推薦給目標(biāo)用戶。
(3)
式(3)為用戶的相似度,其中wnn′是用戶n與用戶n′的相似度,rn表示用戶n的評分向量。
(4)
式(4)為相似用戶的加權(quán)平均值,rnm是用戶n對商品m的評分,inm(0,1)表示用戶n對商品m有無評分,1表示有評分,0表示無評分。Un為用戶n的相似用戶集合。
基于余弦相似度的協(xié)同過濾推薦算法,可以利用歷史數(shù)據(jù)來計算用戶之間的相似度,并結(jié)合用戶的評分?jǐn)?shù)據(jù)進(jìn)行訓(xùn)練,預(yù)測用戶可能感興趣的廣告內(nèi)容。模型訓(xùn)練采用矩陣分解算法,核心是將用戶-物品評分矩陣分解為兩個低維度的矩陣,通過學(xué)習(xí)得到的隱含特征向量表示用戶和物品的關(guān)系。這種隱含特征向量可以捕捉到用戶和物品之間的潛在關(guān)聯(lián),從而能夠準(zhǔn)確地評分預(yù)測和推薦,矩陣分解算法在協(xié)同過濾推薦中被廣泛應(yīng)用于提高推薦準(zhǔn)確性和個性化度。
(5)
式(5)中P矩陣是N個用戶對K個主題的關(guān)系,Q矩陣是K個主題跟M個物品的關(guān)系,至于K個主題具體是什么,在算法里面K是一個參數(shù),需要調(diào)節(jié),通常為10~100。如何來衡量分解后的矩陣與原始評分矩陣之間的誤差或差異程,本研究采用損失函數(shù)來求解,也就是式(6)中所有的非“-”項(即原有矩陣?yán)镂丛u分項)的損失之和的最小值。
(6)
一旦模型訓(xùn)練完成,可以根據(jù)用戶-物品評分表和相似度矩陣表使用協(xié)同過濾算法生成推薦結(jié)果表。推薦結(jié)果表中列出了針對每個用戶的未評分物品的推薦評分,這些評分代表了用戶可能對該物品的喜好程度[3]。推薦結(jié)果的評分是通過將其他相似用戶對相似物品的評分進(jìn)行加權(quán)計算得出的,具有較高相似度得分的用戶對推薦結(jié)果產(chǎn)生更大的影響。通常,推薦結(jié)果的評分范圍與用戶-物品評分表中的評分范圍相似,較高的評分表示用戶可能更感興趣。
通過提供個性化的推薦體驗,推薦結(jié)果可以幫助用戶發(fā)現(xiàn)他們可能未注意到的物品,并根據(jù)用戶的反饋和行為數(shù)據(jù)進(jìn)行效果追蹤[4]。
用戶-物品評分如表1所示,以用戶為行,以物品為列,每個單元格中的數(shù)值表示用戶對物品的評分。該表格用于存儲用戶對物品的評價信息,是協(xié)同過濾算法的基礎(chǔ)數(shù)據(jù)。表中有4個用戶(User1、User2、User3、User4)和6個物品(Item1、Item2、Item3、Item4、Item5、Item6)。其中,缺失的評分用“-”表示,例如:User1對Item2的評分為3,而User4對Item3的評分為-。
表1 用戶-物品評分
相似矩陣如表2所示,顯示不同用戶或物品之間的相似度得分。表格的行和列代表用戶或物品,每個單元格中的數(shù)值表示相似度分?jǐn)?shù),范圍從0到1。例如:User1和User2的相似度得分為0.3,User3和User4之間的相似度得分為0.5。
表2 相似矩陣
推薦結(jié)果如表3所示,顯示協(xié)同過濾算法生成的推薦結(jié)果。每個單元格表示相應(yīng)用戶對該物品的推薦評分。推薦評分是根據(jù)其他用戶對相似物品的評分加權(quán)計算得出的。例如:對于User1,Item1的推薦評分為2.7,Item2的推薦評分為2.2。
表3 推薦結(jié)果
本研究通過研究基于算法推薦的個性化廣告?zhèn)鞑ゼ夹g(shù),探索了如何利用用戶數(shù)據(jù)和算法模型實現(xiàn)廣告精準(zhǔn)推薦。通過對用戶數(shù)據(jù)的分析和建模,本研究能夠更好地理解用戶的興趣和需求,并為其提供個性化的廣告推薦。選擇適合的推薦算法并對模型進(jìn)行訓(xùn)練和優(yōu)化,使得廣告推薦更加準(zhǔn)確和有效。通過實施該技術(shù),廣告主可以將廣告消息精準(zhǔn)地傳遞給目標(biāo)用戶,提高廣告?zhèn)鞑サ木珳?zhǔn)度和點擊率[5]。同時,消費者也能夠獲取到更符合其個人興趣和需求的廣告內(nèi)容,提供更有價值的廣告體驗。然而,個性化廣告?zhèn)鞑ゼ夹g(shù)仍然面臨一些挑戰(zhàn)和限制,隱私保護(hù)是一個重要的問題,需要平衡用戶數(shù)據(jù)的使用和個人隱私權(quán)益。另外,用戶行為和興趣的變化也是一個動態(tài)的過程,需要不斷更新和優(yōu)化推薦算法和模型,以確保廣告投放的效果。
綜上所述,基于算法推薦的個性化廣告?zhèn)鞑ゼ夹g(shù)在提供精準(zhǔn)廣告推薦和滿足消費者需求方面具有廣闊的應(yīng)用前景。未來的研究可以進(jìn)一步探索用戶數(shù)據(jù)的利用方式、改進(jìn)算法模型的效果,并深入研究廣告效果評估和隱私保護(hù)等問題,以進(jìn)一步完善該技術(shù)并推動其在實際應(yīng)用中的廣泛使用。