李 圓,于 淼
(青島大學(xué) 紡織服裝學(xué)院,山東 青島 266071)
近年來(lái),電子商務(wù)成為人們購(gòu)物的主要渠道,特別是服裝領(lǐng)域,已經(jīng)成為線上購(gòu)物的最大品類,并且銷售規(guī)模逐年增長(zhǎng)[1]。伴隨著服裝網(wǎng)購(gòu)市場(chǎng)規(guī)模的不斷擴(kuò)大,產(chǎn)生了海量的服裝商品數(shù)據(jù)信息。用戶在海量、不斷增長(zhǎng)的服裝資源中快速選擇出自己心儀的服裝變得不那么容易。使用推薦系統(tǒng)能夠從海量數(shù)據(jù)中篩選出用戶可能會(huì)購(gòu)買的商品,過(guò)濾冗余數(shù)據(jù),減少由于數(shù)據(jù)過(guò)載給消費(fèi)者造成的不便。推薦系統(tǒng)能夠有效提供服裝推薦,并對(duì)消費(fèi)者的選擇做出快速反應(yīng),提高用戶體驗(yàn)感,對(duì)電子商務(wù)銷售的發(fā)展重要貢獻(xiàn)。
從本質(zhì)上說(shuō),推薦系統(tǒng)通過(guò)分析用戶的信息來(lái)評(píng)估用戶對(duì)產(chǎn)品的喜好,并將預(yù)測(cè)結(jié)果中喜好度較高的產(chǎn)品反饋給用戶。推薦系統(tǒng)產(chǎn)生于1990年代,根據(jù)獲取的用戶信息,基于計(jì)算信息的能力,找到用戶需求的商品[2]。經(jīng)過(guò)幾十年的發(fā)展,基于文本信息的推薦技術(shù)已經(jīng)得到了很大的研究和發(fā)展,在商業(yè)上的應(yīng)用也取得了成功。然而,隨著圖像信息技術(shù)的發(fā)展,圖像相比于文本能夠?qū)Ψb進(jìn)行更好的描述,基于圖像的推薦受到越來(lái)越多的關(guān)注[3]。在10世紀(jì)10年代中期,機(jī)器學(xué)習(xí)領(lǐng)域的深度神經(jīng)網(wǎng)絡(luò)(又稱深度學(xué)習(xí))的興起,徹底改變了語(yǔ)音識(shí)別、計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理等多個(gè)領(lǐng)域。深度學(xué)習(xí)(DL)被廣泛應(yīng)用到圖像識(shí)別的各個(gè)領(lǐng)域,在服裝推薦方面也取得了巨大成功。因此,在過(guò)去的幾年里出現(xiàn)了許多開(kāi)發(fā)深度學(xué)習(xí)方法的推薦系統(tǒng)的工作[4-5]。
本文以當(dāng)前國(guó)內(nèi)外對(duì)服裝推薦的研究現(xiàn)狀為基礎(chǔ),歸納了包括服裝圖像的目標(biāo)識(shí)別與分割、服裝特征提取、服裝推薦算法的服裝推薦過(guò)程,著重介紹了5種深度學(xué)習(xí)的服裝推薦算法模型,分析各個(gè)模型的特點(diǎn),闡述了服裝推薦個(gè)性化的發(fā)展趨勢(shì),為服裝推薦的發(fā)展提供助力。
服裝推薦系統(tǒng)構(gòu)架來(lái)源于機(jī)器學(xué)習(xí)的思想,從網(wǎng)絡(luò)上獲取圖像數(shù)據(jù),對(duì)圖像中的服裝進(jìn)行識(shí)別與分割以消除背景的影響,提取圖像中服裝的特征(如顏色、款式、風(fēng)格)實(shí)現(xiàn)服裝描述,進(jìn)而對(duì)服裝進(jìn)行分類,依據(jù)不同的算法進(jìn)行推薦。服裝推薦涉及到的關(guān)鍵技術(shù)包括服裝圖像的目標(biāo)識(shí)別與分割、服裝特征提取、服裝推薦算法3部分,服裝推薦過(guò)程如圖1所示。
圖1 服裝推薦過(guò)程
由于有些服裝圖像具有復(fù)雜的背景,因此需要對(duì)圖像進(jìn)行處理,在背景中識(shí)別出服裝,進(jìn)行分割,消除背景干擾信息,保留有用信息,避免對(duì)后續(xù)服裝推薦產(chǎn)生影響。
基于傳統(tǒng)的圖像分割方法包括基于閾值的分割方法、基于邊緣的分割方法、基于聚類的分割方法、基于區(qū)域的分割方法、基于圖類的分割方法以及基于特定理論的圖像分割方法等[6]。傳統(tǒng)圖像分割方法大多利用圖像的表層信息,分割圖像準(zhǔn)確率和計(jì)算效率較低,在進(jìn)行服裝圖像分割時(shí)往往包含背景等無(wú)關(guān)信息。
基于深度學(xué)習(xí)的圖像分割方法利用圖像的語(yǔ)義信息,能夠應(yīng)復(fù)雜的場(chǎng)景圖像進(jìn)行分割?;谏疃葘W(xué)習(xí)的圖像分割方法更加精確高效,分割效果較為細(xì)致。深度學(xué)習(xí)充分利用圖像的語(yǔ)義信息進(jìn)行分割,在準(zhǔn)確性和效率方面遠(yuǎn)遠(yuǎn)超過(guò)傳統(tǒng)圖像分割方法。深度學(xué)習(xí)技術(shù)的關(guān)鍵優(yōu)勢(shì)[7]是能夠以端到端的方式學(xué)習(xí)圖像的特征表示,對(duì)圖像進(jìn)行像素級(jí)別的分類。
Mask R-CNN[8]模型是常見(jiàn)的基于深度學(xué)習(xí)的圖像分割方法,在服裝檢測(cè)中應(yīng)用較多。Mask R-CNN是Faster R-CNN的擴(kuò)展,添加一個(gè)并行的分割掩碼來(lái)預(yù)測(cè)每個(gè)感興趣區(qū)域,能夠有效地檢測(cè)圖像中的對(duì)象,同時(shí)為每個(gè)實(shí)例生成高質(zhì)量的分割掩碼,因此Mask R-CNN模型更加靈活,可以用來(lái)完成標(biāo)分類、目標(biāo)檢測(cè)、實(shí)例分割、人體姿態(tài)識(shí)別等任務(wù)。用于實(shí)例分割的Mask R-CNN框架如圖2所示。Paulauskaite等[9]利用優(yōu)化的UNet模型進(jìn)行服裝分割和形狀輪廓提取,UNet收集有關(guān)照片中服裝位置的信息,通過(guò)這些數(shù)據(jù),該算法可以輕松識(shí)別服裝上的關(guān)鍵點(diǎn),在經(jīng)典UNet結(jié)構(gòu)中增加了額外的編碼和解碼層,消除了圖像中可見(jiàn)的無(wú)關(guān)偽影,并解決了不同環(huán)境條件的問(wèn)題。Wang[10]將基于區(qū)域的全卷積網(wǎng)絡(luò)(R-FCN)引入服裝圖像識(shí)別,并提出改進(jìn)的HSR-FCN模型,該模型能夠?qū)斎氲姆b圖像和特征圖進(jìn)行空間變換和對(duì)齊,對(duì)多角度服裝和變形服裝加強(qiáng)特征學(xué)習(xí),并且在更短的訓(xùn)練時(shí)間下得到了更高的準(zhǔn)確率,平均準(zhǔn)確率比原始網(wǎng)絡(luò)模型R-FCN的提高了約3%,達(dá)到96.69%。
圖2 Mask R-CNN的基本框架
服裝特征通常分為低層傳統(tǒng)特征和高級(jí)語(yǔ)義特征[11]。服裝特征提取類型和方法如表1所示。低層傳統(tǒng)特征包括服裝的形狀、顏色、紋理等。形狀特征的提取可以通過(guò)提取服裝輪廓的邊緣信息來(lái)識(shí)別的基于邊緣的形狀法或是分析圖像中服裝灰度的分布信息的基于區(qū)域的形狀方法。顏色的特征提取方法有顏色直方圖、顏色相關(guān)圖、顏色矩及顏色一致性矢量等。顏色直方圖已被廣泛應(yīng)用于目標(biāo)識(shí)別與特征提取[12]。顏色直方圖[13]將顏色劃分區(qū)域,計(jì)算每個(gè)區(qū)域的比例,優(yōu)點(diǎn)是操作、存儲(chǔ)和比較速度快,但對(duì)旋轉(zhuǎn)和縮放不敏感。局部二值模式(LBP)[14]可以用于對(duì)服裝圖像紋理的特征提取。圖像首先被分割成若干塊,以保留一定的幾何信息,每個(gè)圖像被劃分為5 × 4個(gè)子區(qū)域,然后對(duì)于每個(gè)子區(qū)域,提取像素點(diǎn)LBP特征并將其連接以用于直方圖表示,利用子區(qū)域直方圖表示整張服裝圖像紋理特征。
表1 服裝特征提取
高級(jí)語(yǔ)義特征在服裝相關(guān)領(lǐng)域中指服裝屬性及風(fēng)格。深度學(xué)習(xí)技術(shù)通過(guò)學(xué)習(xí)特征以及對(duì)圖像卓越的辨別能力,在語(yǔ)義分割和特征檢測(cè)領(lǐng)域上取得了可喜的成果。深度神經(jīng)網(wǎng)絡(luò)能夠?qū)W習(xí)數(shù)據(jù)中的復(fù)雜模式,這意味著其可以從傳統(tǒng)方法難以學(xué)習(xí)的圖像中提取特征。深度學(xué)習(xí)具有高度可擴(kuò)展性,支持在大型數(shù)據(jù)集上訓(xùn)練非常大的深度神經(jīng)網(wǎng)絡(luò),因此能夠以比傳統(tǒng)方法更高的抽象級(jí)別從圖像中提取特征。深度學(xué)習(xí)目前面臨著諸多挑戰(zhàn)[15],其有效性嚴(yán)重依賴于大型數(shù)據(jù)集,計(jì)算復(fù)雜度非常高,通常被認(rèn)為是可解釋性差的黑盒模型。隨著深度學(xué)習(xí)在圖像領(lǐng)域的發(fā)展,基于深度學(xué)習(xí)的圖像特征提取在服裝特征提取上得到了較多應(yīng)用。Zhang等[16]提出了一種混合多標(biāo)簽卷積神經(jīng)網(wǎng)絡(luò)用于捕捉服裝屬性,將卷積神經(jīng)網(wǎng)絡(luò)推進(jìn)到多標(biāo)簽策略中,并通過(guò)探索標(biāo)簽相關(guān)性考慮服裝項(xiàng)目的不均勻分布,用其來(lái)識(shí)別53個(gè)細(xì)粒度的服裝項(xiàng)目。Li等[17]利用目標(biāo)檢測(cè)技術(shù)和深度殘差網(wǎng)絡(luò)(ResNet)提取服裝的綜合特征,使識(shí)別過(guò)程集中在服裝本身上,消除了背景和其他干擾因素的影響,很大程度上提高服裝風(fēng)格識(shí)別的準(zhǔn)確性,但是當(dāng)服裝圖像被嚴(yán)重遮擋時(shí),識(shí)別率將降低。Chen等[18]設(shè)計(jì)了雙關(guān)注的ConvNeXt網(wǎng)絡(luò),通過(guò)合理挖掘服裝細(xì)粒度的屬性,利用服裝類型轉(zhuǎn)移訓(xùn)練服裝風(fēng)格,達(dá)到有效地預(yù)測(cè)服裝的類型和款式。該模型和方法不僅有效提高識(shí)別的速度和準(zhǔn)確率,在處理能力上具有靈活的多樣性。
推薦算法是推薦系統(tǒng)中最核心的部分,在類型和性能評(píng)估中起著決定性作用[19]。受深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)和語(yǔ)言理解方面取得巨大成功的影響,推薦研究已轉(zhuǎn)向基于神經(jīng)網(wǎng)絡(luò)的新推薦算法模型。在開(kāi)發(fā)服裝推薦系統(tǒng)時(shí),最常用的基于深度學(xué)習(xí)的服裝推薦算法模型是卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、多層感知器(MLP)、生成對(duì)抗網(wǎng)絡(luò)(GAN)和貝葉斯網(wǎng)絡(luò)。
1.3.1 卷積神經(jīng)網(wǎng)絡(luò)(CNN)
卷積神經(jīng)網(wǎng)絡(luò)[20]主要由卷積層、池化層和全連接層3種類型的層組成。卷積神經(jīng)網(wǎng)絡(luò)具有聯(lián)合特征和分類器學(xué)習(xí)的能力,在大規(guī)模數(shù)據(jù)集上具有較好的分類精度。CNN以其強(qiáng)大的特征提取和圖像分類能力在推薦系統(tǒng)中非常流行。使用預(yù)先訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行特征提取并為用戶生成產(chǎn)品(特別是衣服)的推薦。Tuinhof等[21]使用CNN作為服裝圖像特征提取器,提取客戶上傳的服裝圖像類型特征,使用排名算法提供與圖片類似的商品推薦,但是特征提取和特征排名推薦是2個(gè)獨(dú)立的階段,而不是完整的系統(tǒng)。Yu等[22]使用由1個(gè)深度CNN結(jié)構(gòu)和1個(gè)高級(jí)合成網(wǎng)絡(luò)組成的腦啟發(fā)深度網(wǎng)絡(luò)提取整體特征來(lái)表示服裝產(chǎn)品的審美元素,利用了1種張量因子分解模型,將審美特征納入模型中,以捕捉消費(fèi)者在特定時(shí)間的審美偏好,實(shí)驗(yàn)表明,該模型能夠揭示消費(fèi)者的審美偏好,并推薦符合其審美的服裝。
1.3.2 循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)
循環(huán)神經(jīng)網(wǎng)絡(luò)[23]體系結(jié)構(gòu)的典型特征是循環(huán)連接,這使RNN能夠根據(jù)過(guò)去的狀態(tài)和當(dāng)前輸入數(shù)據(jù)更新當(dāng)前狀態(tài)。卷積神經(jīng)網(wǎng)絡(luò)的一個(gè)缺點(diǎn)是其在建模長(zhǎng)跨度關(guān)系方面較弱。相比于卷積神經(jīng)網(wǎng)絡(luò),循環(huán)神經(jīng)網(wǎng)絡(luò)能夠更好的處理數(shù)據(jù)中的時(shí)間信息。然而RNN在處理輸入相差較大的數(shù)據(jù)時(shí)無(wú)法連接相關(guān)信息。為了解決這個(gè)問(wèn)題,Hochreiter等[24]提出了長(zhǎng)短期記憶(LSTM),基于RNN的很多結(jié)果都是由LSTM實(shí)現(xiàn)的,LSTM能夠?qū)W習(xí)上下文信息,在推薦系統(tǒng)中利用該功能可獲取全局特征或進(jìn)行偏好預(yù)測(cè)。Li等[25]基于用戶的評(píng)論和評(píng)分?jǐn)?shù)據(jù),使用LSTM掌握上下文信息,結(jié)合注意機(jī)制,捕獲全局方面表征,結(jié)合CNN捕獲的局部方面特征,2個(gè)并行通道學(xué)習(xí)用戶方面特征和項(xiàng)目方面特征,來(lái)提供更準(zhǔn)確的用戶評(píng)分預(yù)測(cè)。Wu等[26]構(gòu)建了一個(gè)深度循環(huán)神經(jīng)網(wǎng)絡(luò),利用深度RNN追蹤用戶的瀏覽歷史,提取用戶購(gòu)買模式,在模型中,用戶會(huì)話表示為一系列網(wǎng)頁(yè),表示從第1頁(yè)到購(gòu)買項(xiàng)目的路徑,模型提取用戶常見(jiàn)的購(gòu)買模式,并嘗試為未來(lái)用戶縮短路徑,因此用戶可以快速到達(dá)所需產(chǎn)品的頁(yè)面,該模型可為電子商務(wù)網(wǎng)站進(jìn)行實(shí)時(shí)推薦。
1.3.3 多層感知器(MLP)
多層感知器[27]是一種人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),由輸入層、輸出層和隱藏層3種類型的層組成。MLP能夠逼近任何連續(xù)函數(shù),而不僅僅是線性函數(shù),并且可以解決不可線性分離的問(wèn)題。MLP是CNN的經(jīng)典類型,CNN訓(xùn)練收斂更快,誤差更小,準(zhǔn)確率更好,但是訓(xùn)練時(shí)間會(huì)更長(zhǎng)。MLP的訓(xùn)練通常通過(guò)使用涉及2個(gè)階段的反向傳播 (BP) 算法來(lái)完成,實(shí)現(xiàn)簡(jiǎn)單,計(jì)算效率高。MLP模型已被應(yīng)用到很多推薦模型,包括服裝方面的推薦。Lu等[28]提出一種基于圖的算法,利用改進(jìn)的核函數(shù)學(xué)習(xí)所有用戶的偏好和興趣,采用MLP方法將用戶和物品的向量映射到神經(jīng)網(wǎng)絡(luò)中,通過(guò)神經(jīng)元的操作來(lái)學(xué)習(xí)用戶和物品之間更多的潛在信息,該方法不僅可以通過(guò)將用戶信息映射到網(wǎng)絡(luò)來(lái)發(fā)現(xiàn)用戶之間的一些潛在特征,而且將帶有評(píng)級(jí)信息的向量改進(jìn)為MLP方法,預(yù)測(cè)項(xiàng)目的評(píng)級(jí),因而可以獲得更高的精度和推薦效果。
1.3.4 生成對(duì)抗網(wǎng)絡(luò)(GAN)
生成對(duì)抗網(wǎng)絡(luò)[29]是一種生成性神經(jīng)網(wǎng)絡(luò)模型,旨在生成看起來(lái)像真實(shí)數(shù)據(jù)的圖像。GAN包括一個(gè)生成器和一個(gè)判別器,兩者都在對(duì)抗性學(xué)習(xí)理念下進(jìn)行訓(xùn)練。生成器的輸入是低維噪聲矢量。它將噪聲轉(zhuǎn)換為數(shù)據(jù)向量,從而形成潛在的數(shù)據(jù)樣本。鑒別器將該數(shù)據(jù)向量作為輸入,并根據(jù)該數(shù)據(jù)向量來(lái)自原始數(shù)據(jù)分布的可能性為其分配分?jǐn)?shù)。GAN解決了許多在推薦系統(tǒng)中發(fā)現(xiàn)的問(wèn)題,GAN通過(guò)生成代表高基數(shù)目錄中整個(gè)產(chǎn)品分布的樣本緩解推薦的新穎性和稀缺性問(wèn)題,通過(guò)學(xué)會(huì)用最少的識(shí)別信息為用戶段生成聯(lián)合分布使得冷啟動(dòng)問(wèn)題得到了緩解。Bock等[30]在2個(gè)成對(duì)的GAN模型基礎(chǔ)上提出了耦合GAN推薦器,進(jìn)而提出了一個(gè)條件耦合生成對(duì)抗網(wǎng)絡(luò),可以學(xué)習(xí)從在線用戶行為的聯(lián)合分布中生成樣本,這些樣本可用于為特定用戶群提供產(chǎn)品推薦。
1.3.5 貝葉斯網(wǎng)絡(luò)
貝葉斯網(wǎng)絡(luò)[31]是概率有向無(wú)環(huán)圖模型,使用節(jié)點(diǎn)來(lái)表示變量,使用弧來(lái)表示鏈接節(jié)點(diǎn)之間的直接依賴關(guān)系,并使用條件概率來(lái)量化依賴關(guān)系。靜態(tài)貝葉斯網(wǎng)絡(luò)廣泛用于可靠性評(píng)估。Guigourès等[32]引入了一種分層貝葉斯方法,聯(lián)合建模1個(gè)或多個(gè)尺寸的物品的購(gòu)買及其可能的退貨事件,為電子商務(wù)提供合適的尺寸推薦,在數(shù)百萬(wàn)客戶的真實(shí)(匿名)數(shù)據(jù)上實(shí)驗(yàn),并與具有簡(jiǎn)化假設(shè)的基線方法進(jìn)行了詳細(xì)討論和比較,結(jié)果表明貝葉斯方法優(yōu)于基線方法。He等[33]提出貝葉斯對(duì)偶神經(jīng)網(wǎng)絡(luò)框架,一個(gè)是從評(píng)分矩陣中為用戶和商品學(xué)習(xí)一個(gè)公共的低維空間,另一個(gè)是將用戶和商品的屬性投影到另一個(gè)共享的潛在空間中,結(jié)合了來(lái)自用戶和商品的輔助信息進(jìn)行推薦,并且將不確定性引入所有權(quán)重,以進(jìn)行校準(zhǔn)的概率預(yù)測(cè)。
1.3.6 其 他
研究人員將多種算法和技術(shù)結(jié)合在一起,以實(shí)現(xiàn)更好的系統(tǒng)優(yōu)化,并避免基本推薦系統(tǒng)的不同限制和挑戰(zhàn)。與單一算法相比,算法的組合將為用戶提供更合適、更有效的建議。Chen等[34]將GAN和RNN相結(jié)合,提出了的TagRec模型,集成的GAN和RNN可以提取評(píng)級(jí)和社會(huì)信息特征,以處理推薦系統(tǒng)中的稀疏性問(wèn)題,模型利用用戶信任信息進(jìn)行 top-N 推薦,進(jìn)一步提高推薦性能,在2個(gè)真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)證明了所提出的TagRec的有效性。Xin等[35]針對(duì)個(gè)性化可視化推薦的問(wèn)題提出了一個(gè)學(xué)習(xí)框架,并與深度神經(jīng)網(wǎng)絡(luò)架構(gòu)結(jié)合,將用戶生成的可視化作為輸入,從用戶的可視化和數(shù)據(jù)偏好中學(xué)習(xí),為特定的用戶意圖和偏好提供更高質(zhì)量的可視化推薦。Yang[36]提出結(jié)合深度學(xué)習(xí)的決策樹(shù)算法服裝設(shè)計(jì)風(fēng)格推薦,即利用基于深度學(xué)習(xí)(DL)理論的多標(biāo)簽分類算法構(gòu)建服裝風(fēng)格識(shí)別模型,并基于決策樹(shù)算法構(gòu)建服裝推薦模型,使用基于決策樹(shù)算法的服裝推薦系統(tǒng)后,受試者的平均滿意度為86.25%,說(shuō)明該系統(tǒng)可以給用戶更好的服裝推薦體驗(yàn)。Su等[37]提出混合循環(huán)卷積神經(jīng)網(wǎng)絡(luò)(RCNN)方法計(jì)算情感表達(dá)強(qiáng)度,采用多類SVM方法進(jìn)行動(dòng)態(tài)表達(dá)識(shí)別,并使用循環(huán)卷積神經(jīng)網(wǎng)絡(luò)(RCNN)的方法評(píng)估表達(dá)(快樂(lè)、憤怒等)強(qiáng)度,結(jié)合表情強(qiáng)度和表達(dá)時(shí)長(zhǎng)來(lái)計(jì)算用戶的多興趣值,采用多興趣價(jià)值融合的方法進(jìn)行個(gè)性化服裝推薦。
基于深度學(xué)習(xí)的服裝推薦算法模型優(yōu)缺點(diǎn)總結(jié)如表2所示。
表2 基于深度學(xué)習(xí)的服裝推薦算法模型
隨著線上購(gòu)物和推薦系統(tǒng)的發(fā)展,消費(fèi)者對(duì)服裝的個(gè)性化需求增加,個(gè)性化服裝推薦也受到了越來(lái)越多的關(guān)注。個(gè)性化服裝推薦能夠根據(jù)消費(fèi)者的信息、需求等推薦給消費(fèi)者感興趣的服裝。因此,個(gè)性化服裝推薦引起了國(guó)內(nèi)外服裝專家的關(guān)注。進(jìn)行高質(zhì)量的個(gè)性化服裝推薦需要滿足2個(gè)條件:①用戶偏好預(yù)測(cè),即整個(gè)服裝要整體符合用戶喜好;②服裝項(xiàng)目之間的兼容性,即同一套服裝中的單品在視覺(jué)上應(yīng)該相互兼容。
Li等[38]提出了一種層次化的時(shí)裝圖神經(jīng)網(wǎng)絡(luò),構(gòu)建了一個(gè)基于用戶服裝交互和服裝項(xiàng)目映射的層次結(jié)構(gòu),將兼容性信息視為圖中傳遞的消息,并將其編碼到節(jié)點(diǎn)表示中,將兼容性匹配和個(gè)性化推薦結(jié)合考慮,使得推薦的結(jié)果不僅具有良好的兼容性,而且滿足用戶的個(gè)人喜好。Abugabah等[39]提出了一種基于用戶偏好動(dòng)態(tài)變化和視覺(jué)兼容性關(guān)系的時(shí)尚學(xué)習(xí)模型,對(duì)基于場(chǎng)景的用戶偏好進(jìn)行建模,以從歷史用戶交互中推斷項(xiàng)目-項(xiàng)目關(guān)系,將用戶偏好與用戶評(píng)論信息和圖像區(qū)域級(jí)特征聯(lián)合,以做出更準(zhǔn)確的推薦,實(shí)驗(yàn)結(jié)果表明所提方法能夠更準(zhǔn)確地理解用戶的偏好,但是在實(shí)際互聯(lián)網(wǎng)中,用戶提供的查詢?cè)~往往很短,會(huì)導(dǎo)致歧義而誤解用戶的意圖。Paul等[40]結(jié)合視覺(jué)、時(shí)間和順序信息來(lái)進(jìn)行個(gè)性化推薦,利用時(shí)間層次嵌入(T-Sherlock)方法將視覺(jué)特征結(jié)合到時(shí)間模型中來(lái)預(yù)測(cè)用戶對(duì)不同類別產(chǎn)品的偏好,但是對(duì)于新用戶,難以提供較高質(zhì)量的推薦。Divitiis等[41]提出了一種基于記憶增強(qiáng)神經(jīng)網(wǎng)絡(luò)的方法,通過(guò)服裝屬性的共現(xiàn)來(lái)解決個(gè)性化推薦時(shí)的服裝項(xiàng)目兼容性。但是模型訓(xùn)練僅基于顏色和形狀,對(duì)于服裝面料及風(fēng)格兼容還有不足。Mo等[42]將服裝兼容性與個(gè)人物理屬性聯(lián)系起來(lái),以進(jìn)行完整的兼容性學(xué)習(xí),用于推薦最適合個(gè)人的服裝,然而由于時(shí)尚單品的屬性分布和服裝的物理標(biāo)簽分布不平衡,所提方法性能不盡如人意。
在人們的日常生活中,如何很好地搭配衣服總是一個(gè)麻煩的問(wèn)題,決定穿什么、如何搭配自己的衣服并不容易。合理搭配服裝已經(jīng)成為廣大消費(fèi)者的內(nèi)在需求。研究人員將搭配造型知識(shí)、服裝相關(guān)性等搭配規(guī)則融入推薦系統(tǒng)中,為用戶提供合理的搭配服裝。服裝搭配推薦系統(tǒng)的應(yīng)用,可以有效滿足客戶在穿衣搭配方面的需求,從而節(jié)省大量的時(shí)間和精力。Wang等[43]利用卷積神經(jīng)網(wǎng)絡(luò)提取視覺(jué)信息,從視覺(jué)語(yǔ)義嵌入預(yù)測(cè)時(shí)尚兼容性,基于單品的服裝時(shí)尚相容性成功地從款式、質(zhì)地和細(xì)節(jié)配飾上匹配服裝。Cui[44]從人工智能技術(shù)與服裝時(shí)尚相結(jié)合的角度出發(fā),提出改進(jìn)型SDD_RN網(wǎng)絡(luò),提取多特征融合開(kāi)發(fā)出更符合個(gè)性化需求的服裝搭配推薦。Liu等[45]利用服裝商品之間的相關(guān)性,使用神經(jīng)圖濾波框架服裝單品進(jìn)行建模,建立了基于圖結(jié)構(gòu)的服裝搭配系統(tǒng)。
在電子商務(wù)平臺(tái)上購(gòu)買時(shí)尚服裝與在線下零售店購(gòu)買有很大不同,因?yàn)殡娮由虅?wù)平臺(tái)可以購(gòu)買的服裝產(chǎn)品范圍更廣。因此一個(gè)有效地支持用戶搜索其想要的產(chǎn)品并進(jìn)行推薦的系統(tǒng)在網(wǎng)絡(luò)購(gòu)物中起著重要作用。服裝檢索推薦不僅能夠便捷用戶檢索,還能夠根據(jù)用戶提供的查詢信息捕捉用戶的意圖,根據(jù)個(gè)人歷史數(shù)據(jù),如以前的銷售、服裝購(gòu)買記錄、眼動(dòng)記錄和項(xiàng)目點(diǎn)擊率,通過(guò)特征相似性和相關(guān)性分析對(duì)用戶提供精準(zhǔn)的推薦。Sevegnani等[46]提出模型WhisperLite,使用對(duì)比學(xué)習(xí)從自然語(yǔ)言文本中捕捉用戶意圖,CLIP 嵌入的強(qiáng)度與用于個(gè)性化的附加神經(jīng)網(wǎng)絡(luò)層相結(jié)合,并使用基于二元交叉熵和對(duì)比損失的復(fù)合損失函數(shù)進(jìn)行訓(xùn)練,顯著改進(jìn)了離線推薦檢索指標(biāo)。Jiang等[47]提出了一種基于卷積網(wǎng)絡(luò)的深度交叉三元組嵌入算法,用于雙向服裝檢索。
隨著消費(fèi)者對(duì)個(gè)性化時(shí)尚推薦系統(tǒng)的需求不斷增加,在服裝設(shè)計(jì)階段根據(jù)客戶需求進(jìn)行個(gè)性化設(shè)計(jì)變得至關(guān)重要。Ling等[48]通過(guò)整合沖突規(guī)則處理機(jī)制及其在個(gè)性化時(shí)尚推薦系統(tǒng)中的應(yīng)用,提出了一種新的服裝設(shè)計(jì)知識(shí)庫(kù)。Wang等[49]提出了一種基于2個(gè)數(shù)學(xué)模型的服裝設(shè)計(jì)推薦系統(tǒng),該系統(tǒng)允許從消費(fèi)者在合身性和美觀方面的個(gè)性化需求來(lái)預(yù)測(cè)和控制服裝款式和結(jié)構(gòu)參數(shù)。Sharma等[50]提出了一個(gè)數(shù)據(jù)驅(qū)動(dòng)的交互式設(shè)計(jì)系統(tǒng)架構(gòu),以幫助設(shè)計(jì)師根據(jù)服裝購(gòu)買者的喜好,結(jié)合設(shè)計(jì)師的技術(shù)知識(shí),創(chuàng)造出最相關(guān)的定制服裝。
當(dāng)前時(shí)期,服裝行業(yè)呈現(xiàn)加速發(fā)展態(tài)勢(shì),服裝品牌和品類大幅增加,服裝數(shù)據(jù)較多。服裝產(chǎn)品推薦能使用戶在短時(shí)間內(nèi)找到最滿意的服裝。Becattini等[51]利用Shigenobu Kobayashi的彩色圖像量表將情感模式和情緒與顏色三元組聯(lián)系起來(lái),從在線可用的數(shù)據(jù)信息中提取服裝外觀和相應(yīng)的社交活動(dòng),提出了一種兼顧基于風(fēng)格的過(guò)濾和基于事件的過(guò)濾的時(shí)尚推薦方法。周捷等[52]利用灰色關(guān)聯(lián)層次分析法建立服裝號(hào)型選擇模型,向消費(fèi)者提供準(zhǔn)確的服裝號(hào)型。Zhang等[53]通過(guò)整合設(shè)計(jì)師和購(gòu)物者的專業(yè)知識(shí)并考慮消費(fèi)者對(duì)產(chǎn)品的看法而開(kāi)發(fā)出一種通過(guò)模糊技術(shù)和AHP的面向消費(fèi)者的推薦系統(tǒng),該系統(tǒng)可以像虛擬銷售顧問(wèn)一樣用于服裝在線購(gòu)物系統(tǒng)。
服裝推薦系統(tǒng)能夠幫助消費(fèi)者快速找到與其選擇匹配的服裝,成為電商平臺(tái)發(fā)展的重要手段。服裝推薦系統(tǒng)進(jìn)入快速發(fā)展階段,已經(jīng)取得了較多研究成果。
本文通過(guò)對(duì)服裝推薦過(guò)程、推薦算法模型、應(yīng)用領(lǐng)域進(jìn)行總結(jié)分析,發(fā)現(xiàn)服裝推薦算法的研究主要集中在捕捉服裝特征和用戶需求上,對(duì)挖掘潛在消費(fèi)群體,預(yù)測(cè)消費(fèi)者興趣變化還有不足。服裝推薦的應(yīng)用也多圍繞在銷售環(huán)節(jié)的消費(fèi)者身上,未能充分發(fā)揮推薦系統(tǒng)對(duì)服裝開(kāi)發(fā)設(shè)計(jì)環(huán)節(jié)的指導(dǎo)作用。單一推薦模型能取得不錯(cuò)的效果,但是仍存在一定的缺陷,混合模型推薦的研究將受到更多關(guān)注。在推薦系統(tǒng)開(kāi)發(fā)中應(yīng)當(dāng)對(duì)靈活使用算法和模型,不局限于某一類,巧妙融合,提高效率和性能。
在未來(lái),在服裝推薦中應(yīng)注重個(gè)性化與人工智能相結(jié)合,基于用戶的需求與偏好,符合消費(fèi)者的個(gè)人特性與心理變化,滿足消費(fèi)者的實(shí)際需求。基于圖像進(jìn)行的推薦得到了越來(lái)越多的重視,然而對(duì)圖像進(jìn)行視覺(jué)解釋的同時(shí),往往忽略必要的文字解釋而缺乏精確性,因此服裝推薦需要重視圖像與文本的結(jié)合,在視覺(jué)信息和文本信息聯(lián)合的方向邁進(jìn)。