朱茂然,朱艷鵬,高 松,王洪偉
1 同濟(jì)大學(xué) 經(jīng)濟(jì)與管理學(xué)院,上海 200092 2 上海銀行,上海 200120 3 中國信息安全測評中心,北京 100085
當(dāng)前,共享經(jīng)濟(jì)借著互聯(lián)網(wǎng)的東風(fēng)蓬勃發(fā)展,與共享、協(xié)作、共贏、可持續(xù)發(fā)展相關(guān)的主題受到廣泛重視,共享經(jīng)濟(jì)下的在線短租模式也受到學(xué)者們的重點(diǎn)關(guān)注[1]。在線短租平臺在弱化擁有權(quán)的前提下,通過出讓使用權(quán)改變了傳統(tǒng)的經(jīng)濟(jì)形態(tài),利用社會上其他人共享出來的資源,為用戶旅行和短期居住提供極大的便利[2]。與淘寶和京東等電商網(wǎng)站不同,在線短租平臺中的商品具有明顯的同質(zhì)化,產(chǎn)品均為不同視角下的房間[3]。用戶在瀏覽網(wǎng)站時,除了查看房源的基本文字介紹,很大程度上受到房源圖片的直接影響,因為房間這類體驗型商品具有鮮明的個性特征,而圖片通過展示房間內(nèi)部設(shè)施和裝修風(fēng)格,進(jìn)而反映出房主的品味以及房間的舒適程度等信息。使用戶在瀏覽房源圖片時增強(qiáng)參與感和現(xiàn)場感,這對購買決策具有直接影響[4-5]。已有研究表明,消費(fèi)者在進(jìn)行購物選擇時已不僅僅滿足于文字信息的閱讀,更多的是將注意力集中在商品圖片信息的獲取上[6]。
然而,通過實(shí)際使用可以發(fā)現(xiàn),現(xiàn)有的在線短租平臺雖然能夠從價格、地理位置和房源類型等條件為用戶推薦房源,但卻無法從房源圖片的視覺效果上為用戶推薦房源。對于在線短租這類體驗型商品,視覺因素帶來的營銷引導(dǎo)非常重要。如很多用戶對房間的采光效果好或者房間布局有個性化的偏好,但受平臺基于價格、位置和類型的營銷方式限制,只能自己逐家查看房源圖片或者從商家描述和用戶評論中尋找相關(guān)信息,這無疑增加了用戶的決策成本,降低了平臺的營銷效率。在一定程度上對用戶的體驗感受產(chǎn)生負(fù)面效果,影響消費(fèi)決策,甚至放棄在該平臺上的消費(fèi)行為,轉(zhuǎn)向其他平臺,這對于平臺自身和平臺中的商家而言都是極大的損失。針對該問題,基于圖片信息的相似性識別和精準(zhǔn)推薦對在線短租平臺具有重要意義[7]。
一方面,可以根據(jù)用戶的瀏覽記錄準(zhǔn)確獲知用戶住宿偏好,幫助用戶更輕松地得到相似房源信息推薦,節(jié)省用戶的時間和精力;另一方面,平臺也希望在了解用戶需求的情況下實(shí)現(xiàn)精準(zhǔn)推送,通過以圖搜圖,幫助消費(fèi)者找到符合偏好的圖片[8-9],從而增加用戶黏性,提升平臺轉(zhuǎn)化率,實(shí)現(xiàn)雙贏。因此,本研究的目的就是基于用戶視覺偏好信息實(shí)現(xiàn)精準(zhǔn)營銷,通過構(gòu)建一個能識別房源圖片內(nèi)容信息的營銷推薦系統(tǒng),使用戶通過提交圖片或者讓系統(tǒng)識別瀏覽記錄的方式,將符合用戶視覺偏好的房源信息按照關(guān)聯(lián)程度的高低展示給用戶,方便用戶尋找視覺偏好的房源,提高營銷決策的效率。在計算機(jī)視覺領(lǐng)域,深度學(xué)習(xí)已經(jīng)在模式識別、分類和回歸等多方面展示出較強(qiáng)的建模和表征能力。因此,綜合在線短租平臺需要高效率的信息檢索能力,將深度學(xué)習(xí)與哈希算法相結(jié)合,構(gòu)建基于深度哈希的相似圖片推薦系統(tǒng)。根據(jù)用戶已有購買記錄或瀏覽記錄中出現(xiàn)的圖片信息進(jìn)行高效率的深度學(xué)習(xí),輸出基于用戶偏好的相似房源圖片,對提高用戶購買轉(zhuǎn)化率、提升平臺整體收益有重要意義。
通過用戶瀏覽記錄和行為捕捉用戶特征、構(gòu)造用戶畫像在已有研究中已得到充分驗證[10],但絕大多數(shù)研究都是通過采集用戶評論信息、用戶行為和用戶收藏等內(nèi)容構(gòu)建個性化推薦系統(tǒng)[11-12],較少涉及分析用戶關(guān)注的圖片信息。
已有研究證實(shí),與文本和數(shù)字信息相比,圖片信息更顯著地影響信息使用者[13]。OLIVEIRA et al.[14]發(fā)現(xiàn)人們在上網(wǎng)搜索餐廳時,找到食物圖片和其他用戶生成的有關(guān)飯店評論對于消費(fèi)者決策有重要影響,消費(fèi)者更傾向于通過用戶生成的圖片進(jìn)行消費(fèi)決策;KARIMI et al.[15]挖掘影響評論價值的多個要素,發(fā)現(xiàn)評論者的個人圖像能夠顯著影響評論價值;PITTMAN et al.[16]通過實(shí)驗證實(shí),在社交媒體中圖片比文字信息更能增強(qiáng)人與人之間的親密感,同時減輕個人社交的孤獨(dú)感。由此可見,圖片在影響信息感知、決策和選擇方面起重要作用[17-18]。
近年來,隨著共享經(jīng)濟(jì)的發(fā)展,以愛彼迎(AirBed and Breakfast,Airbnb)為首的在線短租平臺引起了研究者濃厚的興趣,相關(guān)研究主要圍繞如何促進(jìn)消費(fèi)和提升用戶體驗展開[2]。實(shí)際上,圖片信息在餐飲、酒店和景點(diǎn)旅游等體驗型商品中也展現(xiàn)了更大的價值[19]。有研究發(fā)現(xiàn),圖片信息能夠顯著影響在線短租平臺中消費(fèi)者的決策行為[20]。ERT et al.[21]通過場景試驗,從聲譽(yù)和信任角度探究消費(fèi)者在Airbnb網(wǎng)站的決策動機(jī),發(fā)現(xiàn)房東聲譽(yù)并不能直接影響消費(fèi)者做出購買決策,而Airbnb房源圖片能夠通過增強(qiáng)用戶親臨現(xiàn)場感覺提升用戶對在線房源的信任感,進(jìn)而顯著影響消費(fèi)者決策。該團(tuán)隊在2019年又探究了Airbnb在線照片中顯示的視覺特征(如性別)直接或間接地通過吸引力影響用戶的信任感[22]。ZHANG et al.[23]發(fā)現(xiàn)Airbnb平臺上經(jīng)過平臺驗證的圖片的房源擁有比平均水平高9%的預(yù)訂率,并且與低質(zhì)量圖片相比,高質(zhì)量圖片信息顯著增加每年的預(yù)訂總金額。
用戶瀏覽的房源圖片信息對在線短租平臺用戶的在線消費(fèi)行為有顯著影響,因此,通過提取用戶瀏覽或收藏過的圖片進(jìn)行用戶畫像,捕捉用戶偏好信息,設(shè)計個性化推薦方法,對在線短租平臺有重要價值[24]。MEHRABIAN et al.[25]提出的刺激-機(jī)體-響應(yīng)(stimulus-organism-response,S-O-R)理論模型是從環(huán)境心理學(xué)角度探討消費(fèi)者行為的經(jīng)典理論,特別是發(fā)現(xiàn)了視覺信息對人類認(rèn)知行為有明顯的刺激作用,進(jìn)而影響其決策能力。用戶瀏覽的房源信息作為一種外在環(huán)境刺激,直接影響消費(fèi)者的認(rèn)知、態(tài)度、反應(yīng)和情緒狀態(tài),導(dǎo)致顧客產(chǎn)生行為或意圖反應(yīng)[26]。
近年來,中國也有不少學(xué)者研究發(fā)現(xiàn),圖片作為一種可視化信息,對于消費(fèi)者決策有顯著影響。劉蕾等[27]研究不同類型圖文信息組合形式對消費(fèi)者互動行為和消費(fèi)者-品牌關(guān)系的影響,認(rèn)為功能型圖片展示效果顯著影響消費(fèi)者的購物決策;刁雅靜等[28]基于眼動實(shí)驗發(fā)現(xiàn),女性對帶有圖片評論的商品更加關(guān)注。此類研究雖然都通過實(shí)驗證明圖片信息的作用,但是討論的深度較為淺顯,只是將評論中是否存在圖片作為影響因素,沒有對圖片自身特征進(jìn)行研究。此外,有學(xué)者選擇針對圖片信息的數(shù)量和順序特征進(jìn)行分析。張艷輝等[29]在構(gòu)建的在線評論有用性模型中引入包含圖片信息的評論數(shù)量作為自變量,表明包含圖片信息的評論數(shù)量越多,在線評論的有用性越高;李中梅等[30]以移動商務(wù)環(huán)境下O2O用戶為研究對象,通過實(shí)證分析發(fā)現(xiàn)圖片數(shù)量能夠顯著正向影響消費(fèi)者對在線評論有用性的看法;葉許紅等[31]也認(rèn)為網(wǎng)購頁面中的產(chǎn)品圖片對稱性和復(fù)雜度顯著影響用戶認(rèn)知。上述研究雖然圍繞圖片評論的數(shù)量特征和順序特征進(jìn)行分析,但都沒有涉及圖片展示的內(nèi)容信息,忽視了圖片中真正的價值。實(shí)際上,信息含量高的圖片能顯著增加潛在消費(fèi)者的購買意愿,提升消費(fèi)者對商品評估的效果[32]。本研究將在上述分析基礎(chǔ)上,充分抽取圖片中的內(nèi)容信息,觀察其對用戶決策的影響。
已有研究表明,在線短租平臺的房源圖片對消費(fèi)者行為意愿產(chǎn)生直接影響[33]。而中國有關(guān)在線短租平臺的研究普遍使用評論挖掘、建模分析和消費(fèi)心理學(xué)等方法[34]探討圖片對消費(fèi)者決策的影響,卻忽視了圖片內(nèi)容可能包含的信息。為此,曹馳[35]將民宿營銷圖片引入眼動儀實(shí)驗中,研究大學(xué)生青年房客預(yù)訂群體在線預(yù)訂視覺偏好,但是缺乏技術(shù)和理論支撐。實(shí)際上,如果能通過提取用戶相關(guān)的圖片感知信息構(gòu)建用戶畫像,捕捉用戶偏好信息,可以降低消費(fèi)者決策時間,激勵消費(fèi)者瀏覽更多的商品內(nèi)容,助力決策[36]。因此,設(shè)計基于圖片的個性化推薦方法具有極大的應(yīng)用價值。當(dāng)前關(guān)于圖片推薦系統(tǒng)的研究通過引入深度學(xué)習(xí)技術(shù),實(shí)現(xiàn)圖片的實(shí)時檢索,主要包括基于文本的檢索方法和基于內(nèi)容的圖像檢索方法兩種方式。有研究認(rèn)為基于文本的檢索方法太過于依賴文本信息而忽略了圖片自身特征,導(dǎo)致圖片內(nèi)容與文本產(chǎn)生差距,降低了檢索質(zhì)量[37]。因此,基于內(nèi)容的圖像檢索方法成為營銷領(lǐng)域的熱點(diǎn)之一,其中以結(jié)合深度哈希算法改善檢索效率的研究最為緊迫[38]。
綜上,圖片信息的作用在于降低消費(fèi)者與商家的信息不對稱性,為消費(fèi)者決策提供重要依據(jù)。若圖片內(nèi)容符合消費(fèi)者的心理預(yù)期,消費(fèi)者會產(chǎn)生點(diǎn)擊欲望進(jìn)一步查看商品,增強(qiáng)營銷推薦的效果。然而,當(dāng)前營銷領(lǐng)域?qū)τ谝曈X信息的研究有待深入,特別是有關(guān)圖片偏好檢索和推薦的研究比較匱乏,現(xiàn)有圖片推薦系統(tǒng)的檢索效率和質(zhì)量有待提升。為此,本研究以在線短租平臺為研究對象,利用深度哈希算法,嘗試為在線短租平臺設(shè)計一個能夠識別用戶視覺偏好信息的圖片推薦系統(tǒng),使用戶可以通過以圖搜圖的方式快速找到目標(biāo)房源,降低用戶決策時間,還可以幫助平臺根據(jù)用戶視覺偏好進(jìn)行精準(zhǔn)營銷,提升用戶忠誠度。
通過分析當(dāng)前圖像檢索和相似性計算方法,發(fā)現(xiàn)基于卷積神經(jīng)網(wǎng)絡(luò)的圖像檢索方法是國外圖像檢索領(lǐng)域的主流,具有更高的算法效率[39]。但部分研究認(rèn)為,深度學(xué)習(xí)在空間和時間上的資源消耗過大。SALAKHUTDINOV et al.[40]采用傳統(tǒng)的深度學(xué)習(xí)方法對文檔數(shù)據(jù)進(jìn)行非線性處理,發(fā)現(xiàn)運(yùn)算模型需要的時間較長,通過語義哈希算法進(jìn)行優(yōu)化處理后,模型的運(yùn)算效率有明顯提升;XIA et al.[41]進(jìn)一步將深度學(xué)習(xí)與哈希思想結(jié)合,利用二值化的向量表示圖像編碼,大幅縮減了模型的資源消耗;ZHAO et al.[42]不僅將哈希函數(shù)當(dāng)做壓縮特征向量的方法,又結(jié)合surrogate損失函數(shù)制定圖片的檢索排序策略。此外,部分研究利用哈希編碼為二進(jìn)制的離散性,改進(jìn)了損失函數(shù)的優(yōu)化目標(biāo)[43]。
因此,本研究構(gòu)建基于深度哈希的相似圖片推薦系統(tǒng)框架,見圖1,包括圖片抓取、圖片預(yù)處理、推薦系統(tǒng)應(yīng)用邏輯和用于圖片處理的深度哈希模型4個部分。
本研究采用Python語言編寫爬蟲程序,并利用多線程和分模塊的技術(shù)增進(jìn)爬蟲效率。首先,采集Airbnb的應(yīng)用程序編程接口(application programming interface,API),對API中Json格式的數(shù)據(jù)進(jìn)行解析;其次,對房源價格、地理位置、建筑結(jié)構(gòu)、使用規(guī)則、基本設(shè)施、房東信息和是否經(jīng)過認(rèn)證等元素進(jìn)行采集;最后,將所有數(shù)據(jù)存儲至MySQL數(shù)據(jù)庫(關(guān)系型數(shù)據(jù)庫管理系統(tǒng))中。
具體流程分為以下3個步驟:
(1)選取一個初始統(tǒng)一資源定位器(uniform resource locator,URL)進(jìn)入Airbnb房源頁面,設(shè)定一個顯示房源區(qū)域的經(jīng)緯度范圍,在不同區(qū)域范圍內(nèi)進(jìn)行采集;
(2)依據(jù)谷歌地圖提供的API,遍歷區(qū)域內(nèi)所有經(jīng)緯度,去重后采集房源信息的相關(guān)數(shù)據(jù);
(3)提取并采集房源圖片的URL,生成圖片。
數(shù)據(jù)采集基本流程見圖2。
由于通過爬蟲采集到的房源圖片大小并不完全一致,為了便于后續(xù)應(yīng)用,需要進(jìn)行預(yù)處理,使圖片滿足模型輸入需要?;玖鞒倘缦拢?/p>
(1)將所有圖片格式調(diào)整為jpg格式,圖片縮放為32×32大小,保證輸入圖片為32×32×3形式;
(2)為了提高圖片的對比度效果,利用TensorFlow中的adjust_gamma方法對圖片進(jìn)行g(shù)amma校正,參考已有研究的處理標(biāo)準(zhǔn),將adjust_gamma方法的參數(shù)設(shè)置為gain取值為1.0,gamma取值為4.0;
圖1 數(shù)據(jù)集應(yīng)用深度哈希模型示意圖Figure 1 Schematic Diagram of the Deep Hash Model Applied to the Dataset
圖2 數(shù)據(jù)采集基本流程Figure 2 Basic Process of Data Collection
(3)為了統(tǒng)一圖片中各個特征的量綱,提升模型的訓(xùn)練性能,本研究采用TensorFlow自帶的per_image_standardization方法對經(jīng)過gamma校正后的圖片進(jìn)行標(biāo)準(zhǔn)化處理,從而統(tǒng)一量綱。
本研究構(gòu)建的圖片推薦系統(tǒng)包括前端和后端兩部分應(yīng)用邏輯。前端主要是對外表示層,可以接收用戶提交的圖片,圖片經(jīng)過后臺處理,能夠返回檢索結(jié)果給用戶;后端包含圖片處理部分、數(shù)據(jù)存儲和調(diào)取的數(shù)據(jù)部分,以及特征相似匹配等邏輯處理部分。系統(tǒng)具體實(shí)施流程如下:
(1)根據(jù)用戶查詢的一張或多張房源圖片,分析用戶圖片偏好,獲取高度相關(guān)的房源信息。對用戶收藏或瀏覽過的圖片進(jìn)行預(yù)處理,以達(dá)到深度哈希模型的輸入要求。
(2)遍歷在線短租平臺圖像數(shù)據(jù)庫中所有圖片,將這些圖片依次經(jīng)過深度哈希模型處理,生成圖像特征類哈希值。在圖像特征索引數(shù)據(jù)庫中建立以圖片-圖像特征類哈希值-圖像特征類哈希值索引一一對應(yīng)的索引內(nèi)容,最終形成一個覆蓋全部圖像數(shù)據(jù)集的索引庫。
(3)將用戶查詢的圖片進(jìn)行深度哈希模型處理。首先,通過卷積神經(jīng)網(wǎng)絡(luò)抽取圖片特征,經(jīng)過深度哈希模型運(yùn)行生成圖像特征哈希值;其次,將生成的圖像特征哈希值與圖像特征索引庫中的圖像特征哈希值進(jìn)行相似性匹配,計算相似度并按照相似度高低順序返回結(jié)果;最后,利用索引快速定位,找出圖像特征哈希值對應(yīng)的房源圖片,將相關(guān)房源信息作為檢索結(jié)果返回給用戶。
2.4.1 深度學(xué)習(xí)結(jié)構(gòu)
本研究對圖片的處理涉及深度學(xué)習(xí)。深度學(xué)習(xí)源于對人工神經(jīng)網(wǎng)絡(luò)的研究,通過組合低層特征形成更抽象的高層屬性類別,用于發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示[44]。深度學(xué)習(xí)模型的基本結(jié)構(gòu)由卷積層和池化層構(gòu)成。為了增加整體的處理能力,卷積池化后通過激活函數(shù)增加模型的非線性[45]。常見的激活函數(shù)包括sigmoid激活函數(shù)、Tanh激活函數(shù)、Relu激活函數(shù)和softmax激活函數(shù)。本研究采用Relu激活函數(shù)進(jìn)行非線性處理,該函數(shù)實(shí)質(zhì)上是一個分段函數(shù),數(shù)學(xué)形式為
f(x)>=max(0,x)
(1)
其中,x為輸入值,f(x)為函數(shù)。對于f(x)來說,當(dāng)x<0時,f(x)=0;當(dāng)x≥0時,f(x)=x。Relu函數(shù)的一個顯著特點(diǎn)是當(dāng)輸入值為正時,輸入值等于輸出值,其他條件下輸出值為0。與sigmoid和Tanh兩個激活函數(shù)相比,Relu激活函數(shù)進(jìn)行反向傳播時能極大地提高收斂速度,減少神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)時間。
本研究還采用批標(biāo)準(zhǔn)化處理方法,在卷積操作后,先進(jìn)行批標(biāo)準(zhǔn)化,再進(jìn)行激活。采用批標(biāo)準(zhǔn)化是為了加快神經(jīng)網(wǎng)絡(luò)模型的運(yùn)行速度,同時可以降低正則化參數(shù)等超參數(shù)對模型準(zhǔn)確率的影響。需要注意的是,卷積池化部分的每一層都要進(jìn)行批標(biāo)準(zhǔn)化,如果不進(jìn)行此項操作,每層經(jīng)過卷積池化處理后的輸出樣本會發(fā)生變化,其誤差層層傳遞,導(dǎo)致最終輸出層的結(jié)果產(chǎn)生較大偏差。
表1 深度學(xué)習(xí)模型結(jié)構(gòu)Table 1 Structure of Deep Learning Model
因此,本研究的神經(jīng)網(wǎng)絡(luò)卷積池化部分主要包括5個卷積池化組成的單元,即Conv1、Conv2、Conv3、Conv4和Conv5,每個單元包括卷積操作、池化操作、批標(biāo)準(zhǔn)化和激活函數(shù),見表1深度學(xué)習(xí)模型結(jié)構(gòu)。在卷積操作中,各單元的卷積核均采用3×3模式進(jìn)行設(shè)置。而池化操作本質(zhì)上是對卷積后的特征進(jìn)行強(qiáng)化,保留核心信息??蛇x取的方法主要分為平均池化和最大池化方法,平均池化是對相鄰域內(nèi)特征點(diǎn)取平均值,能夠保留圖片的背景信息;最大池化則是選取特征點(diǎn)中的最大值,即圖片中的紋理等較為明顯的信息。本研究選用最大池化方法,力求獲得圖片中布局和顏色等較為明顯的要素。綜上,每個單元中的具體處理方法為:①卷積操作:使用3×3的卷積核;②池化操作:池化方式選用最大池化法;③批標(biāo)準(zhǔn)化:每個單元均在激活函數(shù)前加入批標(biāo)準(zhǔn)化處理;④激活函數(shù):采用Relu激活函數(shù)。此外,由于較深的神經(jīng)網(wǎng)絡(luò)更能反映出圖片中的語義信息,本研究設(shè)計3層全連接層,即FC6、FC7、Hash,前兩層FC6和FC7為默認(rèn)設(shè)置,最后一層Hash則采用Tanh激活函數(shù),輸出的是類哈希二值化特征,即>-1~1的二值化效果。
2.4.2 損失函數(shù)設(shè)置
本研究使用二元損失函數(shù)對深度哈希模型進(jìn)行優(yōu)化。損失函數(shù)可以根據(jù)前向傳播算法最終計算出的損失函數(shù)值反映訓(xùn)練誤差的大小,同時也是反向傳播的起點(diǎn),通過損失函數(shù)進(jìn)行反向參數(shù)更新,最終得到更能擬合訓(xùn)練集數(shù)據(jù)的優(yōu)化模型。本研究采用的損失函數(shù)為
(2)
其中,L1為損失函數(shù);t為標(biāo)簽;定義輸入的成對圖片分別為1和2,h1為第1張圖片經(jīng)過深度哈希模型處理后的類哈希值,h2為第2張圖片經(jīng)過深度哈希模型處理后的類哈希值;n為損失函數(shù)的閾值;α為正則化參數(shù)的權(quán)重。本研究充分利用標(biāo)簽定義功能,將數(shù)據(jù)集中歸為一類的圖片定義為相似,標(biāo)簽標(biāo)記為1,反之標(biāo)記為0。
本研究在LIU et al.[46]提出的二元損失函數(shù)基礎(chǔ)上進(jìn)行優(yōu)化,提出一個端到端的深度學(xué)習(xí)模型。因此,損失函數(shù)的設(shè)置除了要體現(xiàn)查詢圖片與數(shù)據(jù)庫中圖片之間的相似性和差異性,還要進(jìn)行反向傳播并更新模型參數(shù)。結(jié)合上文提到的深度學(xué)習(xí)模型結(jié)構(gòu),本研究采用損失函數(shù)將每個圖片生成類哈希二值化輸出結(jié)果,再進(jìn)行兩兩比對。損失函數(shù)設(shè)置為結(jié)合標(biāo)簽的二元損失函數(shù),成對圖片的相似性是通過哈希算法進(jìn)行距離計算的,一般將哈希值視為對原始信息的編碼,然后將編碼映射到空間中,通過判斷不同哈希值的相似性和差異性計算兩者在空間中的距離,本研究采用歐氏距離計算這個差值。
在神經(jīng)網(wǎng)絡(luò)實(shí)際訓(xùn)練中,每組成對圖片都是從訓(xùn)練集中隨機(jī)選擇,損失函數(shù)可以看作是選擇的成對圖片的一次訓(xùn)練的損失,而成本函數(shù)為所有損失函數(shù)的總和,數(shù)學(xué)形式為
(3)
其中,L2為成本函數(shù),i為隨機(jī)選擇圖片的次數(shù),I為隨機(jī)選擇的總次數(shù),ti為第i次隨機(jī)選擇圖片對應(yīng)的標(biāo)簽,hi,1為第i次隨機(jī)選擇圖片中的第1張圖片經(jīng)過深度哈希模型處理后的類哈希值,hi,2為第i次隨機(jī)選擇圖片中的第2張圖片經(jīng)過深度哈希模型處理后的類哈希值。為了防止海量圖片作為輸入數(shù)據(jù)可能引發(fā)的過擬合問題,一是在損失函數(shù)中加入正則化參數(shù),通過限制參數(shù)使深度哈希模型在訓(xùn)練集上的擬合效果更好;二是構(gòu)建成本函數(shù)進(jìn)行優(yōu)化。采用成本函數(shù)主要考慮到訓(xùn)練效果,雖然L2參數(shù)正則化比L1參數(shù)正則化計算成本略微增加,但本研究通過實(shí)驗發(fā)現(xiàn)L2參數(shù)正則化不會產(chǎn)生過多的稀疏解,能夠有效限制參數(shù)的擴(kuò)大化傾向。
另外,當(dāng)從損失函數(shù)開始反向傳播算法求梯度時,由于Tanh激活函數(shù)二值化輸出在>-1~1之間,若最后的輸出值梯度求導(dǎo)為0,容易造成梯度消失問題。為了避免該類問題,本研究改進(jìn)了LIU et al.[46]設(shè)計的分段函數(shù)思想,設(shè)計θ(x)函數(shù),即
(4)
其中,j為成對圖片中圖片的編號,j∈{1,2};bi,j為反向傳播算法求梯度時計算出的值,有
2.4.3 模型優(yōu)化設(shè)置
整體模型優(yōu)化分為網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)優(yōu)化、訓(xùn)練策略優(yōu)化、超參數(shù)優(yōu)化3個部分。
網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)優(yōu)化在上文已經(jīng)提及,即①卷積部分主要優(yōu)化是使用兩個3×3的卷積核代替一個5×5的卷積核,加快運(yùn)行效率;②池化部分都采用最大池化法提取圖片中的要素,能夠以最小代價提取語義和視覺信息;③在此基礎(chǔ)上,加深隱藏層的層數(shù)能更好地理解圖片;④在所有的卷積池化層和最后一個全連接層外應(yīng)用Relu激活函數(shù);⑤通過批標(biāo)準(zhǔn)化層的應(yīng)用有效提升模型學(xué)習(xí)效率。
在訓(xùn)練策略優(yōu)化上,本研究選用小批量梯度下降的訓(xùn)練策略。常見的梯度學(xué)習(xí)策略包括批量梯度下降、隨機(jī)梯度下降、小批量梯度下降3種策略,①批量梯度下降是將所有樣本作為輸入進(jìn)行訓(xùn)練和參數(shù)更新,但該策略需要一次讀入所有樣本,容易消耗大量的存儲空間,并且耗費(fèi)大量時間運(yùn)行;②隨機(jī)梯度下降則是每次僅讀入一個樣本進(jìn)行訓(xùn)練和參數(shù)更新,梯度下降速度較快,但若樣本選擇不好,很難達(dá)到梯度下降的最優(yōu)解;③小批量梯度下降則是兼具上述兩者的特點(diǎn),每次選取小批量樣本輸入并訓(xùn)練更新,梯度下降速度也較快。
對于模型超參數(shù)的優(yōu)化,如學(xué)習(xí)率等超參數(shù),本研究采用實(shí)驗調(diào)參的方法。結(jié)合已有研究中深度學(xué)習(xí)調(diào)參結(jié)果,設(shè)置一系列參數(shù)對比運(yùn)行,根據(jù)最優(yōu)實(shí)驗結(jié)果確定超參數(shù)。
本研究選取的數(shù)據(jù)實(shí)例為全球民宿短租公寓預(yù)定平臺Airbnb,作為一家聯(lián)系旅游人士和家有空房出租的房主的服務(wù)型網(wǎng)站,可以為消費(fèi)者提供多樣的住宿信息,它是共享經(jīng)濟(jì)領(lǐng)域最具有代表性的企業(yè)之一,在超過220個國家、10萬多城市中上線了700多萬套房源,累計超過5億人次獲得過體驗。根據(jù)權(quán)威互聯(lián)網(wǎng)流量排行網(wǎng)站Alexa的統(tǒng)計數(shù)據(jù),截至2018年12月,Airbnb在全球互聯(lián)網(wǎng)流量排行榜和美國互聯(lián)網(wǎng)流量排行榜中分別位居第269位和第70位,均為同類網(wǎng)站第一。表2給出Airbnb訪問來源統(tǒng)計,可以看出訪問量較大的幾個國家提供了Airbnb平臺上絕大部分房源。
表2 Airbnb訪問來源統(tǒng)計Table 2 Statistics of Airbnb′s Visit Source
用戶在瀏覽Airbnb網(wǎng)站時,主要基于地理位置進(jìn)行查找,展示結(jié)果結(jié)構(gòu)清晰。圖3為Airbnb上的房源示意圖,展示了一個典型用戶正在瀏覽同一地理位置上的房源。網(wǎng)站呈現(xiàn)的房源信息中,圖片占據(jù)較大篇幅,給予用戶最大視覺沖擊,傳遞主要的房源特征。
本研究選擇美國紐約地區(qū)作為研究對象,主要考慮紐約地區(qū)是Airbnb較早開拓的市場,屬于全球各大城市中房源最多和旅游熱門地。同時,紐約地區(qū)的房源基本都是個人用戶提供,圖片質(zhì)量較高,能夠避免不同房源圖片質(zhì)量差異較大的問題。此外,在房源類型上,紐約地區(qū)擁有4萬套房源,涵蓋從一居室公寓到別墅等不同類型,房源內(nèi)部裝修風(fēng)格豐富,充足的房源類型和風(fēng)格可以為模型提供豐富的實(shí)驗數(shù)據(jù)。
截至2019年12月,根據(jù)Airbnb官方公布數(shù)據(jù),紐約地區(qū)共有4萬余套房源。通過編譯好的Python程序進(jìn)行爬蟲,共收集4萬余條房源信息。由于部分房源存在缺失圖片、圖片模糊不清、圖片上傳不完整等問題,經(jīng)篩選,最終采集到有效房源照片38 495張,本研究收集的房源數(shù)據(jù)基本覆蓋整個紐約地區(qū)。初步分析數(shù)據(jù),房源分布于紐約曼哈頓區(qū)、皇后區(qū)、布魯克林區(qū)、布朗克斯區(qū)和斯塔滕島區(qū)5個行政區(qū)。由于地理位置和房屋類型的不同,導(dǎo)致房源價格呈現(xiàn)較大差異。圖4給出紐約市各區(qū)Airbnb房源數(shù)量,可以看出各區(qū)房源分布數(shù)量與本區(qū)經(jīng)濟(jì)實(shí)力高度相關(guān)。房源數(shù)量最多的曼哈頓區(qū)是美國乃至世界的金融中心,承載著巨大的人口流量;布魯克林區(qū)則是紐約最大人口行政區(qū),貢獻(xiàn)了豐富的房源;其他3個區(qū)與上述兩區(qū)差異明顯,缺乏核心商務(wù)區(qū),導(dǎo)致房源數(shù)量也相對較少。
圖4 紐約市各區(qū)Airbnb房源數(shù)量Figure 4 Number of Airbnb Housing Resource by Districts in New York City
圖5給出紐約市各區(qū)房源平均價格,不同于房源數(shù)目之間的顯著差別,紐約各區(qū)房源平均價格差異較小。人口眾多的曼哈頓區(qū)和布魯克林區(qū)平均房價較高,布朗克斯區(qū)平均房價在各區(qū)中最低。
圖5 紐約市各區(qū)Airbnb房源平均價格Figure 5 Average Price of Airbnb Housing Resource by Districts in New York City
圖6給出Airbnb房源類型分布圖。在紐約地區(qū),Airbnb的主力房源為公寓,與之類似的閣樓式公寓和共管式公寓也占有一定比重,而在中西部地區(qū)較為常見的別墅和聯(lián)排別墅房源供給比較緊缺,這也與紐約作為國際化大都市人多地少、資源稀缺的現(xiàn)狀相一致。
圖6 紐約市Airbnb房源類型分布圖Figure 6 Distribution of Different Types of Airbnb Housing Resource in New York City
對采集到的圖片數(shù)據(jù)進(jìn)行類別分析,圖片主要分為3個類別:第1類是以臥室展示為主的圖片,信息較為單一,主要突出臥室中的床鋪和床頭飾品,此類房源定位于“提供舒適的睡眠”這一核心需求;第2類圖片是以客廳或者臥室整體輪廓為主,主要體現(xiàn)房源的內(nèi)部裝修風(fēng)格和整體布局,此類房源展現(xiàn)了房間的整體風(fēng)格;第3類則是房源所在建筑的整體全貌,如整幢建筑外觀,能在一定程度上反映房源所處的環(huán)境和區(qū)位等特點(diǎn),此類房源主要展示房源的外在整體環(huán)境。上述3類圖片側(cè)重點(diǎn)略有不同,但都從不同角度體現(xiàn)房源特點(diǎn),見圖7。
第1類圖片以臥室為主第2類圖片以臥室或客廳的整體輪廓為主第3類圖片以房屋所在建筑的全貎?yōu)橹?/p>
由于通過爬蟲采集的Airbnb房源圖片大小有所差異,不能滿足深度哈希模型的輸入要求。首先,需要根據(jù)2.2的步驟對圖片進(jìn)行預(yù)處理;其次,將處理后的圖片整理合并組成Airbnb房源圖片數(shù)據(jù)庫;再次,將用戶瀏覽過的圖片作為查詢圖片,通過圖像檢索得到與查詢圖片風(fēng)格相似的圖片;最后,根據(jù)相似性高低進(jìn)行排序,作為對用戶的推薦結(jié)果。具體步驟是:①根據(jù)前文提出的框架,依次遍歷Airbnb房源圖片數(shù)據(jù)庫中的圖片;②將所有圖片經(jīng)過深度哈希模型處理,生成房源圖像特征類哈希值,并建立索引庫;③將用戶瀏覽過的房源圖片作為查詢圖片,通過深度哈希模型處理生成圖像特征類哈希值;④將查詢圖片的圖像特征類哈希值與索引庫中的數(shù)值進(jìn)行相似性匹配,按照相似性高低進(jìn)行排序,并輸出檢索結(jié)果。
下面隨機(jī)選取用戶瀏覽過的3張房源圖片作為查詢圖片,依據(jù)上述流程運(yùn)行,得到相似度較高的3個圖片檢索結(jié)果,示例見圖8,左側(cè)為查詢圖片,右側(cè)為檢索結(jié)果。
圖8的結(jié)果直觀體現(xiàn)了本研究提出的基于深度哈希的相似圖片推薦系統(tǒng)的能力。以第1行為例,本研究選取的查詢圖片為包含雙人床的臥室,色調(diào)整體比較鮮明,風(fēng)格比較溫馨。觀察檢索結(jié)果可以發(fā)現(xiàn),無一例外都是包含雙人床的臥室。此外,還有相似的房間壁畫、房間布局和顏色搭配等。從視覺角度看,床上棉被色澤鮮艷,整體偏暖色調(diào),與查詢圖片風(fēng)格高度相似。同理,第2行和第3行的檢索結(jié)果也呈現(xiàn)出相似的信息,如喜歡有床的查詢圖片,檢索結(jié)果也都包含床這一物體,同時兼顧到床的顏色等視覺信息。對于重視建筑外觀的查詢圖片,檢索結(jié)果兼具語義信息和視覺信息。
查詢圖片檢索結(jié)果:與查詢圖片具有高相似度的前3張圖片
方法查詢圖片檢索結(jié)果:與查詢圖片具有高相似度的前3張圖片DNNH算法本研究模型
為了證明本方法的有效性,本研究參考經(jīng)典深度哈希(deep neural network Hashing,DNNH)算法,對同一查詢圖片進(jìn)行處理,返回與查詢圖片具有高相似度的前3張圖片作為檢索結(jié)果,見圖9。經(jīng)過對比可以看出,在采用DNNH算法的檢索結(jié)果中,展示了房源臥室的床、被和畫等基本元素,但是缺少色彩、風(fēng)格和布局等要素的展示。本研究提出的方法則綜合了基本元素以及圖片色彩、風(fēng)格和布局等要素,更加全面。
本研究隨機(jī)選取紐約曼哈頓區(qū)同位置、同價位的3組公寓房源圖片作為目標(biāo)房源,利用DNNH算法和本研究模型分別進(jìn)行檢索,將兩個模型反饋的與查詢圖片具有高相似度的前3張圖片作為檢索結(jié)果,并以Airbnb靜態(tài)頁面形式進(jìn)行展示,配有“預(yù)定”按鈕作為選擇結(jié)果。征集50名本科學(xué)生對10組數(shù)據(jù)的檢索結(jié)果進(jìn)行選擇,讓他們通過閱讀房源信息和圖片,分別做出預(yù)定與否的決策,進(jìn)而計算推薦房源圖片的轉(zhuǎn)化率作為吸引力的判斷。分別對每組查詢圖片的兩種算法檢索結(jié)果進(jìn)行統(tǒng)計,并計算平均轉(zhuǎn)化率,對比結(jié)果見表3。由表3可知,本研究提出的算法推薦效果明顯優(yōu)與DNNH模型,平均轉(zhuǎn)化率達(dá)到50.4%,說明推薦圖片的吸引力更強(qiáng)。同時,分析每組按照圖片相似度高低排序的推薦房源轉(zhuǎn)化率,與目標(biāo)房源相似度越高的推薦房源,越容易獲得用戶的青睞,其“預(yù)定”該房源的可能性相對較高。
表3 兩種算法的推薦效果對比Table 3 Comparison of Recommendation the Effect between Two Algorithms
本研究針對在線短租平臺提出的基于深度哈希的相似圖片推薦系統(tǒng),運(yùn)用房源圖片進(jìn)行用戶個性化推薦或提高信息檢索效果等,具有一定的實(shí)用價值。與DNNH進(jìn)行對比,本研究提出的方法綜合了DNNH算法識別的基本元素以及布局和色彩算法等要素,取得了更好的推薦效果,提升了平臺的推薦性能。個性化推薦能夠增強(qiáng)消費(fèi)者的認(rèn)知能力,使其更傾向主導(dǎo)產(chǎn)品,進(jìn)而減少產(chǎn)品轉(zhuǎn)換的概率,從而提高決策質(zhì)量[34]。結(jié)合理性行為理論,本研究提出的圖片推薦系統(tǒng)能根據(jù)用戶的視覺偏好圖片返回最相似的圖片,為消費(fèi)者的理性決策提供客觀支持,增強(qiáng)消費(fèi)者決策的信心,并吸引消費(fèi)者點(diǎn)擊。
基于深度哈希的相似圖片推薦系統(tǒng)能夠有效利用商品圖片進(jìn)行信息挖掘、提取和分析。一方面提升了平臺的整體推薦性能和效率,另一方面抓住了用戶的視覺特征,更加準(zhǔn)確地滿足用戶需求。本研究提出的框架完善了傳統(tǒng)推薦系統(tǒng)的特征維度,為互聯(lián)網(wǎng)平臺的商品檢索方式提供了另外一種思路。主要研究結(jié)果如下。
(1)基于深度哈希的相似圖片推薦系統(tǒng)運(yùn)用房源圖片進(jìn)行消費(fèi)者個性化推薦或提高信息檢索效果,擺脫人工設(shè)計用戶畫像和抽取用戶特征的繁瑣步驟,通過神經(jīng)網(wǎng)絡(luò)無監(jiān)督學(xué)習(xí)的特點(diǎn)使該系統(tǒng)能夠自動識別消費(fèi)者的房源偏好;
(2)本研究將深度學(xué)習(xí)與哈希算法結(jié)合,即將模型經(jīng)過卷積神經(jīng)網(wǎng)絡(luò)處理后的特征值進(jìn)行類哈希二值化輸出,并通過設(shè)置損失函數(shù)、優(yōu)化網(wǎng)絡(luò)參數(shù)、優(yōu)化訓(xùn)練策略和超參數(shù)進(jìn)行模型最優(yōu)化處理,顯著提升相似圖片的識別精度;
(3)本研究設(shè)計的框架主要針對在線短租平臺,提供了一種基于消費(fèi)者圖片偏好進(jìn)行商品推薦的營銷思路,提高了購買推薦房源的轉(zhuǎn)化率和平臺的吸引力,幫助偏好圖片的用戶提高決策能力。同時,本研究發(fā)現(xiàn)消費(fèi)者傾向于選擇與自身偏好高度相關(guān)的房源信息,為在線短租平臺的推薦策略提供了參考。
本研究的主要意義在于對消費(fèi)者決策中視覺因素的關(guān)注,并為此設(shè)計出基于深度哈希技術(shù)的圖片個性化推薦系統(tǒng),該系統(tǒng)能夠識別圖片信息中的色彩、風(fēng)格和布局等信息,從而為消費(fèi)者提供基于商品視覺信息的商品排序,為消費(fèi)者瀏覽和購買商品提供新的檢索方式和營銷手段。
在線短租平臺是以先進(jìn)的信息技術(shù)為支撐的,強(qiáng)調(diào)人的參與性和互動性,是有效連接供需資源的新型信息中介,實(shí)現(xiàn)房源的精準(zhǔn)營銷。傳統(tǒng)的營銷思路主要是結(jié)合房源價格、房屋面積和地理位置等固有屬性進(jìn)行模型設(shè)計,本研究提出的方法借助深度學(xué)習(xí)技術(shù)挖掘出圖片內(nèi)容中的一些隱藏特征,利用消費(fèi)者的房源偏好刻畫用戶畫像,進(jìn)而對消費(fèi)者進(jìn)行群體劃分,為實(shí)現(xiàn)精準(zhǔn)營銷提供基于消費(fèi)者圖片偏好的技術(shù)支撐。對于提供房源的商家,引入房源圖片的個性化推薦系統(tǒng),幫助商家尋找潛在客戶,提高消費(fèi)者線上線下的轉(zhuǎn)化率,在一定程度上降低商家的營銷推廣成本。對于消費(fèi)者,使用高效率的相似圖片推薦系統(tǒng)能為消費(fèi)者決策提供更好的輔助支持,大大節(jié)省決策時間,降低消費(fèi)過程中存在的風(fēng)險,有效作出消費(fèi)決策。
本研究結(jié)果具有很好的推廣價值,特別是在電子商務(wù)領(lǐng)域。幫助消費(fèi)者在選擇商品時通過視覺信息的展示輔助進(jìn)行決策,如消費(fèi)者在電商網(wǎng)站購買服裝和裝飾品等視覺類產(chǎn)品時,平臺可以有效利用本研究的框架提升推薦效果和購買轉(zhuǎn)化率。此外,本研究提出的方法增加了圖像檢索技術(shù)的效率和準(zhǔn)確性,幫助電商網(wǎng)站提高檢索效率和APP中“以圖搜圖”等工具的有效性。
本研究結(jié)果對營銷領(lǐng)域的研究和實(shí)際營銷工作有一定的啟示。首先,本研究通過發(fā)現(xiàn)圖片的各種隱藏特征,提示研究者在分析決策行為時,不僅應(yīng)關(guān)注傳統(tǒng)的價格和渠道等信息,也應(yīng)關(guān)注視覺信息對消費(fèi)者產(chǎn)生的直接影響,這豐富了視覺感知影響消費(fèi)者決策的理論[47];其次,電商平臺應(yīng)重視商品圖片的展示質(zhì)量,在對消費(fèi)者進(jìn)行人物畫像實(shí)施精準(zhǔn)推薦時,不僅需結(jié)合客戶特征和交易信息等結(jié)構(gòu)化數(shù)據(jù),更要充分利用圖像這種非結(jié)構(gòu)化數(shù)據(jù)中的關(guān)鍵信息,進(jìn)一步提高營銷推薦的準(zhǔn)確性和有效性;最后,圖片是展示商品的重要途徑,在提升營銷效率方面,商家應(yīng)積極披露圖片關(guān)鍵信息,展示核心賣點(diǎn),減少自身與消費(fèi)者之間的信息不對稱性。
本研究存在一些不足之處需要在今后的研究中繼續(xù)改進(jìn)。①在模型的優(yōu)化上缺乏實(shí)驗,在不同的場景中參數(shù)可能有所變化,未來可以通過研究深度哈希模型處理圖像的內(nèi)在機(jī)理進(jìn)行更好地模型優(yōu)化;②由于實(shí)驗場景單一,實(shí)驗選取樣本數(shù)量有限,對產(chǎn)品類型選擇等存在局限,后續(xù)可通過增加場景,或者在同類及不同產(chǎn)品中進(jìn)行對比,增強(qiáng)研究結(jié)論的魯棒性;③本研究沒有對Airbnb圖像數(shù)據(jù)集進(jìn)行標(biāo)注,未來通過對圖像數(shù)據(jù)集進(jìn)行標(biāo)注,可以獲得圖片相似性和差異性標(biāo)簽,進(jìn)一步提高模型的處理效果;④本研究提出的推薦系統(tǒng)并未投入到實(shí)際使用中,未來可通過將該推薦系統(tǒng)部署到網(wǎng)站上,對用戶的實(shí)際使用情況進(jìn)行研究,進(jìn)一步分析該推薦系統(tǒng)能否為網(wǎng)站提高點(diǎn)擊率或者提高用戶的購買欲望。