江億平 張 婷 夏爭鳴 鄭德俊
(南京農(nóng)業(yè)大學(xué)信息管理學(xué)院)
中央網(wǎng)絡(luò)安全和信息化委員會印發(fā)的《“十四五”國家信息化規(guī)劃》提出,將“提升數(shù)據(jù)資源開發(fā)利用水平”作為重大任務(wù)之一[1]。開展數(shù)據(jù)資源應(yīng)用也是信息資源管理學(xué)科的前沿交叉科學(xué)問題,其中用戶評論是較為成熟的數(shù)據(jù)資源應(yīng)用領(lǐng)域,對其進(jìn)行情感分析,有利于提升數(shù)據(jù)開發(fā)應(yīng)用水平[2]。目前,居民鮮果采購渠道逐漸由線下門店轉(zhuǎn)向線上平臺,消費者在線上購買決策過程中,會綜合考慮產(chǎn)品價值、在線評論等因素,同時產(chǎn)品價值等信息會通過在線評論的形式傳遞給其他消費者。零售商忽視在線評論,會導(dǎo)致定價決策過程中出現(xiàn)偏差,從而減少可獲得的利潤,阻礙長期發(fā)展,甚至可能會對整個生鮮電商行業(yè)造成消極影響[3]。因此,開展鮮果在線評論的情感分析與零售商定價決策管理的交叉研究,促進(jìn)信息管理學(xué)科理論方法與電商運營管理實踐的交叉融合,是電商平臺可持續(xù)發(fā)展需要解決的重要科學(xué)問題,更是信息管理驅(qū)動的交叉科學(xué)研究熱點。
然而,基于在線評論情感分析的鮮果動態(tài)定價研究是一個復(fù)雜的問題。主要包括以下幾個方面:①在線評論情感分析。高效準(zhǔn)確地進(jìn)行在線評論情感分析需要綜合考慮評論數(shù)量、評論分類和評論有效性等因素。②鮮果易腐特性。線上零售商需要考慮鮮果腐爛程度對消費者價值估值的影響,合理調(diào)整鮮果的價格波動,以增加銷量。③決策間耦合關(guān)系。線上銷售的鮮果兩階段動態(tài)定價受零售商和消費者共同決策,兩者互相影響。
現(xiàn)有文獻(xiàn)中,不少學(xué)者從線上零售商角度出發(fā),綜合考慮生鮮農(nóng)產(chǎn)品特性、產(chǎn)品評論以及消費者行為等因素,進(jìn)行相關(guān)研究[4,5]。已有針對在線評論的研究側(cè)重于固定參數(shù)的場景,較少結(jié)合電商平臺的實際應(yīng)用場景。關(guān)于在線評論的研究方法,現(xiàn)有的半監(jiān)督學(xué)習(xí)方法主要依靠訓(xùn)練單一分類器來實現(xiàn)樣本的分類訓(xùn)練,當(dāng)面對大數(shù)據(jù)量的用戶評論時,往往會出現(xiàn)分析時間較長等問題[6]。
本研究的創(chuàng)新工作包含3個方面:①構(gòu)建融合邊緣采樣和Tri-training算法的在線評論情感分析模型,為分析在線評論中包含的消費者情感提供新的方法;②提出了基于在線評論情感分析的鮮果動態(tài)定價模型,為促進(jìn)信息系統(tǒng)與定價問題的交叉科學(xué)研究提供新的探索;③運用融合高斯回代的交替方向乘子法求解線上鮮果動態(tài)定價問題,為考慮消費者和零售商的多主體動態(tài)定價研究提供新的策略。
目前,在線評論情感分析主要有基于情感詞典、基于語義及基于機(jī)器學(xué)習(xí)3種方法。具體而言:①基于情感詞典的分析方法準(zhǔn)確率高,但泛化能力不強[7,8]。LI等[9]引入社會學(xué)理論的八要素對在線評論中的情感概念進(jìn)行歸納;包乾輝等[10]對雞蛋在線評論文本進(jìn)行消費情感傾向分析。②基于語義的分析方法雖然有一定的泛化能力,但處理句法信息簡略、結(jié)構(gòu)性不強的短文本時準(zhǔn)確率較低[11,12]。ZHANG等[13]將輸出連接成類感知向量,獲取用于情感預(yù)測的跨模態(tài)非線性關(guān)聯(lián);WANG等[14]提出句子-句子多路注意力網(wǎng)絡(luò)方法來降低句子序列帶來的復(fù)雜性。③機(jī)器學(xué)習(xí)已逐漸成為情感分析的主流方法。最常用的機(jī)器學(xué)習(xí)方法是監(jiān)督學(xué)習(xí)[15,16]。史達(dá)等[17]采用機(jī)器學(xué)習(xí)方法對酒店評論進(jìn)行情感分析;ZHU等[18]結(jié)合人工智能技術(shù)來制定可識別關(guān)鍵在線消費者評論的機(jī)制。
近年來,國內(nèi)外學(xué)者通過對生鮮屬性的刻畫,對生鮮農(nóng)產(chǎn)品動態(tài)定價問題展開相關(guān)研究。目前,針對生鮮農(nóng)產(chǎn)品品質(zhì)隨時間逐漸衰減特征,生鮮零售商通常以最大化貨架期內(nèi)收益為目標(biāo),通過調(diào)整定價策略來吸引消費者。KAYIKCI等[19]提出數(shù)據(jù)驅(qū)動下的農(nóng)產(chǎn)品多階段最優(yōu)定價策略;聞卉等[20]探討了考慮綠色度的不同銷售模式下生鮮農(nóng)產(chǎn)品最優(yōu)定價問題。在生鮮農(nóng)產(chǎn)品銷售過程中,庫存政策和定價策略相互作用。FANG等[21]研究隨機(jī)動態(tài)規(guī)劃模型決策多周期下的定價與庫存問題;FAN等[22]制定了多批次聯(lián)合動態(tài)定價和補貨計劃。分析消費者購買偏好成為零售商制定定價決策的重要環(huán)節(jié)[23~25]。VAHDANI等[26]研究零售商如何根據(jù)消費者評分的變化來調(diào)整易腐產(chǎn)品定價策略;周玉等[27]構(gòu)建兩制造商均不回復(fù)差評、單一制造商回復(fù)差評,以及兩制造商均回復(fù)差評的定價決策模型。
通過以上文獻(xiàn)綜述可知,基于情感詞典和文本語義的兩類方法在應(yīng)對海量、繁雜的在線評論時,泛化能力與準(zhǔn)確率難以兼顧,現(xiàn)有基于機(jī)器學(xué)習(xí)方法的研究較少考慮半監(jiān)督學(xué)習(xí)方法。本研究在已有的半監(jiān)督學(xué)習(xí)方法研究的基礎(chǔ)上,從初始集構(gòu)造和分類器集成規(guī)則兩個角度,對協(xié)同訓(xùn)練算法進(jìn)行優(yōu)化改進(jìn),促進(jìn)了半監(jiān)督學(xué)習(xí)方法在評論情感分析領(lǐng)域的研究發(fā)展。其次,結(jié)合在線評論情感分析對該領(lǐng)域的定價策略展開研究仍然是熱點問題。因此,本研究以實際評論數(shù)據(jù)為基礎(chǔ),運用評論情感分析結(jié)果,構(gòu)建兩階段動態(tài)定價模型,得出合理的定價策略,旨在促進(jìn)信息資源管理理論方法與電商運營管理實踐的交叉融合,豐富數(shù)字中國建設(shè)的實踐應(yīng)用場景。
鮮果動態(tài)定價示意圖見圖1。該定價問題包含零售商和消費者兩個主體、預(yù)售和現(xiàn)售兩個階段,需要同時考慮零售商成本和收益、鮮果貨架期、消費者效用、平臺在線評論等多種因素。由圖1可見,以線上銷售為主渠道的鮮果零售商從供應(yīng)商處進(jìn)貨并制定初始價格,消費者在平臺購買產(chǎn)品時還沒有評論參考,所以消費者比較產(chǎn)品估值與產(chǎn)品價格來決定是否購買;購買者相繼在平臺上發(fā)表評論,通過對已有評論的分析,未參與購買的消費者可以從中了解到產(chǎn)品信息和服務(wù)質(zhì)量,從而更新對產(chǎn)品的價值估值;零售商可以從評論中挖掘問題,進(jìn)一步調(diào)整價格。因此,本研究首先從零售商視角出發(fā),建立消費者在線評論情感與消費者價值估值之間的關(guān)系;然后綜合鮮果易腐與配送時效特征,厘清在線評論和線上渠道定價決策的耦合性,構(gòu)建基于在線評論情感分析的鮮果動態(tài)定價模型;最后,設(shè)計融合高斯回代的交替方向乘子法對模型進(jìn)行求解,并通過數(shù)值仿真和靈敏度分析,得出零售商最優(yōu)定價決策。
圖1 鮮果動態(tài)定價示意圖
本研究通過分析不同零售商鮮果的線上評論信息,計算在線評論對消費者價值估值的影響因子,為零售商及時調(diào)整價格策略提供幫助。關(guān)于在線評論的研究方法,現(xiàn)有的半監(jiān)督學(xué)習(xí)方法主要依靠訓(xùn)練單一分類器來實現(xiàn)樣本的分類訓(xùn)練,當(dāng)面對大量的在線評論時,往往會出現(xiàn)分析時間較長等問題?;诖?,本研究提出了融合改進(jìn)邊緣采樣和Tri-training的分類算法,以下簡稱IMS-Tri-training,并以此為基礎(chǔ)構(gòu)建在線評論情感分析模型,模型分為數(shù)據(jù)準(zhǔn)備、改進(jìn)邊緣采樣和Tri-training 3個部分。
(1)數(shù)據(jù)準(zhǔn)備令s={s1,s2,…,si,…,sn},其中s表示在線評論數(shù)據(jù)集中的文本。利用在電商平臺評論文本中訓(xùn)練好的詞向量模型Vec對si進(jìn)行向量化表示,ai=Vec(si),ai∈RL×dw,L為句子長度,dw為詞向量的維度,本研究將a={a1,a2,…,ai,…,an}作為電商在線評論文本的表示。
(1)
比較各個樣本點到分類超平面的距離,從中選出該SVM分類邊緣之內(nèi)的候選樣本點,目標(biāo)是從大量的未標(biāo)記樣本集U(有n個未標(biāo)記樣本,且n?m)中找到距離分界面最近的所有樣本點,則該樣本點滿足的距離條件為
x*=argmin|d|。
(2)
找到樣本點x*后人工標(biāo)記其類別。邊緣采樣易出現(xiàn)多個樣本點信息量相似的情況,從而造成“扎堆”選擇與信息冗余,與所追求的初始集信息盡可能豐富的目標(biāo)相悖。在文本特征空間中,兩個樣本越相似,則它們越趨向于平行,余弦值也就越大。本研究將余弦相似度定理和邊緣采樣相結(jié)合提出改進(jìn)的邊緣采樣,任意兩樣本間的相似度為
(3)
(3)Tri-training該算法在對未見樣本進(jìn)行預(yù)測時,使用集成學(xué)習(xí)中的硬投票規(guī)則,將3個分類器進(jìn)行集成,來實現(xiàn)對未標(biāo)記樣本的分析預(yù)測;通過判斷3個分類器的預(yù)測一致性,來隱式地對不同未標(biāo)記樣本的標(biāo)記置信度進(jìn)行比較,使得算法不需要頻繁地使用耗時的統(tǒng)計測試技術(shù)。但與顯式估計標(biāo)記置信度相比,這一隱式處理往往不夠準(zhǔn)確。因此,本研究采用軟投票的方式,要求集成的每一個分類器{hi,hj,hk}都能估計概率,將所有分類器預(yù)測樣本為某一類別概率的平均值作為標(biāo)準(zhǔn),概率最高的分類類別為最終的預(yù)測結(jié)果(result),則有
(4)
(5)
(6)
最后,本研究基于在線評論情感分析的結(jié)果,并依據(jù)羅漢洋等[28]的研究,選擇3個數(shù)據(jù)信息較好的鮮果在線評論樣本集,提取評論總數(shù)、負(fù)面評論比例、正面評論比例以及“價格”關(guān)注度4個指標(biāo)數(shù)據(jù)的平均值。評論總數(shù)是某個產(chǎn)品評論集數(shù)據(jù)清理后的評論總數(shù);負(fù)面評論比例是將評論按照“很好”“較好”“一般”“較差”“很差”進(jìn)行多類分類后,包含“較差”和“很差”類別的評論個數(shù)占總數(shù)的比例;正面評論比例同理;“價格”關(guān)注度為涉及“價格”屬性評論數(shù)量在所有產(chǎn)品屬性評論數(shù)量中所占的比重,產(chǎn)品屬性包括新鮮度、甜度、價格、水分、口感等。對評論集的指標(biāo)數(shù)據(jù)實施標(biāo)準(zhǔn)化處理,然后綜合多個評論集的指標(biāo)信息進(jìn)行消費者價值估值影響的評價,則有
(7)
(8)
本研究對模型設(shè)置以下假設(shè)前提:
(1)鮮果潛在消費者群體為固定群體,不存在可替代競爭品。
(2)通常鮮果交付使用的是冷藏運輸車,假設(shè)供應(yīng)商按時將鮮果運給零售商且無損耗。
(3)不考慮鮮果異質(zhì)性,當(dāng)該階段鮮果貨架期結(jié)束時停止銷售,剩余鮮果丟棄處理。
(4)假設(shè)零售商每階段只進(jìn)貨一次,可進(jìn)行任意數(shù)量的進(jìn)貨,且每次進(jìn)貨的品質(zhì)一樣。
(5)消費者在認(rèn)為價格不高于價值估值的情況下會進(jìn)行一個單位的購買,且購買者都會進(jìn)行有效評論。
(6)不考慮同一階段中評論的先后順序,即同一階段后購買的消費者看不到前面消費者給出的評論。
3.2.1目標(biāo)函數(shù)
(9)
(10)
(11)
(12)
3.2.2消費者決策約束
(13)
(14)
(15)
(16)
(17)
(18)
(19)
3.2.3零售商決策約束
(20)
(21)
假設(shè)零售商進(jìn)貨時,鮮果為100%新鮮,則有
(22)
(23)
s.t.
(24)
(25)
(26)
(27)
(28)
(29)
(30)
(31)
(32)
(33)
(34)
式(23)是化簡后的決策目標(biāo)函數(shù);式(24)~式(27)為保證零售商收益的成本需求約束;式(28)~式(32)為消費者決策約束;式(33)為零售商的定價約束;式(34)是鮮果易腐屬性約束。
考慮到模型目標(biāo)函數(shù)為兩個階段的總收益,可分離成兩個獨立的目標(biāo)函數(shù),且其中存在離散0-1變量,因此可采用考慮高斯回代的交替方向乘子法(ADMM-GBS)對模型進(jìn)行求解。將式(28)~式(30)代入式(31)、式(32)進(jìn)行簡化,得到
(35)
式中,M是個充分大的數(shù)。為了使消費者價值估值函數(shù)更具有泛化性,將式(34)和式(35)進(jìn)行合并,得到
(36)
(37)
(38)
將決策目標(biāo)函數(shù)系數(shù)轉(zhuǎn)化為矩陣形式QC,即
(39)
因此,基于在線評論情感分析的鮮果動態(tài)定價模型可轉(zhuǎn)化為
(40)
(41)
圖2 火龍果新鮮度變化過程
圖3 火龍果各階段動態(tài)定價最優(yōu)決策
由圖3可知,不同貨架期火龍果的價格呈下降趨勢,且與圖2的鮮果品質(zhì)變化曲線相似,說明零售商對火龍果的新鮮度變化有較清晰的了解。此外,第一階段零售商采取保守定價,在火龍果貨架期臨近結(jié)束前2天以低于進(jìn)貨成本的價格4.76元出售;第二階段零售商了解到產(chǎn)品評論較好,認(rèn)為即使上調(diào)價格,依然可以保證銷量,臨近貨架期結(jié)束也不會低于成本價出售。
3.4.1第二階段有無調(diào)整定價策略對比分析
為進(jìn)一步討論動態(tài)定價策略對零售商利潤的影響,對比第二階段有無調(diào)整價格策略下零售商的銷量和利潤(見表1)。為了排除進(jìn)貨量不同對利潤的影響,兩次實驗第二階段初期進(jìn)貨量均為5 180個。由表1可知,第二階段調(diào)整價格后比未調(diào)整情況下火龍果銷量減少了2.18%,但零售商利潤提高了25.47%。說明第二階段零售商調(diào)高價格后減少了火龍果的銷量,但在線評論的良好口碑對于消費者價值估值起到了積極的影響,抵消了提價對零售商銷量造成的損失。從整個銷售情況出發(fā),零售商減少了1%左右的銷量,總利潤增加了約13%。通過對比分析可知,準(zhǔn)確高效地進(jìn)行在線評論情感分析,對于線上生鮮零售商增加盈利具有重要作用。因此,如何經(jīng)營自身產(chǎn)品口碑,并以此為基礎(chǔ)合理調(diào)整產(chǎn)品價格以創(chuàng)造更大的收益,是線上銷售需研究的關(guān)鍵問題。
表1 第二階段有無調(diào)整價格策略下銷售結(jié)果對比分析
3.4.2不同在線評論集對火龍果動態(tài)定價策略的影響分析
考慮到不同在線評論對消費者具有不同程度的購買決策影響,對多個在線評論集進(jìn)行情感分析,并計算相對應(yīng)的消費者價值估值影響因子,對比分析不同影響因子下零售商的最優(yōu)定價決策(見表2)。由表2可知,在線評論對消費者價值估值的影響因子與火龍果銷量呈正相關(guān),現(xiàn)有評論越好,火龍果銷量越高。當(dāng)在線評論影響因子μ≥0時,第二階段零售商會抬高價格來獲取更高的利潤;當(dāng)μ<0時,零售商在第二階段會降低價格來抵消第一階段的差評造成的客戶流失。綜上可知,在線評論對零售商銷售的影響具有“雪球效應(yīng)”。
表2 不同在線評論影響因子下的最優(yōu)銷售結(jié)果
3.4.3重要參數(shù)靈敏度分析
為了驗證不同參數(shù)對火龍果動態(tài)定價決策的影響,選擇單位火龍果每日庫存成本(c1)、消費者收入水平(β)和零售商承諾配送期限(t0)為重要參數(shù)指標(biāo),通過設(shè)置參數(shù)的不同取值范圍進(jìn)行實驗分析。
設(shè)置單位火龍果每日庫存成本(c1)為0.01~0.10,研究零售商銷量與利潤的變化情況(見圖4)。由圖4可知,單位火龍果的庫存成本升高會導(dǎo)致零售商利潤減少,但庫存成本提高可以反映出鮮果零售商對于鮮果貯藏水平的改善,有利于降低鮮果腐爛速率,保證鮮果品質(zhì),從而吸引更多的消費者。因此,單位火龍果的庫存成本與銷量呈正相關(guān)。
圖4 單位庫存成本與銷售結(jié)果的關(guān)系
消費者收入水平(β)越高,說明消費者能接受的心理價格越高,對產(chǎn)品價值估值的下限越高。為了分析收入水平對零售商銷售決策的影響,消費者收入水平分別設(shè)置在(0,1)之間(見表3)。由表3可知,各階段平均定價為已出售火龍果的總收入與數(shù)量之比。隨著收入水平的增加,消費者可接受產(chǎn)品心理價格不斷提高。當(dāng)消費者收入水平普遍較低(β<0.5)時,零售商在第二階段可調(diào)整價格的幅度較小,且消費者更傾向于量多價低的火龍果;當(dāng)消費者收入水平較高時,零售商能夠較大幅度上調(diào)價格以獲取高額利潤,且消費者偏好量少質(zhì)優(yōu)的火龍果。
表3 收入水平對零售商動態(tài)定價決策的影響分析
圖5 零售商承諾配送期限與銷售結(jié)果的關(guān)系
3.4.4對比ADMM-GBS算法與ADMM算法迭代結(jié)果
為進(jìn)一步說明ADMM-GBS算法在收斂性上的優(yōu)勢,對比分析兩種算法下的迭代收斂效果(見圖6)。由圖6可知,ADMM-GBS可以較快收斂到最優(yōu)策略,即迭代次數(shù)到19次時,已經(jīng)取得最優(yōu)解組合,第二階段初始單價調(diào)整為12.22元時,兩個階段總銷量達(dá)到10 004,總利潤為26 311元;而ADMM算法雖然隨著迭代進(jìn)行具有一定的收斂性,最優(yōu)利潤也在不斷增加,但由于每次迭代缺乏對最優(yōu)解的修正,導(dǎo)致收斂速度緩慢。結(jié)果證明,ADMM算法與高斯回代有機(jī)結(jié)合可以有效地優(yōu)化算法的收斂性,從而快速收斂到最優(yōu)解。
圖6 算法迭代收斂效果比較
本研究面向數(shù)字經(jīng)濟(jì)背景,以提高線上鮮果零售商經(jīng)濟(jì)效益為研究目標(biāo),探討了以線上銷售為主渠道的鮮果零售商動態(tài)定價問題。研究發(fā)現(xiàn):①考慮在線評論情感分析的鮮果動態(tài)定價有助于增加線上生鮮零售的利潤,從整個銷售情況出發(fā),動態(tài)定價策略下零售商的總利潤增加了約13%。②單位鮮果的庫存成本與銷量呈正相關(guān)。庫存成本提高可以反映出鮮果零售商對于鮮果貯藏水平的改善,有利于降低鮮果腐爛速率,保證鮮果品質(zhì),從而吸引更多的消費者。③當(dāng)消費者收入水平普遍較低時,零售商在第二階段可調(diào)整價格的幅度較小,且消費者更傾向于量多價低的鮮果;當(dāng)消費者收入水平較高時,零售商能夠較大幅度上調(diào)價格以獲取高額利潤,且消費者偏好量少質(zhì)優(yōu)的鮮果。
本研究結(jié)論可以為以線上渠道為主的鮮果零售商提供可行的銷售管理建議,管理啟示如下:①準(zhǔn)確高效地進(jìn)行在線評論情感分析,對于線上生鮮零售商增加盈利具有重要作用,以線上銷售為主的零售商應(yīng)當(dāng)注重初始階段的價格決策與口碑樹立,為長期發(fā)展奠定堅實的基礎(chǔ);②零售商決策承諾配送期限時,需綜合考慮承諾配送期限與服務(wù)范圍、配送成本之間的耦合關(guān)聯(lián)以做出最優(yōu)決策;③零售商應(yīng)針對不同收入消費群體選擇合理的動態(tài)定價策略。
本研究已對在線評論情感分析及其影響的鮮果動態(tài)定價問題開展了學(xué)科交叉的探索性研究,然而在該領(lǐng)域還存在很多問題有待深入探討。未來研究可以從以下3個方面展開:①在分析方法方面,可以從方法融合的角度出發(fā),綜合運用圖像、音頻、視頻處理技術(shù),以提高方法的適用性和可行性;②在銷售決策方面,可以從完整銷售周期出發(fā),綜合考慮零售商補貨、消費者退貨等環(huán)節(jié),從市場供需和消費者需求角度進(jìn)行考慮,提出更適用于實際應(yīng)用場景的銷售策略;③在需求函數(shù)方面,可以將多個參與主體及相關(guān)需求約束引入到需求函數(shù)構(gòu)建中,使得零售商定價研究工作更加全面。