曹珂+嚴(yán)明義
摘要:近年來(lái),如何從個(gè)人角度分析競(jìng)買(mǎi)者出價(jià)行為成為研究難點(diǎn)。本文運(yùn)用基于函數(shù)性稀疏數(shù)據(jù)聚類(lèi)方法從競(jìng)買(mǎi)者個(gè)人角度定義了基于條件期望的距離矩陣,并結(jié)合多維尺度分析方法(MDS)和相平面圖分析法對(duì)競(jìng)買(mǎi)者出價(jià)行為特征進(jìn)行聚類(lèi)分析。結(jié)果表明,按出價(jià)時(shí)間、金額、出價(jià)能量以及獲勝概率可將競(jìng)買(mǎi)者分為顯著的四類(lèi)。其中,經(jīng)驗(yàn)豐富型競(jìng)買(mǎi)者獲勝概率最高,勢(shì)在必得型競(jìng)買(mǎi)者獲勝意愿最強(qiáng)烈,缺乏經(jīng)驗(yàn)型競(jìng)買(mǎi)者退出競(jìng)拍時(shí)間較早導(dǎo)致獲勝概率較低,圍觀型競(jìng)買(mǎi)者由于競(jìng)拍意愿不強(qiáng)烈所以獲勝概率最低。
關(guān)鍵詞:稀疏數(shù)據(jù);函數(shù)性聚類(lèi)分析;出價(jià)行為特征;網(wǎng)上拍賣(mài)
文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):100228482017(06)011507
一、 引言
近十年來(lái),不論是國(guó)外的eBay、Amazon,抑或是中國(guó)的淘寶網(wǎng)拍賣(mài)會(huì)、嘉德在線等網(wǎng)上拍賣(mài)平臺(tái)發(fā)展迅速,吸引了大量競(jìng)買(mǎi)者參與。同時(shí),網(wǎng)上拍賣(mài)種類(lèi)也日臻完善,藝術(shù)品、司法拍賣(mài)等特殊品拍賣(mài)也逐漸采用以網(wǎng)上拍賣(mài)為主的銷(xiāo)售渠道。網(wǎng)上拍賣(mài)的普及一方面節(jié)省了組織者的人力、物力成本,另一方面也降低了競(jìng)買(mǎi)者的參與門(mén)檻,使資金量較少的普通競(jìng)買(mǎi)者也能參與其中,增加競(jìng)買(mǎi)人數(shù),競(jìng)拍更加激烈,帶來(lái)雙贏結(jié)果。
對(duì)傳統(tǒng)線下拍賣(mài)理論的研究始于1961年,Vickrey[1]假設(shè)競(jìng)買(mǎi)者價(jià)值獨(dú)立分布且對(duì)稱(chēng)(服從同一分布函數(shù))、風(fēng)險(xiǎn)中性并無(wú)預(yù)算約束,通過(guò)對(duì)比四種基本拍賣(mài)方式(英式拍賣(mài)、荷蘭式拍賣(mài)、第一價(jià)格密封拍賣(mài)、第二價(jià)格密封拍賣(mài))下的買(mǎi)賣(mài)雙方收益與競(jìng)拍效率,得出收益等價(jià)原理,這一原理構(gòu)成了私人價(jià)值拍賣(mài)理論的基準(zhǔn)。后續(xù)大量研究在此基準(zhǔn)上對(duì)限定性條件加以推廣,將相關(guān)競(jìng)買(mǎi)者假設(shè)逐一放松,以博弈論為工具探討不同拍賣(mài)方式對(duì)收益等價(jià)原理的影響。其實(shí)早在1961年Vickrey就指出競(jìng)買(mǎi)者之間存在的不對(duì)稱(chēng)性,并對(duì)比了兩個(gè)不對(duì)稱(chēng)競(jìng)買(mǎi)者參與的不同拍賣(mài)方式下的收益情況。他假設(shè)競(jìng)買(mǎi)者1的價(jià)值為共同知識(shí),競(jìng)買(mǎi)者2的價(jià)值則服從[0,1]的均勻分布,則第一價(jià)格密封拍賣(mài)的收益可能高于也可能低于第二價(jià)格密封拍賣(mài)的收益。在應(yīng)用方面,Marshall et al.[2]提出了計(jì)算不對(duì)稱(chēng)拍賣(mài)中競(jìng)標(biāo)策略收益的幾種數(shù)值算法。Maskin & Riley[3]則具體研究了不對(duì)稱(chēng)第一價(jià)格密封拍賣(mài)下的均衡性質(zhì),認(rèn)為當(dāng)競(jìng)買(mǎi)者不對(duì)稱(chēng)時(shí),通過(guò)第一價(jià)格拍賣(mài)獲得的期望收益可能超過(guò)第二價(jià)格拍賣(mài)中的期望收益。可以看到,由于傳統(tǒng)拍賣(mài)行業(yè)具有專(zhuān)業(yè)性強(qiáng)、資金需求量大等特點(diǎn),使得競(jìng)拍參與者具有較高同質(zhì)性,早期拍賣(mài)理論研究中的競(jìng)買(mǎi)者對(duì)稱(chēng)性假設(shè)與線下真實(shí)競(jìng)拍參與者屬性相吻合。后續(xù)研究盡管放寬了競(jìng)買(mǎi)者對(duì)稱(chēng)性假設(shè),但研究重點(diǎn)關(guān)注于不同拍賣(mài)方式下收益、效率比較而較少?gòu)母?jìng)買(mǎi)者非對(duì)稱(chēng)性出發(fā),從個(gè)人角度對(duì)競(jìng)買(mǎi)者真實(shí)出價(jià)行為進(jìn)行分析。
網(wǎng)上拍賣(mài)的興起降低了搜索成本,克服了空間與時(shí)間的限制,交易品種不再局限于高價(jià)值物品,拓寬了競(jìng)拍參與者的廣度,傳統(tǒng)拍賣(mài)理論中對(duì)競(jìng)買(mǎi)者對(duì)稱(chēng)性假設(shè)不再符合實(shí)際。同時(shí),大量的網(wǎng)上交易數(shù)據(jù)也為研究網(wǎng)上拍賣(mài)中競(jìng)買(mǎi)者出價(jià)行為提供了便利。在網(wǎng)上拍賣(mài)競(jìng)買(mǎi)者出價(jià)行為的研究中,一些學(xué)者通過(guò)對(duì)競(jìng)買(mǎi)者出價(jià)行為分類(lèi),尋求不同競(jìng)買(mǎi)者的出價(jià)規(guī)律,辨析不同出價(jià)行為之間的差異。Hayne[4]是開(kāi)創(chuàng)這一研究領(lǐng)域的先行者。他隨機(jī)搜集了eBay網(wǎng)中不同類(lèi)別下的出價(jià)數(shù)據(jù),按出價(jià)次數(shù)和出價(jià)時(shí)間將競(jìng)買(mǎi)者分為兩大類(lèi)和六小類(lèi),分別是:?jiǎn)未纬鰞r(jià)者(早出價(jià)、中期出價(jià)、晚出價(jià))和多次出價(jià)者(初次出價(jià)、探查式出價(jià)(Probe Bid)、哨兵式出價(jià)(Sentry Bid)),其中,單次晚出價(jià)的成交成功率最高,單次早出價(jià)的成功率最低。Bapna[5]在Hayne的研究基礎(chǔ)上,將出價(jià)時(shí)間細(xì)分為進(jìn)入拍賣(mài)時(shí)間(Time of Entry)和退出拍賣(mài)時(shí)間(Time of Exit),并結(jié)合出價(jià)次數(shù)共三個(gè)指標(biāo)運(yùn)用快速聚類(lèi)法(kmeans聚類(lèi)法)將網(wǎng)上Yankee拍賣(mài)中的競(jìng)買(mǎi)者分為顯著的五類(lèi):早出價(jià)者(Early Evaluators)、中期出價(jià)者(Middle Evaluators)、機(jī)會(huì)主義者(opportunists)、全程參與出價(jià)者(Participators)以及淺嘗輒止者(SipandDippers)。Bapna同樣也研究了不同出價(jià)行為下的獲勝概率,利用單因素方差分析檢驗(yàn)不同出價(jià)策略是否具有相似的獲勝概率,結(jié)果顯示機(jī)會(huì)主義者和淺嘗輒止者的獲勝概率遠(yuǎn)高于其余三類(lèi)競(jìng)買(mǎi)者。
由于出價(jià)數(shù)據(jù)的不等時(shí)間間隔造成早期網(wǎng)上拍賣(mài)研究大多只能通過(guò)離散的出價(jià)金額分析競(jìng)買(mǎi)者出價(jià)行為。在Ramsay和Silverman[6]系統(tǒng)性地引入函數(shù)性數(shù)據(jù)分析方法后,越來(lái)越多的學(xué)者通過(guò)觀測(cè)到的離散出價(jià)數(shù)據(jù)背后的潛在價(jià)格軌跡來(lái)研究競(jìng)買(mǎi)者網(wǎng)上出價(jià)行為。Shmueli & Jank[7],Shmueli & Russo[8],Jank & Shmueli[9]以函數(shù)性主成分分析為基礎(chǔ),運(yùn)用曲線聚類(lèi)方法對(duì)不同拍品的價(jià)格軌跡進(jìn)行聚類(lèi),探究網(wǎng)上拍賣(mài)價(jià)格形成過(guò)程中的異質(zhì)性并尋找影響出價(jià)的動(dòng)因來(lái)源。嚴(yán)明義[10]通過(guò)對(duì)中國(guó)淘寶網(wǎng)珠寶類(lèi)拍賣(mài)的出價(jià)數(shù)據(jù)運(yùn)用基于基函數(shù)的函數(shù)性聚類(lèi)分析方法,發(fā)現(xiàn)拍品的價(jià)格等級(jí)和類(lèi)別會(huì)對(duì)競(jìng)買(mǎi)者的出價(jià)行為產(chǎn)生不同影響。
通過(guò)對(duì)現(xiàn)有文獻(xiàn)回顧可知,網(wǎng)上拍賣(mài)競(jìng)買(mǎi)者出價(jià)行為研究以函數(shù)性數(shù)據(jù)分析方法的引入為界限可分為早期研究和現(xiàn)有研究。早期研究多采用傳統(tǒng)的計(jì)量統(tǒng)計(jì)方法,通過(guò)離散的出價(jià)數(shù)據(jù)分析競(jìng)買(mǎi)者出價(jià)行為,聚類(lèi)指標(biāo)體系相對(duì)單一;現(xiàn)有研究則運(yùn)用函數(shù)性數(shù)據(jù)分析方法擬合不同拍品在整個(gè)拍賣(mài)期間連續(xù)平滑的出價(jià)軌跡,研究不同拍賣(mài)屬性對(duì)競(jìng)買(mǎi)者出價(jià)行為的影響,但較少?gòu)母?jìng)買(mǎi)者個(gè)人角度出發(fā),研究非對(duì)稱(chēng)競(jìng)買(mǎi)者在整個(gè)拍賣(mài)期間的出價(jià)行為特征。因?yàn)槿魪母?jìng)買(mǎi)者個(gè)人角度出發(fā),單一競(jìng)買(mǎi)者在整場(chǎng)拍賣(mài)中的出價(jià)數(shù)據(jù)具有稀疏性和不等間隔分布性,無(wú)法通過(guò)插值或修勻來(lái)獲得平滑的出價(jià)軌跡,造成大量的稀疏序列被人為剔除,得到的研究結(jié)論并不嚴(yán)謹(jǐn),如何分析稀疏且不等間隔時(shí)間分布的出價(jià)序列為函數(shù)性數(shù)據(jù)研究帶來(lái)了挑戰(zhàn)。endprint
單個(gè)競(jìng)買(mǎi)者的一次出價(jià)序列實(shí)際上是一條潛在連續(xù)出價(jià)軌跡中的部分點(diǎn),對(duì)應(yīng)著一個(gè)隨機(jī)過(guò)程的實(shí)現(xiàn),反映了競(jìng)買(mǎi)者的出價(jià)行為變化。本文從隨機(jī)過(guò)程角度利用R軟件和MATLAB編寫(xiě)程序,運(yùn)用函數(shù)性稀疏數(shù)據(jù)聚類(lèi)分析方法對(duì)從淘寶網(wǎng)多物品拍賣(mài)中的競(jìng)買(mǎi)者出價(jià)軌跡進(jìn)行聚類(lèi),并結(jié)合不同類(lèi)中競(jìng)買(mǎi)者在整個(gè)拍賣(mài)期間的出價(jià)金額、出價(jià)時(shí)間、相平面圖以及最終獲勝情況刻畫(huà)我國(guó)網(wǎng)上拍賣(mài)競(jìng)買(mǎi)者的出價(jià)行為特征,試圖尋求不同類(lèi)競(jìng)買(mǎi)者出價(jià)行為的差異與共性,這對(duì)提高競(jìng)買(mǎi)者出價(jià)效率、減少盲從出價(jià)以及完善拍賣(mài)網(wǎng)站交易規(guī)則設(shè)計(jì)具有重要意義。二、 函數(shù)性稀疏數(shù)據(jù)聚類(lèi)分析方法
聚類(lèi)分析的目的是將目標(biāo)對(duì)象分類(lèi),使得同一類(lèi)對(duì)象的相似性大于類(lèi)與類(lèi)之間的相似性。因此,首先需要確定如何度量對(duì)象之間的相似性或相異性。與經(jīng)典多元統(tǒng)計(jì)中的聚類(lèi)分析類(lèi)似,函數(shù)性聚類(lèi)分析的首要工作同樣通過(guò)定義距離來(lái)獲得相異性矩陣,一旦構(gòu)建了一個(gè)合理的距離,我們就可以根據(jù)該距離矩陣對(duì)目標(biāo)對(duì)象進(jìn)行聚類(lèi)。但是由于拍賣(mài)出價(jià)數(shù)據(jù)到來(lái)時(shí)間的不等間隔性以及稀疏性,我們考慮采用基于真實(shí)出價(jià)序列的條件期望距離來(lái)反映不同出價(jià)軌跡間差異。
(一)模型設(shè)定
設(shè)實(shí)際觀測(cè)到的出價(jià)數(shù)據(jù){yil:1≤l≤ni;1≤i≤N}(ni通常很小)是函數(shù){xi(t):t∈T;1≤i≤N}在t=til處的觀測(cè)值。由于觀測(cè)數(shù)據(jù)往往帶有觀測(cè)誤差,因此函數(shù)性數(shù)據(jù)分析的基本統(tǒng)計(jì)模型為:
yil=xi(til)+εil1≤l≤ni,1≤i≤N(1)
其中εil為第i個(gè)競(jìng)買(mǎi)者的第l次觀測(cè)的隨機(jī)誤差,E(εil)=0,var(εil)=σ2。
xi(t)(i=1,2,…,N)為定義在閉區(qū)間[a,b]上的平方可積隨機(jī)過(guò)程{x(t),t∈T}的N次實(shí)現(xiàn),則存在半正定核C(·,·)滿足cov(x(s),x(t))=C(s,t)。于是,利用核C(·,·)的特征函數(shù)可得到xi(t)的擴(kuò)展式:
xi(t)=μ(t)+∑∞k=1zikθk(t)(2)
其中μ(t)為x(t)的均值函數(shù);{zik,k≥1}的均值為0,方差為λk且不相關(guān),λ1≥λ2≥…≥0是核C(·,·)的特征值且∑∞k=1λk<∞;θ(·)為特征值對(duì)應(yīng)的正交特征函數(shù)。
則模型(1)可以看作是由隨機(jī)過(guò)程x(t)的稀有帶噪音的實(shí)現(xiàn)構(gòu)成,即真實(shí)出價(jià)軌跡可用平滑出價(jià)軌跡附加擾動(dòng)項(xiàng)的形式來(lái)表示。此類(lèi)稀疏數(shù)據(jù)的相異性可采用L2距離進(jìn)行度量。令
D(i,j)=∫ba(xi(t)-xj(t)2dt)1/2
考慮到單一競(jìng)買(mǎi)者出價(jià)觀測(cè)時(shí)點(diǎn)的稀疏且不規(guī)律性,上式難以計(jì)算。設(shè)Yi=(yi1,yi2,…,yini)′,Yj=(yj1,yj2,…,yjnj)′,得到基于已知的觀測(cè)到的真實(shí)稀疏數(shù)據(jù)序列Yi和Yj的條件期望距離:
(i,j)={E[D(i,j)2Yi,Yj]}1/2
1≤i,j≤N
將式(2)代入上式可得:
2(i,j)=E∑∞k=1(zik-zjk)2Yi,Yj
則對(duì)任意正整數(shù)K,(i,j)有如下截?cái)嘈问?/p>
(K)(i,j)=E∑Kk=1(zik-zjk)2Yi,Yj1/2=
∑Kk=1var(zikYi)+var(zjkYj)+
[E(zikYi)-E(zjkYj)]21/2(3)
可知
E[(K)(i,j)2]=∑Kk=12λk=E[D(K)(i,j)2]
即(m)(i,j)2是所需估計(jì)平方L2距離的無(wú)偏估計(jì)量,這樣一來(lái),可通過(guò)估計(jì)條件期望距離得到對(duì)不同競(jìng)買(mǎi)者出價(jià)軌跡相異性的度量。
(二)參數(shù)估計(jì)
由上述分析可知,條件期望距離可通過(guò)求解E(zikYi)和var(zikYi)獲得。下面我們將說(shuō)明如何估計(jì)截?cái)嘈问降模↘)(i,j)。對(duì)于任意的正整數(shù)K≥1,在1≤i≤N、1≤k≤K下,設(shè)Λ(K)為對(duì)角線上元素為(λ1,…,λK)的K×K階對(duì)角矩陣。μi=(μ(ti1),…,μ(tini))′和Z(K)i=(zi1,…,ziK)′分別為x(t)的均值函數(shù)和特征值函數(shù)組成的向量,θik=(θk(ti1),…,θk(tini))′為x(t)特征函數(shù)組成的向量且Θ(K)i=(θi1,…,θiK)。為方便后續(xù)研究,假設(shè)xi、yi均為正態(tài)隨機(jī)過(guò)程,即zik~N(0,λk),εij~i.i.dN(0,σ2),則Yi~N(μi,ΣYi),Z(K)i~N(0,Λ(K)),其中ΣYi=cov(Yi,Yi)。又cov(Z(K)i,Yi)=E(Z(K)iYi)=Λ(K)(Θ(K)i)′,則Yi和Z(K)i的聯(lián)合分布[11]為:
Yi
ZKi~Nμi
0,ΣYi,Θ(K)iΛ(K)
Λ(K)(Θ(K)i)′,Λ(K)
可知:
E(Z(K)iYi)=Λ(K)(Θ(K)i)′Σ-1Yi(Yi-μi)(4)
var(Z(K)iYi)=Λ(K)-Λ(K)(Θ(K)i)′Σ-1YiΘ(K)iΛ(K)(5)
將式(4)、(5)分別帶入式(3)可得:
((K)(i,j))2=
tr[Λ(K)-Λ(K)(Θ(K)i)′Σ-1YiΘ(K)iΛ(K)]+
tr[Λ(K)-Λ(K)(Θ(K)j)′Σ-1YjΘ(K)jΛ(K)]+
[tr(Λ(K)(Θ(K)i)′Σ-1Yi(Yi-μi))-
tr(Λ(K)(Θ(K)j)′Σ-1Yj(Yj-μj))]2
這樣,通過(guò)估計(jì)出價(jià)軌跡Yi的均值曲線μ(·)、協(xié)方差函數(shù)的前K個(gè)特征值{λk,k=1,…,K}所對(duì)應(yīng)的特征函數(shù){θk,k=1,…,K}以及誤差方差σ2可獲得條件期望距離。endprint
在獲得反映不同競(jìng)買(mǎi)者出價(jià)軌跡間差異的距離矩陣后,便可對(duì)距離矩陣應(yīng)用聚類(lèi)法分類(lèi)。在確定合理分類(lèi)數(shù)目時(shí),我們通過(guò)計(jì)算不同分類(lèi)數(shù)下的SSE值和輪廓系數(shù)[12](Silhouette Coefficient),最終區(qū)別出四類(lèi)明顯的競(jìng)買(mǎi)者出價(jià)行為,并應(yīng)用多維尺度變換分析(MDS)將原距離矩陣映射到二維空間,使分類(lèi)后的結(jié)果可視化。三、 基于稀疏函數(shù)性聚類(lèi)方法的競(jìng)買(mǎi)者
出價(jià)行為的實(shí)證分析目前國(guó)內(nèi)較大的拍賣(mài)網(wǎng)站有淘寶拍賣(mài)會(huì)、嘉德在線、淮海在線等,均以藝術(shù)品拍賣(mài)為主。與普通商品相比,藝術(shù)品交易頻率低、市場(chǎng)流動(dòng)性差、價(jià)格波動(dòng)較大,通過(guò)拍賣(mài)確定藝術(shù)品價(jià)格是一種十分普遍且有效的定價(jià)方式。在數(shù)據(jù)搜集階段發(fā)現(xiàn),嘉德在線、淮海在線等網(wǎng)站的拍賣(mài)品多為價(jià)格波動(dòng)大的私人書(shū)畫(huà)作品且日均出價(jià)數(shù)較少。而eBay為了增加競(jìng)拍的激烈程度,現(xiàn)僅提供拍賣(mài)實(shí)時(shí)報(bào)價(jià)折線圖,并沒(méi)有確切的出價(jià)時(shí)間,也無(wú)法在拍賣(mài)結(jié)束后獲得競(jìng)拍歷史數(shù)據(jù)。淘寶拍賣(mài)會(huì)則全部采用多物品同時(shí)競(jìng)拍模式(拍賣(mài)專(zhuān)場(chǎng)),競(jìng)拍時(shí)間限定在一天之內(nèi),競(jìng)買(mǎi)者可同時(shí)參與競(jìng)拍多件物品,全年的歷史拍賣(mài)數(shù)據(jù)均可獲得?;诖耍紤]到數(shù)據(jù)的可獲得性和真實(shí)穩(wěn)定性,本文利用爬蟲(chóng)軟件搜集到淘寶拍賣(mài)會(huì)2015年第三季度(7月至9月)紫砂壺拍賣(mài)專(zhuān)場(chǎng)的全部出價(jià)數(shù)據(jù)。拍賣(mài)方式為英式拍賣(mài),共計(jì)223件拍品。由于存在延遲出價(jià)機(jī)制,平均拍賣(mài)時(shí)長(zhǎng)為12小時(shí)53分,起拍時(shí)間均為上午10時(shí)。此外,網(wǎng)站還提供代理出價(jià)選項(xiàng)幫助競(jìng)買(mǎi)者參與競(jìng)拍。
在剔除異常值后得到1134位競(jìng)買(mǎi)者參與的223件拍品的1978條出價(jià)軌跡,共計(jì)出價(jià)次數(shù)13726次。從出價(jià)次數(shù)頻率圖1可以看到, 20%的競(jìng)買(mǎi)者出價(jià)僅為一次出價(jià),大多數(shù)競(jìng)買(mǎi)者在一場(chǎng)拍賣(mài)中的出價(jià)次數(shù)為一至四次,占全部出價(jià)次數(shù)的50%以上,說(shuō)明大多數(shù)競(jìng)買(mǎi)者的出價(jià)時(shí)間分布稀疏且不規(guī)律。圖2為所有競(jìng)買(mǎi)者的出價(jià)軌跡圖,其中粗線代表平均出價(jià)軌跡。觀察圖2可知,一部分競(jìng)買(mǎi)者并沒(méi)有在整個(gè)拍賣(mài)期間持續(xù)出價(jià),而是在拍賣(mài)
末期形成了類(lèi)似“小線段”的出價(jià)軌跡,這也同樣證實(shí)了拍賣(mài)出價(jià)數(shù)據(jù)到來(lái)時(shí)間的稀疏性和不規(guī)律性。
在剔除設(shè)定起拍價(jià)的競(jìng)買(mǎi)者出價(jià)后,通過(guò)R軟件編程估計(jì)出真實(shí)出價(jià)軌跡Yi的均值曲線、協(xié)方差平面以及誤差方差。在估計(jì)條件距離時(shí),本文選擇協(xié)方差核函數(shù)的前十個(gè)特征值,占到隨機(jī)軌跡總變差的9128%。在得到距離矩陣后,運(yùn)用MATLAB中的mdscle函數(shù)對(duì)距離矩陣進(jìn)行多維尺度分析,將原距離矩陣映射到2維空間中①。在選擇聚類(lèi)數(shù)時(shí),運(yùn)用MATLAB編程計(jì)算2到8類(lèi)下的輪廓系數(shù),得到圖3并選擇聚類(lèi)數(shù)下較大的輪廓系數(shù),確定將競(jìng)買(mǎi)者分為四類(lèi)②。最后運(yùn)用Kmeans聚類(lèi)法對(duì)距離矩陣進(jìn)行聚類(lèi),得到四類(lèi)競(jìng)買(mǎi)者的二維空間匹配圖4。
為了便于觀察,分別用“A”“B”“C”“D”代表第一類(lèi)至第四類(lèi)競(jìng)買(mǎi)者,并繪制四類(lèi)競(jìng)買(mǎi)者的出價(jià)軌跡圖5以及平均出價(jià)軌跡圖6。根據(jù)平均出價(jià)軌跡
①mdscale函數(shù)提供了四種度量擬合準(zhǔn)側(cè),僅在sammon準(zhǔn)則下stress值達(dá)到最小且小于10%(0.0748),達(dá)到克魯斯卡爾提出的經(jīng)驗(yàn)標(biāo)準(zhǔn)(≤10%),說(shuō)明模型對(duì)數(shù)據(jù)的擬合程度為滿意(Fair)。
②輪廓系數(shù)(Silhouette Coefficient)結(jié)合了聚類(lèi)的凝聚度(Cohesion)和分離度(Separation),用于評(píng)估聚類(lèi)的效果。該值處于-1~1之間,值越大,表示聚類(lèi)效果越好。由輪廓系數(shù)圖可知,當(dāng)K=4時(shí)輪廓系數(shù)最大,故將競(jìng)買(mǎi)者出價(jià)分為四類(lèi)。圖4四類(lèi)競(jìng)買(mǎi)者的二維空間匹配圖
得到四類(lèi)競(jìng)買(mǎi)者的平均出價(jià)相平面圖7, 用字母a至l標(biāo)記競(jìng)拍時(shí)間(12個(gè)小時(shí)),反映每類(lèi)競(jìng)買(mǎi)者在整個(gè)拍賣(mài)期間的出價(jià)變化情況。此外,本文還分別繪制了各類(lèi)競(jìng)買(mǎi)者的出價(jià)時(shí)間頻率圖8以及出價(jià)金額頻率圖9。最后,總結(jié)不同類(lèi)競(jìng)買(mǎi)者的基本出價(jià)情況,主要包括出價(jià)軌跡數(shù)、出價(jià)時(shí)間范圍、出價(jià)金額范圍、平均獲勝金額以及獲勝人數(shù),如表1所示。
四、 競(jìng)買(mǎi)者出價(jià)行為特征的聚類(lèi)分析
通常情況下,一場(chǎng)拍賣(mài)的早期和晚期會(huì)比中期吸引更多的競(jìng)買(mǎi)者參與。在拍賣(mài)末期的瘋狂出價(jià)被稱(chēng)為拍賣(mài)狙擊,是由競(jìng)買(mǎi)者強(qiáng)烈希望贏得拍品所產(chǎn)生的。除了希望贏得拍品,一些競(jìng)買(mǎi)者參與競(jìng)拍的主要目的是希望以盡可能低的出價(jià)贏得拍品。對(duì)競(jìng)買(mǎi)者出價(jià)軌跡進(jìn)行分類(lèi)就可以區(qū)別不同類(lèi)競(jìng)買(mǎi)者的出價(jià)行為特征、鑒別不同的出價(jià)策略,研究不同出價(jià)策略的有效性,探討競(jìng)買(mǎi)者參與競(jìng)拍的目的是最大可能贏得物品還是以最合理的低價(jià)拍得物品。所以,在得到全部競(jìng)買(mǎi)者出價(jià)行為的四個(gè)分類(lèi)后,從獲勝概率切入,結(jié)合出價(jià)時(shí)間、出價(jià)金額、平均出價(jià)相平面圖分別對(duì)各類(lèi)競(jìng)買(mǎi)者進(jìn)行描述,希望尋求不同類(lèi)競(jìng)買(mǎi)者出價(jià)行為之間的差異與共性。
由獲勝概率可知,第二類(lèi)競(jìng)買(mǎi)者獲勝概率最高,其次為第四類(lèi)競(jìng)買(mǎi)者,隨后是第一類(lèi)競(jìng)買(mǎi)者,獲勝概率最低的是第三類(lèi)競(jìng)買(mǎi)者。第二類(lèi)競(jìng)買(mǎi)者參與競(jìng)拍時(shí)間最長(zhǎng),但很少會(huì)選擇在拍賣(mài)前期就出價(jià)競(jìng)拍,他們往往會(huì)先熟悉拍品并觀察其他競(jìng)買(mǎi)者的出價(jià)行為,所以該類(lèi)競(jìng)買(mǎi)者多偏好在拍賣(mài)中后期出價(jià),且出價(jià)金額并不高,多集中在[0-3000]元的低檔,并不會(huì)為了贏得物品而在拍賣(mài)后期盲目競(jìng)拍高價(jià),屬于有一定競(jìng)拍經(jīng)驗(yàn)的參與者。從其相平面圖看,該類(lèi)競(jìng)買(mǎi)者平均出價(jià)水平的一階導(dǎo)數(shù)和二階導(dǎo)數(shù)均大于絕對(duì)零點(diǎn),出價(jià)能量在拍賣(mài)中前期有遞減的趨勢(shì),但在拍賣(mài)中后期則逐漸遠(yuǎn)離絕對(duì)零點(diǎn),出價(jià)波動(dòng)在拍賣(mài)中后期最為劇烈。
第四類(lèi)競(jìng)買(mǎi)者與第二類(lèi)競(jìng)買(mǎi)者同樣偏愛(ài)在拍賣(mài)中后期出價(jià)。不同之處在于該類(lèi)競(jìng)買(mǎi)者會(huì)更多選擇在拍賣(mài)初期,尤其是拍賣(mài)末期參與競(jìng)拍,且平均出價(jià)金額在四類(lèi)中最高??梢?jiàn)該類(lèi)競(jìng)買(mǎi)者參與競(jìng)拍的目的不是以相對(duì)合理價(jià)格贏得拍品,而是以最大概率拍得物品,競(jìng)拍意愿強(qiáng)烈,以至于該類(lèi)競(jìng)拍者會(huì)在拍賣(mài)末期出現(xiàn)明顯的拍賣(mài)狙擊行為,從而擁有較高的獲勝概率,但最終成交價(jià)格會(huì)大幅攀升。同樣從相平面圖來(lái)看,該類(lèi)競(jìng)買(mǎi)者平均出價(jià)水平的一階導(dǎo)數(shù)和二階導(dǎo)數(shù)在拍賣(mài)初期逐漸接近絕對(duì)零點(diǎn),而在拍賣(mài)后期末期的遠(yuǎn)離絕對(duì)零點(diǎn),并且出價(jià)能量在拍賣(mài)末期達(dá)到最大,說(shuō)明在整個(gè)拍賣(mài)期間出價(jià)水平變化隨著拍賣(mài)的進(jìn)行愈加劇烈并在拍賣(mài)末期達(dá)到最大,也表現(xiàn)出此類(lèi)競(jìng)買(mǎi)者具有明顯的拍賣(mài)狙擊特征。endprint
第一類(lèi)競(jìng)買(mǎi)者與第二類(lèi)競(jìng)買(mǎi)者所不同的是他們選擇在拍賣(mài)初期就積極參與競(jìng)拍,且出價(jià)次數(shù)在拍賣(mài)中后期達(dá)到頂峰。從相平面圖可以看出,該類(lèi)競(jìng)買(mǎi)者平均出價(jià)水平的一階導(dǎo)數(shù)和二階導(dǎo)數(shù)始終大于零且遠(yuǎn)離絕對(duì)零點(diǎn),說(shuō)明在整個(gè)拍賣(mài)期間出價(jià)能量持續(xù)增加,但從其出價(jià)時(shí)間可知,大多數(shù)該類(lèi)競(jìng)買(mǎi)者在拍賣(mài)末期會(huì)選擇放棄參與競(jìng)拍,且出價(jià)金額大多集中在[0-3000]低檔,獲勝概率并不高。
第三類(lèi)競(jìng)買(mǎi)者獲勝概率最低,出價(jià)金額多集中在[0-2000]元低檔。該類(lèi)競(jìng)買(mǎi)者出價(jià)時(shí)間較為平穩(wěn),在拍賣(mài)前中后期均參與競(jìng)拍,但在拍賣(mài)末期則較少參與競(jìng)拍。出價(jià)時(shí)間范圍與其他三類(lèi)相比最短,即參與競(jìng)拍時(shí)間晚而退出競(jìng)拍時(shí)間早,后期出價(jià)動(dòng)力不足,所以獲勝概率較低,獲勝意愿不強(qiáng)。從相平面圖來(lái)看,該類(lèi)競(jìng)買(mǎi)者則顯示出了與其他三類(lèi)競(jìng)買(mǎi)者的明顯不同,平均出價(jià)水平一階導(dǎo)數(shù)為正但二階導(dǎo)數(shù)始終小于零,導(dǎo)致其相平面圖隨著拍賣(mài)的進(jìn)行從反方向逐漸遠(yuǎn)離絕對(duì)零點(diǎn),說(shuō)明出價(jià)波動(dòng)在整個(gè)拍賣(mài)期間逐漸減弱。
通過(guò)對(duì)四類(lèi)競(jìng)買(mǎi)者出價(jià)行為特征比較不難發(fā)現(xiàn),從出價(jià)時(shí)間來(lái)看,四類(lèi)中大部分競(jìng)買(mǎi)者偏好在拍賣(mài)中后期以及末期出價(jià),其中獲勝概率最低的第三類(lèi)競(jìng)買(mǎi)者出價(jià)時(shí)間范圍最短,獲勝概率最高的第二類(lèi)競(jìng)買(mǎi)者出價(jià)時(shí)間范圍最長(zhǎng),全程參與競(jìng)拍。從平均出價(jià)金額來(lái)看,第四類(lèi)競(jìng)買(mǎi)者出價(jià)金額最高,而第二類(lèi)競(jìng)買(mǎi)者則擁有最低的平均出價(jià)金額。從平均出價(jià)相平面圖反映的出價(jià)波動(dòng)來(lái)看,僅第三類(lèi)競(jìng)買(mǎi)者的相平面圖在整個(gè)拍賣(mài)期間反方向逐漸遠(yuǎn)離絕對(duì)零點(diǎn),缺乏出價(jià)動(dòng)力,第四類(lèi)競(jìng)買(mǎi)者則在拍賣(mài)末期出價(jià)波動(dòng)達(dá)到最大,具有明顯的拍賣(mài)狙擊特征。綜合來(lái)看,第二類(lèi)競(jìng)買(mǎi)者以參與過(guò)類(lèi)似拍賣(mài)且熟悉競(jìng)拍物品的經(jīng)驗(yàn)豐富型競(jìng)買(mǎi)者為主,第一類(lèi)競(jìng)買(mǎi)者則大多是缺乏競(jìng)拍經(jīng)驗(yàn),或由于預(yù)算約束、時(shí)間約束等而選擇在拍賣(mài)末期放棄競(jìng)拍的初級(jí)競(jìng)買(mǎi)者,第四類(lèi)競(jìng)買(mǎi)者則是希望以最大概率贏得拍品為目的而較少考慮出價(jià)金額問(wèn)題的勢(shì)在必得型競(jìng)買(mǎi)者,第三類(lèi)競(jìng)買(mǎi)者則在整場(chǎng)拍賣(mài)中表現(xiàn)出出價(jià)動(dòng)力不足,屬于典型的圍觀型競(jìng)買(mǎi)者。五、 結(jié)論與進(jìn)一步討論
一直以來(lái),網(wǎng)上拍賣(mài)中出價(jià)行為分析多從拍品角度出發(fā),單一競(jìng)買(mǎi)者出價(jià)數(shù)據(jù)時(shí)間的不規(guī)則性和稀疏性為從個(gè)人角度研究競(jìng)買(mǎi)者出價(jià)行為特征帶來(lái)困難。本文利用基于函數(shù)性稀疏數(shù)據(jù)的聚類(lèi)方法,構(gòu)建了條件期望距離的相異性矩陣反映競(jìng)買(mǎi)者出價(jià)軌跡間差異,并運(yùn)用多維尺度分析、Kmeans聚類(lèi)、相平面圖分析方法,結(jié)合整個(gè)拍賣(mài)期間競(jìng)買(mǎi)者出價(jià)金額、出價(jià)時(shí)間變化以及獲勝概率綜合分析不同競(jìng)買(mǎi)者出價(jià)行為特征。研究結(jié)果表明:通過(guò)競(jìng)買(mǎi)者的出價(jià)軌跡聚類(lèi)可將競(jìng)買(mǎi)者分為顯著的四類(lèi),分別是經(jīng)驗(yàn)豐富型競(jìng)買(mǎi)者、缺乏經(jīng)驗(yàn)型初級(jí)競(jìng)買(mǎi)者、勢(shì)在必得型競(jìng)買(mǎi)者以及圍觀型競(jìng)買(mǎi)者。其中,經(jīng)驗(yàn)豐富型競(jìng)買(mǎi)者獲勝概率最高,勢(shì)在必得型競(jìng)買(mǎi)者獲勝概率次之,但平均獲勝出價(jià)金額最高,圍觀型競(jìng)買(mǎi)者由于獲勝意愿不強(qiáng)烈且參與競(jìng)拍時(shí)間較短而獲勝概率最低,缺乏經(jīng)驗(yàn)型競(jìng)買(mǎi)者放棄參與競(jìng)拍太早而導(dǎo)致獲勝概率較低。
Bapna[5]按進(jìn)入拍賣(mài)時(shí)間、退出拍賣(mài)時(shí)間以及出價(jià)金額將競(jìng)買(mǎi)者劃分為早出價(jià)者(Early Evaluators)、中期出價(jià)者(Middle Evaluators)、機(jī)會(huì)主義者(opportunists)、全程參與出價(jià)者(Participators)以及淺嘗輒止者(SipandDippers)五類(lèi)。其中,全程參與者以及機(jī)會(huì)主義者出價(jià)特征與本文中的圍觀型競(jìng)買(mǎi)者以及勢(shì)在必得型競(jìng)買(mǎi)者相似。與Bapna不同的是,本文結(jié)合出價(jià)金額以及出價(jià)時(shí)間在整個(gè)拍賣(mài)期間的變化情況對(duì)競(jìng)買(mǎi)者出價(jià)行為特征進(jìn)行分類(lèi),識(shí)別出經(jīng)驗(yàn)豐富型競(jìng)買(mǎi)者以及初級(jí)競(jìng)買(mǎi)者,但未能識(shí)別出同樣擁有較高獲勝概率的淺嘗輒止者,如何更加精確地對(duì)競(jìng)買(mǎi)者出價(jià)特征進(jìn)行劃分是本文未來(lái)的研究方向。此外,由于網(wǎng)上拍賣(mài)用戶匿名的特性, 多數(shù)拍賣(mài)網(wǎng)站為保護(hù)用戶隱私并不會(huì)選擇將用戶的真實(shí)身份公布, 為合謀出價(jià)創(chuàng)造了有利條件, 合謀欺詐出價(jià)(shill bidding)涌現(xiàn)且得不到有效抑制。一方面, 賣(mài)家通過(guò)注冊(cè)虛假賬號(hào)參與拍賣(mài), 操縱出價(jià)使得最終成交價(jià)格遠(yuǎn)遠(yuǎn)高于合理價(jià)位, 侵蝕消費(fèi)者剩余, 造成拍賣(mài)效率低下;另一方面, 第三方網(wǎng)絡(luò)拍賣(mài)平臺(tái)的主要收入來(lái)源仍是按照賣(mài)家拍品的最終成交價(jià)格向賣(mài)家收取一定比例傭金, 所以網(wǎng)站管理者并無(wú)決心清除虛假出價(jià)的動(dòng)力。如何制定更加有效的拍賣(mài)制度, 規(guī)范、保障拍賣(mài)各方參與者的行為和權(quán)益成為急需考慮的問(wèn)題。在合謀欺詐出價(jià)下, 競(jìng)買(mǎi)者的最優(yōu)出價(jià)策略將發(fā)生怎樣的變化, 如何運(yùn)用函數(shù)性聚類(lèi)方法識(shí)別競(jìng)買(mǎi)者中的合謀出價(jià)者并分析合謀出價(jià)對(duì)競(jìng)買(mǎi)者消費(fèi)者剩余影響等問(wèn)題也同樣值得思考。參考文獻(xiàn):
[1]Vickrey W. Counter speculation, auctions, and competitive sealed tenders [J]. The Journal of Finance, 1961, 16(1): 837.
[2]Marshall R C, Meurer M J, Richard J F, et al. Numerical analysis of asymmetric first price auctions [J]. Games and Economic Behavior, 1994, 7(2): 193220.
[3]Maskin E, Riley J. Asymmetric auctions [J]. The Review of Economic Studies, 2000, 67(3): 413438.
[4]Hayne S, Smith C, Vijayasarathy L. Predicting sniping in eBay auctions [C]. INFORMS Conference, 2002.
[5]Bapna R, Goes P, Gupta A, et al. User heterogeneity and its impact on electronic auction market design: An empirical exploration [J]. Mis Quarterly, 2004, 28(1): 2143.
[6]Ramsay J O, Silverman B W. Applied functional data analysis: methods and case studies [M]. New York: Springer, 2002.
[7]Shmueli G, Jank W. Visualizing online auctions [J]. Journal of Computational and Graphical Statistics, 2005, 14(2): 299319.
[8]Shmueli G, Russo R P, Jank W. The BARISTA: a model for bid arrivals in online auctions [J]. The Annals of Applied Statistics, 2007, 1(2): 412441.
[9]Jank W, Shmueli G. Studying heterogeneity of price evolution in eBay auctions via functional clustering [M]∥Bernus P, Baz·ewicz J, Schmidt G J, Shaw M J. Handbook of Information Systems Series: Business Computing, New York: Springer International Publishing, 2009: 237261.
[10]嚴(yán)明義, 程詩(shī)有. 網(wǎng)上拍賣(mài)品的價(jià)格層級(jí)與類(lèi)別對(duì)買(mǎi)方出價(jià)行為的影響——基于函數(shù)性數(shù)據(jù)聚類(lèi)方法的分析 [J]. 當(dāng)代經(jīng)濟(jì)科學(xué), 2015, 37(1): 110115.
[11]Mardia K V, Kent J T, Bibby J M. Multivariate analysis [M]. San Diego: Academic Press Inc., 1980.
[12]陳封能, 斯坦巴赫, 庫(kù)瑪爾. 數(shù)據(jù)挖掘?qū)д?[M]. 范明, 等譯. 北京: 人民郵電出版社, 2011.
責(zé)任編輯、 校對(duì): 李再揚(yáng)endprint