翁翕 尹訓東 許敏波
很多提供新產(chǎn)品和新服務(wù)的企業(yè)采取的定價策略是初始時以低價格或者變相的價格優(yōu)惠來吸引消費者,這種低價格通常會在持續(xù)一段時間以后最終轉(zhuǎn)向一個高價格。比如最近廣受關(guān)注的滴滴打車價格問題,滴滴公司在起步階段,為了吸引私家車、出租車和消費者使用自己的打車軟件,通過對私家車和出租車的大量補貼來吸引消費者,消費者在低價格的吸引下嘗試使用該軟件,這種低價格會持續(xù)一段時間讓更多的消費者獲得消費體驗?,F(xiàn)在滴滴公司逐步放棄了這種優(yōu)惠補貼,相當于取消低價格轉(zhuǎn)而實行高價格*以北京為例,2015年6月滴滴順風車上線時,收費標準為起步10元,每公里1元。2015年9月,北京地區(qū)順風車起步10元,每公里1.3元。2016年8月底,起步費調(diào)整為3公里之內(nèi)12元,之后每公里1.5元。。
本文建立了一個有連續(xù)統(tǒng)消費者的新體驗產(chǎn)品的壟斷動態(tài)定價模型來研究新產(chǎn)品的最優(yōu)定價策略。我們的分析表明上述先低價后高價的定價策略符合最優(yōu)動態(tài)定價模型的預(yù)測,同時我們也證明了,相較于社會福利最優(yōu)的定價策略,這種壟斷者追求利潤最大化的均衡定價所實行的低價格時間過短,過早地實行高價格會造成社會福利損失。除了滴滴公司的例子,還有很多提供新服務(wù)和新產(chǎn)品的廠商也采取了類似的價格策略,最初利用低價吸引消費者,一段時間后再提高價格。比如團購剛興起時團購網(wǎng)站的價格優(yōu)惠,小區(qū)內(nèi)新建的超市和理發(fā)店等等。雖然有些企業(yè)并不是嚴格意義上的壟斷企業(yè),但他們都在一定程度上有擁有市場的力量。我們構(gòu)建的壟斷動態(tài)定價的理論框架,有助于幫助理解這些企業(yè)的定價模式,并對政府選擇合適的產(chǎn)業(yè)政策以促進社會福利提供理論依據(jù)。
本文關(guān)注的是新體驗品,也即消費者和壟斷廠商都不知道該產(chǎn)品能給消費者帶來多大效用,每個消費者需要通過體驗后才能發(fā)現(xiàn)自己是否和新產(chǎn)品匹配。在每個時間點,消費者都可以選擇是體驗新產(chǎn)品還是無風險產(chǎn)品(或常規(guī)產(chǎn)品)。消費者體驗新產(chǎn)品后所獲取的收益(或效用)有不確定性,獲取了正收益的消費者知道該新產(chǎn)品是值得再次消費的,其選擇再次消費的意愿將提高。而初始體驗沒有獲取正收益的消費者會更新自己對于新產(chǎn)品的信念,更可能認為該新產(chǎn)品和自己不匹配,因此再次消費的意愿將降低。我們假設(shè)該壟斷廠商不能觀測到每個消費者的體驗結(jié)果因而無法實行價格歧視,為了繼續(xù)吸引第一次體驗未得到正收益的消費者,廠商將進一步壓低價格(因為體驗失敗的消費者的體驗意愿降低)。此時第一次體驗成功的消費者將從該低價格中獲取較高的收益。這種動態(tài)定價模式將持續(xù)一段時間,即壟斷者的定價將不斷降低。隨著越來越多的消費者體驗成功,對于廠商而言,不斷降低價格的好處越來越少,而其代價越來越高(越來越多體驗成功的消費者享受低的體驗價格),我們證明存在一個臨界點,使得壟斷者選擇放棄掉體驗失敗的消費者,轉(zhuǎn)而對所有體驗成功的消費者收取一個高的壟斷價格。
如上所述,壟斷廠商的均衡動態(tài)定價是從一個低價格開始,并在此之后的一段時間內(nèi)不斷降低該價格,當達到一個臨界點之后,突然提高價格,該高價格只有體驗成功的消費者才會支付,一直體驗不成功的消費者將被逐出市場。這就是壟斷廠商的最優(yōu)動態(tài)定價模式。如果從社會福利最大化的角度考慮,則存在社會最優(yōu)效率的定價模式。兩者相比較,我們發(fā)現(xiàn)壟斷廠商會過早地停止低價格,從而轉(zhuǎn)向一個高價格而放棄掉體驗失敗的消費者,這會造成社會福利的損失。因而從政府規(guī)制的角度看,為了達到社會最優(yōu),應(yīng)該對壟斷廠商起初的低價格進行補貼,以延長低價格吸引消費者的時間從而提高社會福利。當壟斷者提高價格后,政府可以對壟斷高價進行征稅,既可以糾正壟斷造成的無謂損失,同時又可以支付前期的補貼,精心設(shè)計的稅制和補貼在某種程度上可以達到總預(yù)算平衡。
本文理論上的貢獻在于彌補了文獻中對于消費者數(shù)量是連續(xù)統(tǒng)時,壟斷者對新產(chǎn)品的動態(tài)均衡定價過程的研究。我們發(fā)現(xiàn)當消費者數(shù)量是連續(xù)統(tǒng)時,均衡的停止低價格的臨界值取決于消費者對新產(chǎn)品是否適合自己的先驗概率。這與當消費者數(shù)量是有限個時的結(jié)論(比如Bergemann and V?lim?ki, 1996, 2000;Weng, 2015a)迥然不同,那里均衡的停止低價格的臨界值不取決于消費者對新產(chǎn)品是否和自己匹配的先驗概率。我們在解出了均衡的動態(tài)定價之后,還對停止低價格時信念的臨界值作了比較靜態(tài)分析,其中需要特別指出的是,消費者對新產(chǎn)品與自己匹配的先驗概率越高,壟斷者收取的價格越高,但同時該先驗概率越高,壟斷者實行低價格的信念臨界值越高,從而相較于社會最優(yōu)解來說,所損失的效率就越大。因此,消費者認為新產(chǎn)品符合自己需求的概率越大,由于壟斷者過早地結(jié)束低價格所帶來的社會效率損失就越大。
本文除了在理論上解決了消費者數(shù)量是連續(xù)統(tǒng)情況下壟斷者對新產(chǎn)品的均衡定價問題,同時也能幫助我們更深入地理解當今經(jīng)濟中越來越多的新產(chǎn)品的定價行為,并對由此造成的潛在社會損失作出分析,從而為政府規(guī)制壟斷廠商新產(chǎn)品的動態(tài)定價提出政策建議。隨著經(jīng)濟中創(chuàng)新和創(chuàng)業(yè)的不斷發(fā)展,會源源不斷地涌現(xiàn)出新的產(chǎn)品和服務(wù)形式(比如最近興起的共享單車),這些新產(chǎn)品和新服務(wù)必定在最開始的時候擁有相當大的壟斷勢力,在人們享受初始很低的體驗價格時,人們也要預(yù)計到在不遠的將來壟斷者將會實行的壟斷高價。本文的分析有助于理解決定這種低體驗價格的因素,并給出了低價格的動態(tài)演化方程,以及低價格運行的時間,并證明了這種動態(tài)均衡定價所蘊含的社會損失以及政府規(guī)制改善壟斷均衡定價的空間。
本文的結(jié)構(gòu)如下,第1部分梳理相關(guān)理論的文獻,第2部分是模型設(shè)定和求解,第3部分是對均衡的分析,包括對均衡臨界信念值的比較靜態(tài)分析,最后一部分是結(jié)論。
新體驗品的動態(tài)定價問題是產(chǎn)業(yè)經(jīng)濟學中重要前沿研究領(lǐng)域之一。該種商品與普通產(chǎn)品的不同之處在于買家需要通過自己的不斷體驗才能確知產(chǎn)品的價值,而體驗的結(jié)果又是不確定的,導致賣家需要隨著買家的體驗結(jié)果動態(tài)調(diào)整價格。文獻中對新體驗品的動態(tài)定價問題研究起始于Bergemann and V?lim?ki對寡頭市場中體驗品動態(tài)定價的一系列研究(Bergemann and V?lim?ki, 1996, 2000)。這類模型一般假設(shè)雖然消費者不確切知道新體驗品帶來的效用,但期望效用滿足共同價值(common value)假設(shè),也即所有消費者的期望效用是相同的。消費者在共同價值假設(shè)下可以進行社會學習(social learning),也就是從其他人的體驗中獲取新體驗品的信息。研究發(fā)現(xiàn),學習速度快的企業(yè)相比于學習速度慢的企業(yè)能獲得額外的競爭性優(yōu)勢,因此最后的均衡沒有實現(xiàn)社會最優(yōu)效率,而且相比于社會最優(yōu),均衡時消費者會更多地體驗學習速度快的產(chǎn)品(Eeckhout and Weng, 2015)。
本文與上述模型假設(shè)最大的不同之處在于摒棄共同價值假設(shè),每個消費者從商品中獲得的價值都是不同的,因而消費者只能通過個體學習來獲取新體驗品的信息。在相關(guān)文獻中,Bergemann and V?lim?ki (2006)以及Weng (2015a)都研究了個體學習下最優(yōu)的壟斷者動態(tài)定價問題。Bergemann and V?lim?ki (2006)研究的也是一個連續(xù)統(tǒng)消費者問題,但消費者的學習過程被大大簡化:消費者體驗之后要么完全認知到體驗品的價值,要么還是一無所知。最后作者發(fā)現(xiàn)在不同參數(shù)條件下,可能會出現(xiàn)niche market,即最后均衡價格會轉(zhuǎn)向一個高價格;或者會出現(xiàn)mass market,即最后均衡價格會一直下降。本文采用了文獻中常用的指數(shù)學習模型(exponential bandit),并發(fā)現(xiàn)最后的動態(tài)定價均衡總是Bergemann and V?lim?ki (2006)中的niche market。但我們更關(guān)注分析在這樣的市場中,均衡價格何時會轉(zhuǎn)向一個高價格,以及對社會福利的影響。
Weng (2015a)考慮的則是在指數(shù)學習模型下有限多個消費者時的最優(yōu)動態(tài)定價問題。傳統(tǒng)理論認為社會學習時的動態(tài)決策是無效的,而個體學習時的動態(tài)決策是有效的。因為在社會學習的情形下,消費者有搭便車的動機,他們總是希望別人付出成本去體驗新產(chǎn)品,而自己可以坐享其成。Weng (2015a)的理論貢獻在于發(fā)現(xiàn),如果加入賣家的動態(tài)策略定價的話,上面的結(jié)果正好反轉(zhuǎn)。在社會學習的情形下,賣家的定價可以攫取所有的經(jīng)濟租,從而使得消費者沒有動機搭便車。在個體學習的情形下,消費者之間存在一種新的搭便車行為:買家可以通過短期背離獲取更有利的信念,因而獲得正的經(jīng)濟租。因此,個體學習時的動態(tài)定價反而變?yōu)闊o效的。本文把Weng (2015a)一文的分析擴展到連續(xù)統(tǒng)消費者的情形,對均衡價格的推導沿用了Weng (2015a)一文中“一次性背離”的思想,這里發(fā)現(xiàn)均衡結(jié)果依然是無效的,但兩文中的模型存在如下三點顯著差異:首先,Weng (2015a)的分析主要是基于兩個消費者的情形,隨著消費者人數(shù)上升均衡的刻畫會變得非常復雜,而本文利用連續(xù)統(tǒng)消費者的設(shè)定很好地解決了有限消費者模型難以推廣到更多消費者情形的問題。其次,本文利用連續(xù)統(tǒng)消費者情形下的精確大數(shù)定律(Sun, 2006),只需假設(shè)廠商能觀測到過去各個時間點購買了體驗產(chǎn)品的消費者總測度。與文獻中(比如Bergemann and V?lim?ki, 1996, 2000;Weng, 2015a)通常假設(shè)所有的歷史信息都是公開可觀測的相比,本文的假設(shè)條件更弱,也更加自然。最后,也是最重要的,Weng (2015a)一文中的均衡臨界信念取決于已有多少消費者獲得了好的體驗,但與初始信念無關(guān);而本文中的均衡臨界信念與已有多少消費者獲得了好的體驗無關(guān),但與初始信念有關(guān)。因此,本文關(guān)注的焦點問題是初始信念是如何影響均衡臨界信念的,而這個問題無法在Weng (2015a)一文中探討。
在建模思路上,本文采用的是文獻中常用的指數(shù)學習模型。該模型自從被Keller等 (2005)提出之后,被廣泛應(yīng)用于刻畫動態(tài)學習和創(chuàng)新過程(Bergemann and Hege, 2005; Bonatti and H?rner, 2011; Manso, 2011; H?rner and Samuelson, 2013; Weng, 2015b; Guo, 2016; Halac et al., 2016, 2017; 龔六堂等,2016)。但上述提到的模型都只考慮了有限數(shù)量的參與人,而本文把指數(shù)學習模型擴展到連續(xù)統(tǒng)消費者的情形,啟發(fā)未來的研究同樣可以考慮類似的擴展。
考慮一個連續(xù)時間模型,t∈[0,+∞),貼現(xiàn)率為r>0。壟斷廠商在市場上出售一個全新的風險產(chǎn)品,消費者的數(shù)量是個連續(xù)統(tǒng),記為i∈[0,1]。假設(shè)壟斷廠商和所有的消費者都是風險中性。該風險產(chǎn)品的生產(chǎn)成本標準化為零。[注]零成本假設(shè)是為了簡化分析采取的標準化處理。假設(shè)生產(chǎn)成本c>0與假設(shè)生產(chǎn)成本為零而無風險產(chǎn)品的流量回報為s′=s+c是等價的。在每個時間點上,每個消費者可以選擇從壟斷廠商那里購買一個單位的風險產(chǎn)品或者從外部購買一個單位的無風險產(chǎn)品。
如果消費者購買無風險產(chǎn)品,她將得到一個確定的流量回報s>0。[注]同時,也可以假設(shè)流量回報是隨機變量,服從一個已知的分布,期望為s>0。而風險產(chǎn)品帶來的回報是一個隨機的一次性的總額收益(lump-sum payoff)ξ>0。該回報ξ取決于風險產(chǎn)品和特定消費者i∈[0,1]之間的匹配質(zhì)量: 匹配(κi=1)或者不匹配(κi=0)。任意兩組消費者和風險產(chǎn)品之間的匹配質(zhì)量是相互獨立的。每個消費者i匹配質(zhì)量的先驗概率ρ0=Pr(κi=1)都相同。根據(jù)Sun (2006)的精確大數(shù)定律,ρ0可以近似地表示為匹配的消費者占全體消費者的比例。[注]Duffie and Sun (2012)提供了一個關(guān)于連續(xù)統(tǒng)參與者的模型的嚴格分析。
消費者通過個體學習的方式,即用自己的親身體驗來判斷該新產(chǎn)品是否適合自己,也即是否滿足κi=1。本文采用文獻中常用的指數(shù)學習模型(exponential bandit):如果消費者最初購買了風險產(chǎn)品,隨機的一次性總額收益ξ在消費者之間服從獨立的泊松分布。該分布對于消費者i的到達率為λκi,其中參數(shù)λ>0。如果產(chǎn)品與消費者匹配,消費者有可能獲得一次性收益;否則無法獲得一次性收益。當消費者從風險產(chǎn)品獲取一次性收益后,對自己與產(chǎn)品匹配的事后信念立即更新為1。令g=λξ,并且假設(shè)g>s,即如果消費者獲得了一次性收益,那么風險產(chǎn)品將占優(yōu)于無風險產(chǎn)品。所有的參與者(壟斷廠商和消費者)在初始時都無法觀察到產(chǎn)品的特征和匹配質(zhì)量,但參數(shù)λ、ξ和ρ0是已知的。假設(shè)每個消費者的歷史行為和結(jié)果都只有自己知道,而不能被其他參與者觀測到。這樣,廠商在每個時點上就只能觀測到購買了風險產(chǎn)品的消費者總測度。與文獻中(比如Bergemann and V?lim?ki, 1996, 2000;Weng, 2015a)通常假設(shè)所有的歷史信息都是公開可觀測的相比,本文的假設(shè)條件更弱,也更加自然。
在每個時間點t上,壟斷廠商首先基于以往的歷史宣布一個現(xiàn)價,然后每個消費者根據(jù)以往的歷史和該宣布的價格來決定購買何種產(chǎn)品。假設(shè)壟斷廠商既不能實行價格歧視,也不能承諾一個定價規(guī)則。
如果消費者從風險產(chǎn)品中獲取了一次性總額收益,那么她立即就會知道她與風險產(chǎn)品是匹配的。沒有獲取到一次性收益表明很可能是完全不匹配的。用ρi t來表示消費者i關(guān)于匹配質(zhì)量的事后信念。給定先驗概率ρ0,可以根據(jù)貝葉斯法則得到后驗概率ρi t。Keller等(2005)與Weng(2015a)證明,如果沒有獲得一次性收益,ρi t將遵循如下微分方程:
(1)
在接下來的分析中,我們把獲得一次性收益的消費者叫做“體驗成功”消費者,沒有獲得回報的消費者稱為“體驗失敗”消費者。
令Ni t表示消費者i在時間t之前獲得的一次性總額收益的總次數(shù)。令Pt表示壟斷廠商在時間t收取的價格,mt表示在時間t選擇購買風險品的消費者數(shù)量測度。如果消費者i在時間t購買風險產(chǎn)品,記為ai t=1;如果消費者i在時間t購買無風險產(chǎn)品,記為ai t=0。在我們的模型中,每個消費者i觀測到的歷史記為:
hi t?(aiτ,Niτ,Pτ)0≤τ 壟斷廠商觀測到的歷史為:hs t?(mτ,Pτ)0≤τ 在時間t,壟斷者的定價策略是從歷史hs t到價格Pt的一個映射,而每個消費者的購買決策是從她的歷史hi t和價格Pt到ai t的一個映射。和Weng(2015a)一樣,我們假設(shè)在沒有一次性收益時的購買決策ai t與定價決策Pt都是關(guān)于時間的右連續(xù)函數(shù),Weng(2015a)對該假設(shè)有詳細說明。在本文中,我們集中討論對稱均衡的情況,即在每個時間點,擁有相同后驗概率的消費者會做出相同的購買決策??紤]在任何合理的均衡中,壟斷者起初向所有消費者(包括體驗成功和體驗失敗的消費者)出售產(chǎn)品,而最終只能向體驗成功的消費者出售。對于這樣一個動態(tài)博弈過程,我們考慮馬爾科夫完美均衡(markov perfect equilibrium),即均衡定價策略只由最近的狀態(tài)變量決定。這里的狀態(tài)變量是后驗概率ρ,研究的重點是刻畫均衡定價策略P(ρ)的涵義和特征。 (2) 在每個時間點t,壟斷者需要選擇是同時向體驗成功和體驗失敗的消費者都出售產(chǎn)品還是只向體驗成功的消費者出售。如果壟斷者總是只向體驗成功的消費者出售,他可以收取價格g-s來攫取體驗成功消費者的所有消費者剩余,此時接受這個價格的體驗成功消費者的測度為γt。因此,壟斷者的收益(標準化后的期望貼現(xiàn)利潤之和)是: (3) (4) rJ(ρ)=rP(ρ)-λρ(1-ρ)J′(ρ) (5) 同樣地,體驗成功消費者的收益(標準化的期望貼現(xiàn)效用總和)滿足: (6) 從而可以推導出如下方程: rV(ρ)=r(g-P(ρ))-λρ(1-ρ)V′(ρ) (7) 最后,體驗失敗消費者的收益可以表示為: rU(ρ)=r(gρ-P(ρ))+λρ(V(ρ)-U(ρ))-λρ(1-ρ)U′(ρ) (8) 與式(7)相比較,式(8)增加一項λρ(V(ρ)-U(ρ)),該項表示匹配時一次性收益以速率λ出現(xiàn),此時后續(xù)收益跳到V(ρ)。要求解上述微分方程,需要P(ρ)的顯性表達式,我們將在下部分進行求解。 壟斷廠商實質(zhì)上面臨的是一個雙臂賭博機(two-armed bandit)問題: 是選擇對所有消費者出售產(chǎn)品還是只對體驗成功的消費者出售。當信念比較高時壟斷者會向所有消費者出售產(chǎn)品,直至達到某個時間轉(zhuǎn)而只對體驗成功者出售。當壟斷者向所有消費者都出售產(chǎn)品時,下面的引理給出了均衡價格P(ρ)。 引理1如果壟斷者向所有消費者都出售產(chǎn)品,均衡價格P(ρ)將會是gρ-s。 證明: 見附錄。 在一個單期的靜態(tài)模型中,價格P(ρ)等于gρ-s的結(jié)果非常符合直覺:該價格意味著體驗失敗的消費者即期在購買和不購買之間無差異。但在動態(tài)模型中,消費者購買風險產(chǎn)品實際上是在購買一個期權(quán):未來在獲取了一次性收益時會繼續(xù)購買,而如果遲遲未獲取的話,會停止購買。因此當P(ρ)等于gρ-s時,由式(8)可知:盡管體驗失敗者在即期無差異,均衡收益U(ρ)卻會嚴格大于s,因為有可能獲得一個一次性收益從而獲取一個高值的V(ρ)。也就是說,即便壟斷者將價格P(ρ)定在略高于gρ-s的水平,體驗失敗者從購買風險產(chǎn)品中獲取的收益依然要大于s,但為什么壟斷者不再索取更高的價格呢? (9) 有趣的是,為了防止消費者的背離,壟斷者索取的均衡價格恰恰使得體驗失敗的消費者即期在購買和不購買之間無差異。為了理解該結(jié)果的直覺,我們可以考慮一個離散時間模型。如果壟斷者在t期向所有消費者都出售產(chǎn)品,“一次性偏離原理”意味著其均衡價格應(yīng)當使得體驗失敗的消費者在下述兩個選擇之間無差異:①t期購買風險產(chǎn)品以及從t+1期起維持均衡策略;②t期不購買風險產(chǎn)品以及從t+1期起維持均衡策略。上述兩個選擇從t+1期起給消費者帶來的期望收益是完全一樣的。首先,在連續(xù)統(tǒng)消費者模型中,單個消費者購買或不購買風險產(chǎn)品完全不影響未來價格;其次,t期不購買的消費者比t期體驗失敗的消費者更樂觀,因此如果t期體驗失敗的消費者在均衡時愿意繼續(xù)購買風險產(chǎn)品,t期不購買的消費者的均衡策略也一定是繼續(xù)購買;最后,因為在貝葉斯法則之下信念更新滿足鞅(martingale)性質(zhì),消費者在t期是否購買風險產(chǎn)品也不影響未來購買風險產(chǎn)品的期望消費收益。因此t期的均衡價格只需使得體驗失敗的消費者即期在購買和不購買之間無差異。 壟斷者求解其雙臂賭博機問題的關(guān)鍵是比較只對體驗成功者出售所獲得收益和向所有消費者出售產(chǎn)品所獲得收益。如式(3)所表明的,壟斷者只對體驗成功者出售將獲得收益S(ρ)=γ(ρ)(g-s)。式(5)和引理1意味著壟斷者向所有消費者出售產(chǎn)品獲取收益J(ρ)滿足:rJ(ρ)=r(gρ-s)-λρ(1-ρ)J′(ρ)。 最優(yōu)停止文獻(例如Dixit,1994;Peskir and Shiryaev,2006)中的經(jīng)典結(jié)論表明,如果壟斷者在后驗信念x下最優(yōu)的選擇是停止向體驗失敗者出售產(chǎn)品,那么停止的臨界值x應(yīng)該滿足值函數(shù)的匹配和平滑條件: J(x)=S(x),J′(x)=S′(x) 因此,我們得到如下定理: 定理1對任意ρ0滿足ρ0[rg+λ(g-s)]>rs,存在一個對稱的均衡,當ρ>x*時壟斷者制定價格gρ-s。當ρ趨向于x*時價格為g-s。均衡的臨界值x*<ρ0是下述方程的唯一解: rgx2-[2rg+λ(1-ρ0)(g-s)]x+rs+rρ0(g-s)=0 (10) 證明: 見附錄。 這里條件ρ0[rg+λ(g-s)]>rs有一個直觀的經(jīng)濟學解釋。設(shè)想一個消費者在極短的時間內(nèi)以零價格購買了風險產(chǎn)品,那么期望流量收益是ρ0[rg+λ(g-s)],其中λρ0(g-s)表示將來有可能獲取一次性收益的期望收益。如果消費者選擇無風險產(chǎn)品,那么流量收益就是rs。條件ρ0[rg+λ(g-s)]>rs說明選擇風險產(chǎn)品會帶來租金,因此壟斷者可以從出售風險產(chǎn)品中獲取正期望利潤。 圖1 價格路徑示意圖 基于定理1我們可以畫出典型的價格路徑(見圖1),壟斷者起初會保持遞減的價格來促使體驗失敗消費者嘗試購買,但最終會轉(zhuǎn)向一個很高的價格只向體驗成功的消費者出售產(chǎn)品。這里需要注意,在產(chǎn)品嘗試階段均衡價格可能是負的:壟斷者短期內(nèi)可能損失一些錢來吸引體驗失敗者進行再次體驗。 定理2對任意的ρ0滿足ρ0[rg+λ(g-s)]>rs時,一定有x*>xe。 證明: 見附錄。 上述定理表明壟斷者這種先低價再高價的動態(tài)定價均衡并不是社會最優(yōu)的。通過比較,我們發(fā)現(xiàn)壟斷廠商過早地停止低價格,從而轉(zhuǎn)向一個高價格而放棄掉體驗失敗的消費者,這會造成社會福利的無謂損失。造成這個結(jié)果的原因也跟Weng(2015a)中均衡無效率的原因是類似的:體驗成功的消費者愿意為風險產(chǎn)品支付更高的價格,而廠商又無法進行價格歧視,這種誘惑導致廠商愿意更早放棄掉體驗失敗的消費者。與本文不同的是,Weng (2015a)要求廠商能完全觀測到消費者的過往體驗歷史以判斷是否需要轉(zhuǎn)向高價格。而本文模型中,即便廠商無法觀測到消費者過往體驗歷史,在連續(xù)統(tǒng)消費者的情形下仍然可以應(yīng)用大數(shù)定理推算出體驗成功的消費者測度。 基于方程(10),我們可以推出幾個比較靜態(tài)的分析結(jié)果。下面的定理描述了均衡臨界值x*與模型中有關(guān)參數(shù)的關(guān)系。 定理3均衡臨界值x*受先驗概率ρ0、到達速率λ、風險產(chǎn)品的期望價值g、無風險產(chǎn)品的價值s以及貼現(xiàn)率r的影響。具體而言,x*是ρ0、s、r的增函數(shù),是λ、g的減函數(shù)。 證明: 見附錄。 對于λ,g,s和r的比較靜態(tài)結(jié)果的分析應(yīng)該比較容易理解,因為它們的符號與xe對λ、g、s和r的比較靜態(tài)結(jié)果相同,并且其經(jīng)濟學直覺也類似。當λ變高或者r變低時,購買風險品變得相對便宜,因此壟斷者會更多地鼓勵消費者體驗。當g變高或者s變低時,體驗購買風險品的收益提高或者成本降低,從而壟斷者也更加鼓勵體驗。 圖2 均衡臨界信念x*與初始信念ρ0關(guān)系示意圖 接下來,我們研究體驗性購買時間的長度如何受ρ0的影響。注意到壟斷者從先驗概率ρ0開始進行體驗性銷售一直到后驗概率達到x*。因此,體驗性購買時間的長度滿足: 從而得到: (11) 定理3表明x*是ρ0的增函數(shù),從而t*可能是ρ0的非單調(diào)函數(shù)。不過,下邊的定理證明t*是ρ0的增函數(shù),見圖3所示。 圖3 均衡臨體驗性購買時間長度t*與初始信念ρ0關(guān)系示意圖 定理4均衡的體驗性購買時間長度t*是ρ0的增函數(shù)。 證明: 見附錄。 雖然上述定理證明均衡的體驗性購買時間長度是初始信念的增函數(shù),但是該結(jié)果并不意味著初始信念上升會使均衡變得更加有效。因為初始信念上升同時也意味著社會最優(yōu)的體驗性購買時間長度也應(yīng)該上升。特別地,我們可以用κ表示均衡的體驗性購買時間長度與社會最優(yōu)的體驗性購買時間長度之間的距離:κ=te-t*,te可以類似于(11)式得到: 本文理論上的貢獻在于彌補了文獻中關(guān)于壟斷者對新體驗產(chǎn)品的動態(tài)定價研究的不足。我們考慮了當消費者數(shù)量是連續(xù)統(tǒng)時,壟斷廠商的定價如何隨著消費者對新產(chǎn)品信念的變化而變化。當體驗失敗的消費者對新產(chǎn)品是否匹配的后驗概率越來越低時,壟斷者為了向這些體驗失敗者出售產(chǎn)品,必須不斷降低價格來誘導這些人消費。隨著低體驗價格時間的延長,壟斷者實行低價格的代價越來越大,直到消費者對產(chǎn)品匹配的后驗概率達到臨界值后,壟斷者轉(zhuǎn)向壟斷性的高價格,此時體驗失敗者完全被壟斷者排除在市場之外,只對體驗成功的消費者出售產(chǎn)品。本文的結(jié)論與消費者數(shù)量有限時的結(jié)論有所不同,在本文中消費者對新產(chǎn)品匹配的初始信念越高,壟斷者停止低價格的信念臨界值越高。而當消費者數(shù)量為有限時,壟斷者停止低價格的臨界值與消費者的初始信念無關(guān)。 我們對信念的臨界值作了比較靜態(tài)分析。值得注意的是,消費者對新產(chǎn)品匹配程度的先驗概率越高,壟斷者獲取的利潤越大。但同時,該先驗概率越高,壟斷者就會在越高的后驗概率臨界值處停止低價格,這會帶來更大的社會損失。 本文不僅在理論上有新的貢獻,而且對于現(xiàn)實經(jīng)濟政策的分析也能提供重要指導。在當前經(jīng)濟進一步市場化,政府大力鼓勵創(chuàng)新和創(chuàng)業(yè)的背景下,新產(chǎn)品和新服務(wù)不斷涌現(xiàn),本文的研究對新產(chǎn)品的壟斷動態(tài)定價給出了理論分析和相應(yīng)的政策建議。我們的研究表明,政府對壟斷廠商的規(guī)制不僅限于對傳統(tǒng)意義上壟斷性的高價格的限制,對其新產(chǎn)品實行低價格吸引客戶的時間也可以進行規(guī)制來提高社會效率,對壟斷廠商實行的體驗性低價格應(yīng)該進行鼓勵或者補貼以延長該價格的時間,讓更多的消費者有機會體驗新產(chǎn)品以提高消費者對新產(chǎn)品的認同來提高社會效率。隨著移動互聯(lián)網(wǎng)的深入發(fā)展,越來越多的公司基于移動互聯(lián)網(wǎng)進行創(chuàng)新和創(chuàng)業(yè)。滴滴打車、共享單車等創(chuàng)新服務(wù)模式深刻地改變了原有的商業(yè)版圖,初創(chuàng)公司在起步時大量引入投資以支持低廉的用戶體驗價格,在很短的時間內(nèi)大量地吸引消費者進行嘗試,迅速占領(lǐng)市場;低價格一段時間后,提高價格來獲取更高的利潤回報初期投資者。這對廠商而言無可厚非,但過早地結(jié)束低價格會帶來社會損失。政府在這種新產(chǎn)品的低價格期間可以進行補貼來延長體驗期,等廠商轉(zhuǎn)向高價格后,可以反過來對企業(yè)征稅。這種產(chǎn)業(yè)政策的機制設(shè)計可以從社會福利最大化的角度給予企業(yè)正確的激勵來向社會最優(yōu)的配置結(jié)果靠攏。 附錄 引理1的證明: 證明: 壟斷者面臨的問題是選擇對所有消費者出售產(chǎn)品還是只對體驗成功的消費者出售。假定壟斷者選擇以Pt的價格向所有消費者出售產(chǎn)品直至時刻T,并且假定一個信念為ρ的體驗失敗消費者一直購買風險產(chǎn)品直至時刻T,那么該消費者得到的期望收益為: U(ρ)= 為了向所有的消費者出售產(chǎn)品,壟斷者所制定的價格P(ρ)必須阻止“一次性偏離”。通過偏離均衡策略而選擇h時長的無風險產(chǎn)品,一個信念為ρ的體驗失敗消費者可以獲取收益: 上式成立的一個重要前提是偏離者比非偏離者更加樂觀。所以給定非偏離者愿意一直購買風險產(chǎn)品直至時刻T,偏離者也愿意采取相同的行動。在連續(xù)統(tǒng)消費者模型中,單個消費者購買或不購買風險產(chǎn)品完全不影響未來價格。也即上述兩式中Pt和T完全相同。同時在貝葉斯法則之下,信念更新滿足鞅性質(zhì):因此壟斷者的定價必須滿足也即當壟斷者向所有的消費者出售產(chǎn)品時,該不等式對于任何ρ和充分小的h都成立,因而可得: 在均衡時,壟斷者希望選擇盡可能高的價格以最大化其利潤。因此均衡價格滿足P(ρ)=ρg-s。 證畢。 定理1的證明: 證明: 把邊界條件代入值函數(shù)得到: rγ(x)(g-s)=r(gx-s)-λx(1-x)γ′(x)(g-s) 令f(x)=rgx2-[2rg+λ(1-ρ0)(g-s)]x+rs+rρ0(g-s) f(0)=rs+rρ0(g-s)>0 因此,當且僅當f(ρ0)<0時,f(x)=0有一個根x<ρ0,這等價于 ρ0[rg+λ(g-s)]>rs 證畢。 定理2的證明: 證明: 關(guān)鍵是證明f(xe)>0,其中 f(x)=rgx2-[2rg+λ(1-ρ0)(g-s)]x+rs+rρ0(g-s) 簡化后可以得到f(xe)>0等價于-rgxe(1-xe)+λρ0(g-s)xe+rρ0(g-s)>0。 成立。 顯然,rρ0(g-s)-rxe(g-s)>0 由假設(shè)ρ0[rg+λ(g-s)]>rs我們可以得到xe<ρ0,并且 因此,我們一定有f(xe)>0,從而x*>xe。 證畢。 定理3的證明: 證明: 令f=rgx2-[2rg+λ(1-ρ0)(g-s)]x+rs+rρ0(g-s) 對此進行全微分可以得到: 證畢。 定理4的證明: 因此上述方程變?yōu)?3 均衡分析
3.1 均衡價格
3.2 均衡下何時停止向體驗失敗消費者出售
3.3 與效率臨界值的比較
3.4 比較靜態(tài)分析
4 結(jié)論
——基于CHNS調(diào)查數(shù)據(jù)和刀切法的動態(tài)評估
——基于距離指數(shù)與投入產(chǎn)出空間權(quán)矩陣