亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Logistic回歸模型的高鐵客運(yùn)市場細(xì)分

        2018-03-30 00:44:56李彥瑾羅霞劉悅朱海
        關(guān)鍵詞:分類

        李彥瑾,羅霞,劉悅,朱海

        (西南交通大學(xué),交通運(yùn)輸與物流學(xué)院,成都 610031)

        0 引 言

        市場細(xì)分有助于運(yùn)輸企業(yè)快速高效地確定目標(biāo)市場,對改善客運(yùn)產(chǎn)品、提高運(yùn)營效益具有積極意義。自市場細(xì)分概念提出以來,國內(nèi)外學(xué)者對其進(jìn)行了大量研究。國外研究方面,Tony指出目前市場細(xì)分的研究主要分為兩個方向:消費者導(dǎo)向型與產(chǎn)品導(dǎo)向型[1]。Tsai則提出以消費者的最近一次消費時間、消費頻率、消費金額3個變量進(jìn)行細(xì)分并識別最有價值的客戶[2]。國內(nèi)鐵路市場研究方面,趙娟等基于市場細(xì)分理論,運(yùn)用因子和聚類分析方法對京滬高鐵旅客調(diào)研數(shù)據(jù)進(jìn)行研究[3]。錢丙益等結(jié)合武廣客運(yùn)專線旅客問卷調(diào)查數(shù)據(jù),采用混合回歸模型,將市場細(xì)分為效率型、經(jīng)濟(jì)型、休閑型、體驗型4個細(xì)分市場[4]。

        從現(xiàn)有研究來看,目前國內(nèi)對鐵路市場細(xì)分的研究以產(chǎn)品為導(dǎo)向的細(xì)分方法為主,變量一般包括安全、速度、準(zhǔn)點和價格等,而從復(fù)雜的旅客出行特征角度出發(fā),利用概率分類法進(jìn)行市場細(xì)分的精確研究仍然較少。

        在渝利鐵路開通運(yùn)營之后,為使其具備優(yōu)良的客運(yùn)管理水平以及競爭實力,需要研究出一套科學(xué)的、可操作性強(qiáng)的客運(yùn)市場細(xì)分方法,準(zhǔn)確應(yīng)對市場需求,設(shè)計合理的渝利鐵路運(yùn)輸產(chǎn)品。因此,本文以渝利鐵路客運(yùn)市場為實際案例,根據(jù)旅客出行行為特征,選取Logistic智能分類算法對渝利鐵路客運(yùn)市場進(jìn)行細(xì)分,并對各細(xì)分市場的旅客特征進(jìn)行歸納總結(jié),具有一定的應(yīng)用意義。

        1 調(diào)查概述

        本次旅客出行調(diào)查分為預(yù)調(diào)查和正式調(diào)查兩個階段。預(yù)調(diào)查于2015年9月5日在重慶北站候車大廳進(jìn)行,受訪者為高鐵乘客和動車組乘客,設(shè)計并采用了RP/SP組合的調(diào)查問卷。正式調(diào)查于2015年9月12日在重慶北站候車大廳和重慶—利川涼霧站方向的渝利高鐵列車上進(jìn)行,并針對預(yù)調(diào)查存在的問題對問卷進(jìn)行了改進(jìn)。

        本次調(diào)研包含2個工作日和1個休息日,涉及重慶北站、復(fù)盛站、長壽北站、涪陵北站、豐都站、沙子站和涼霧站7個車站。其中預(yù)調(diào)查在1個工作日內(nèi)進(jìn)行,正式調(diào)查分為1個工作日與1個休息日兩個階段進(jìn)行。

        選擇1個工作日(星期三)進(jìn)行前期預(yù)調(diào)查,回收與處理問卷1 492份。各車站回收問卷數(shù)量如圖1所示。由圖1可以看出,各個車站的受訪者數(shù)量分布并不均勻,利川站的受訪比重過多。這將影響我們對調(diào)查結(jié)果的分析處理,因此本文通過優(yōu)化問卷結(jié)構(gòu)、簡化問題設(shè)置并選擇另一個工作日(星期二)開始進(jìn)行正式調(diào)查。

        圖1 工作日內(nèi)預(yù)調(diào)查各站點回收問卷數(shù)量Fig.1 Number of questionnaires collected at each station during weekdays

        正式調(diào)查采用改進(jìn)后的調(diào)查問卷,回收與處理問卷1 298份。由圖2可得,雖然各車站回收問卷數(shù)量較改進(jìn)前更均勻,但利川站的回收份數(shù)依然是最高的。這表明可能有其他因素影響調(diào)查結(jié)果。因此,選擇1個休息日(星期六)再次進(jìn)行正式調(diào)查,以此來判斷調(diào)查時間因素是否會對調(diào)查結(jié)果產(chǎn)生重要影響。

        圖2 工作日內(nèi)正式調(diào)查各站點回收問卷數(shù)量Fig.2 Number of valid questionnaires during weekdays

        在1個休息日進(jìn)行正式調(diào)查,回收與處理問卷1 374份,各車站回收的問卷數(shù)量如圖3所示。由圖3可得,在休息日內(nèi)各站點回收數(shù)量基本均勻,表明調(diào)查時間確實為影響調(diào)查結(jié)果的主要因素。

        圖3 休息日內(nèi)正式調(diào)查各站點回收問卷數(shù)量Fig.3 Number of valid questionnaires during weekend

        因此,本文采用分層抽樣的方法,分車次隨機(jī)選取旅客進(jìn)行面對面問卷調(diào)查,內(nèi)容包括年齡、職業(yè)、月收入、出行目的等旅客出行特征共計6個屬性。然后,分別選擇兩個數(shù)據(jù)集統(tǒng)計、處理來自工作日(星期二)與休息日(星期六)的調(diào)查數(shù)據(jù)。正式調(diào)查共回收4 890份調(diào)查問卷,篩選除去信息殘缺的調(diào)查問卷,得到4 164份有效問卷。

        2 建模與算法

        Logistic回歸分類作為概率分類法的常見類型,其分類標(biāo)準(zhǔn)為使后驗概率達(dá)到最大。通過這樣的分類方法,可以在樣本數(shù)據(jù)可信度較低的時候不進(jìn)行強(qiáng)制分類,排除樣本中的“噪聲”干擾,從而避免分類錯誤。另外,這種基于概率的模式分類算法還能夠?qū)Χ喾N屬性的樣本分類問題得到一個較顯著的分類結(jié)果[5]。因此,本文選用Logistic回歸分類進(jìn)行市場細(xì)分。

        2.1 基本原理

        假設(shè)渝利鐵路旅客市場上存在N個旅客,第n(n=1,2,3,…,4 164)個旅客對樣本中第i個屬性xi(i=1,2,3,…,6)的評價為xni,對產(chǎn)品的總體評價為yn。假設(shè)存在c個細(xì)分市場,每個細(xì)分市場在整個客運(yùn)市場的占比分別為θ1,θ2,…,θc,滿足(即滿足概率總和為1的約束條件)。

        根據(jù)Logistic回歸,使用線性對數(shù)函數(shù)對分類后驗概率q(yj|xi)進(jìn)行模型化:

        式中,q(yj|xi;θ)為第i(i=1,2,3,…,6)個屬性xi影響第j(j=1,2,3,…,n)個總體評價樣本yj的概率,θ為待優(yōu)化參數(shù),表示分類后的各個子市場比例;φj(x)為第j個樣本中各個屬性x的具體取值。

        2.2 模型求解

        利用對數(shù)最大似然函數(shù)法求解Logistic回歸分類模型。其中,似然函數(shù)是將當(dāng)前樣本,i=1,2,…,6由式(1)分類的概率看作是一個關(guān)于參數(shù)θ的函數(shù),而對數(shù)似然函數(shù)是指其對數(shù)。于是,作如下變換:似然→對數(shù)似然

        因此,可將該分類問題等價為下式的最優(yōu)化問題來定義:

        上述目標(biāo)效用函數(shù)Q對于參數(shù)θ是可以微分的,故可利用概率梯度法來求解最大似然估計問題的解,具體算法如下:

        ①給定θ以適當(dāng)?shù)爻踔担疚娜?.25(假定初始有4個子市場,所占市場份額均等為0.25),收斂精度η=0.01;

        ② 將隨機(jī)抽樣的有效樣本導(dǎo)入(xi,yj),i=1,2,3,…,6,j=1,2,3,…,4164;

        ③ 對于選定的訓(xùn)練樣本,以梯度上升的方向?qū)?shù)θ=(θ(1)T,…,θ(c)T)T,c=1,2,3,4按下式進(jìn)行更新:

        此處,ε為表示梯度上升幅度的正常數(shù),取0.001。?yJj(θ)是指順序為j的訓(xùn)練樣本所對應(yīng)的對數(shù)似然函數(shù)Jj(θ)=logq(yj|xi;θ)關(guān)于θ(y)的梯度上升方向。

        2.3 求解結(jié)果

        本文將隨機(jī)抽樣獲取的4 164份有效調(diào)查問卷,通過將問卷中各個問題選項進(jìn)行數(shù)據(jù)預(yù)處理并導(dǎo)入matlab中,采取Logistic回歸法進(jìn)行市場細(xì)分,再利用概率梯度算法進(jìn)行求解,得出算法收斂圖與市場細(xì)分圖如圖4、圖5所示。

        圖4 模型求解算法收斂圖Fig.4 Model convergence

        圖5 按旅客出行目的屬性維度方向投影的市場細(xì)分圖Fig.5 Market segments by trip purpose

        由圖4可以看出:算法初始階段在各個方向搜索最優(yōu)梯度,當(dāng)?shù)?2次時獲得可行的梯度方向并朝著效用函數(shù)值增大的方向收斂;當(dāng)運(yùn)行至第37次時開始平穩(wěn),并在迭代第46次時獲得平穩(wěn)解,此時效用函數(shù)值為0.988。最后該平穩(wěn)解滿足收斂精度要求,從而終止算法將效用值歸0。

        由圖5可以看出:Logistic回歸分類法最終將容量為4 164的調(diào)查數(shù)據(jù)樣本分為了3類,且絕大部分樣本細(xì)分后的效用函數(shù)值在0.932以上并在0.988左右到達(dá)穩(wěn)定極值點,反映出客運(yùn)市場細(xì)分效果較好。

        3 子市場描述

        將分類后其效用函數(shù)值分布于[0.932,0.992]區(qū)間的樣本數(shù)據(jù)進(jìn)行提取與計數(shù),可以得到細(xì)分后三個子市場的樣本容量大小,分別為:子市場1(1 822)、子市場2(891)、子市場3(1 134)。其余樣本數(shù)據(jù)經(jīng)分類后,未分布在效用顯著區(qū)間,故不予統(tǒng)計。

        3.1 聚類中心識別

        分別搜索各個子市場的類中心,并以類中心為圓心按子市場容量的55%為半徑,選擇各個子類的代表性樣本數(shù)據(jù),如圖6所示。

        圖6 按代表性樣本數(shù)據(jù)的市場細(xì)分Fig.6 Clusters of the sub-markets

        3.2 子市場劃分

        將提取出的代表性樣本數(shù)據(jù)按出行目的進(jìn)行歸納,可總結(jié)為:外出務(wù)工型(子市場1)、非經(jīng)濟(jì)出行型(子市場2)、商務(wù)出行型(子市場3)。并按照年齡、月收入和職業(yè)3個旅客特征指標(biāo)進(jìn)行統(tǒng)計分析,分別對每個子市場進(jìn)行細(xì)分,得到經(jīng)濟(jì)實惠、中堅力量和出行品質(zhì)注重三個子群體。故建立子市場細(xì)分模型,如表1所示。

        表1 子市場旅客容量統(tǒng)計表Tab.1 Population statistics of the submarkets

        3.3 子市場合并與描述

        由于需求模式最終反映為出行行為模式,同時為了便于進(jìn)行產(chǎn)品設(shè)計,需要對市場采取一定的規(guī)則進(jìn)行合并,使之更貼合實際生產(chǎn)運(yùn)營的需要。其中,合并規(guī)則包括以下兩個方面:①將市場容量明顯偏小的子市場合并;②合并性質(zhì)類似的市場。故合并完成后的市場細(xì)分如表2所示。

        由此可見,客運(yùn)市場被細(xì)分為如表3所示的A-E共計5個子市場,且各個子市場具有顯著的差異化特征。

        表2 合并后子市場旅客容量統(tǒng)計Tab.2 Population statistics of regrouped submarkets

        表3 合并后子市場特征描述表Tab.3 Descriptive statistics of the regrouped submarkets

        4 結(jié) 論

        針對市場細(xì)分的旅客特征分析,本文得出如下結(jié)論:

        (1)利用Logistic回歸分類法對隨機(jī)抽樣樣本數(shù)據(jù)分類處理,可在較少迭代次數(shù)內(nèi)得到平穩(wěn)解,利用出行目的維度投影得到的二維圖,表明該方法分類效果比較顯著。

        (2)通過對子市場的合并,發(fā)現(xiàn)在各個子市場內(nèi)旅客的年齡、月收入與出行目的是進(jìn)行高鐵客運(yùn)市場細(xì)分和市場特征描述的顯著影響指標(biāo)。

        (3)如何根據(jù)分析結(jié)果,對各細(xì)分市場的需求進(jìn)行預(yù)測,并進(jìn)而制定科學(xué)的產(chǎn)品定價實現(xiàn)高鐵運(yùn)營收益最大化,將是下一步的研究方向。

        [1] LUNN T. Segmenting and constructing markets[A].Robert Worcester and John Downham. Consumer market research handbook,Third revised and enlarged edition[C].Elsevier Science Pulishers B. V. ,1986,387-423.

        [2] TSAI C Y,CHIU C C. A purchase-based market segmentation methodology[J]. Expert Systems with Applications,2004,27(2):265-276.

        [3] 趙娟,任民. 京滬高鐵客運(yùn)市場細(xì)分與客票營銷策略研究[J]. 鐵道經(jīng)濟(jì)研究,2014(6):13-17.

        [4] 錢丙益,帥斌,陳崇雙,等. 基于混合回歸模型的客運(yùn)專線旅客市場細(xì)分研究[J]. 鐵道運(yùn)輸與經(jīng)濟(jì),2014,36(1):60-65.

        [5] TITTERINGTON D M,SMITH A F M,MAKOV U E.Statistical analysis of finite mixture distributions[M].New York:Wilcy,1985.

        猜你喜歡
        分類
        2021年本刊分類總目錄
        分類算一算
        垃圾分類的困惑你有嗎
        大眾健康(2021年6期)2021-06-08 19:30:06
        星星的分類
        我給資源分分類
        垃圾分類,你準(zhǔn)備好了嗎
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        按需分類
        教你一招:數(shù)的分類
        小蜜被两老头吸奶头在线观看| 日韩精品欧美激情亚洲综合| 亚洲精品国产一二三无码AV| 精品久久久久久电影院| 国产午夜在线观看视频| 人妻少妇哀求别拔出来| 久久综合狠狠综合久久综合88| 久久精品人人做人人爽电影蜜月| 欧美 亚洲 国产 日韩 综AⅤ| 少妇人妻中文字幕在线| 成熟人妻换xxxx| 老师脱了内裤让我进去| 国产日韩成人内射视频| 丰满少妇爆乳无码专区| 日本一道本加勒比东京热| 色欲一区二区三区精品a片 | 国产肉体xxxx裸体784大胆| 亚洲av综合a色av中文| 国产激情з∠视频一区二区 | 蜜桃视频插满18在线观看| 欧美操逼视频| 国产亚洲精品综合一区| 色婷婷久久99综合精品jk白丝| 国产精品狼人久久影院软件介绍| 中文在线8资源库| 国产熟妇搡bbbb搡bbbb搡| 久久亚洲精品成人综合| 手机在线播放av网址| 99久久久国产精品免费蜜臀| 欧美在线专区| 亚洲熟女一区二区三区不卡| 永久免费毛片在线播放| 中国丰满熟妇xxxx性| 广东少妇大战黑人34厘米视频| 99在线无码精品秘 入口九色 | 免费网站国产| 99在线无码精品秘 入口九色| 亚洲av一区二区三区蜜桃| 久久无码人妻一区二区三区午夜| 亚洲综合无码无在线观看| 99综合精品久久|