亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于 C-SVM 分類器對(duì)影響乘客選擇出行方式的模型建立與求解

        2020-10-26 08:14:44楊佳凝
        無線互聯(lián)科技 2020年14期
        關(guān)鍵詞:分類因素分析

        楊佳凝

        (江蘇大學(xué),江蘇 鎮(zhèn)江 212013)

        1 購票行為分析

        本文根據(jù) 2019 年某高校本科生寒假回程購票信息調(diào)查表所給出的 161 組學(xué)生購票情況數(shù)據(jù)和因素調(diào)查、該高校本科生另一組回程信息調(diào)查表所給出的 85 組購票因素調(diào)查,篩選影響購票結(jié)果的主要因素,建立購票結(jié)果與影響因素之間的數(shù)學(xué)模型,對(duì)影響因素與影響因素之間的關(guān)系進(jìn)行量化分析,從高到低排序,并預(yù)測(cè)下一年寒假每個(gè)學(xué)生的購票行為[1]。模型流程如圖1所示。

        圖1 模型流程

        其次,考慮邏輯數(shù)據(jù)的分布情況。由于邏輯數(shù)據(jù)只有 0 和 1 兩種狀態(tài),故檢驗(yàn)其是否呈伯努利分布。令Fn等于伯努利分布函數(shù),進(jìn)行Kolmogorov-Smirnovtest,發(fā)現(xiàn)所有邏輯數(shù)據(jù)均不成伯努利分布[2]。

        2 購買火車票和高鐵票的主要因素

        篩選購買火車票和購買高鐵票的主要因素,并建立典型相關(guān)分析模型,先建立多元線性回歸模型:

        ym=β0+β1X1+β2X2+β3X3+β4X4β5X5β6X6+β7X7+β8X8

        典型相關(guān)分析函數(shù)的因變量為人們選擇購買高鐵票還是普通火車票,自變量分別為影響人們出行的各個(gè)因素,即里程長(zhǎng)度X1、時(shí)間X2、被迫選擇X3、可支配收入X4、購票方式X5、購票價(jià)格X6、舒適程度X7以及時(shí)間成本X8。

        其中,β0表示多元回歸統(tǒng)計(jì)常數(shù),β1,……,β8分別代表各個(gè)因素的權(quán)重。

        由表1可知,系數(shù)越大,該自變量對(duì)因變量的影響程度越大,將這些系數(shù)所占的權(quán)重從高到低排序可知影響乘客購票行為的主要因素,其中,最主要的因素為兩種交通工具的舒適程度,所占權(quán)重為0.046 6;次要因素為購票方式(自付或家庭報(bào)銷),所占權(quán)重為0.045 5;排在第3位的因素為行駛時(shí)間長(zhǎng)度,所占權(quán)重為0.036 8。

        對(duì)于典型相關(guān)分析模型(CCA)進(jìn)行顯著性檢驗(yàn),記H(0)=0,表示原假設(shè)結(jié)果為真。經(jīng)檢驗(yàn)得知,顯著性誤差檢驗(yàn)結(jié)果為 46 個(gè),占比為 25%,在誤差允許范圍之內(nèi)[3]。

        表1 典型相關(guān)分析模型系數(shù)

        將數(shù)據(jù)經(jīng)過標(biāo)準(zhǔn)化處理后,運(yùn)用sgn分類函數(shù),經(jīng)過 CCA 分析可以得到乘客購票行為(購買火車票還是高鐵票)對(duì)各個(gè)自變量影響程度的大小,篩選出影響乘客購買高鐵票還是火車票的主要因素,在對(duì)主要因素進(jìn)行多元線性回歸后,利用 sgn 函數(shù)進(jìn)行二分類。為進(jìn)一步刻畫出乘客購買火車票還是購買高鐵票的特征,需要對(duì)結(jié)果進(jìn)一步分析,建立數(shù)學(xué)模型,將每位學(xué)生的特征標(biāo)簽化,將不同的標(biāo)簽賦予權(quán)重后,對(duì)學(xué)生購買火車票還是高鐵票的行為進(jìn)行分類,建立數(shù)學(xué)模型函數(shù)表達(dá)式為:y=sgn(βX)。

        通過sgn符號(hào)函數(shù)分類,可將在[-1,0]上的數(shù)全部映射成-1(乘客購買火車票),將[0,1]上的數(shù)全部映射成1(乘客購買高鐵票)。由此建立出影響乘客購票行為因素的準(zhǔn)則并通過回歸分析驗(yàn)證該模型的準(zhǔn)確性。

        3 因素與因素之間的量化行為分析

        進(jìn)一步量化分析因素與因素之間的關(guān)系,建立一個(gè)簡(jiǎn)單的二分類模型,用最小二乘法擬合其參數(shù)。但是驗(yàn)證后發(fā)現(xiàn),擬合的準(zhǔn)確率較低,為 84.47%。故而,需要優(yōu)化二分類函數(shù)的線性部分,提高其準(zhǔn)確率。本團(tuán)隊(duì)通過時(shí)間的角度加以分析。最后,建立模糊綜合評(píng)價(jià)法,對(duì)影響乘客購票行為的因素從高到低進(jìn)行排序。

        那么,只需求出min‖Y-Y′‖2,即min‖Aβ-Y‖2??紤]到Aβ-Y是正規(guī)方程,用最小二乘法即可得出全局最優(yōu)解,即β=(ATA)-1ATY,因此,得到簡(jiǎn)單二分類模型:

        將原始數(shù)據(jù)Y代入,發(fā)現(xiàn)其預(yù)測(cè)錯(cuò)25個(gè),準(zhǔn)確率為84.47。

        簡(jiǎn)單二分類的預(yù)測(cè)結(jié)果并不令人滿意,故選擇更換二分類函數(shù)的線性部分??紤]到這部分是一個(gè)超平面,且是通過歐式距離計(jì)算平面與數(shù)據(jù)點(diǎn)的距離[4]。

        將歐式距離優(yōu)化為幾何距離,引入 SVM 的模型架構(gòu),SVM 的超平面如圖2所示。選擇 C-SVM 分類器,其是二分類支持向量機(jī),通過設(shè)訓(xùn)練集、選取合適的核函數(shù)K(x,x′)和適當(dāng)?shù)膮?shù)C,構(gòu)造并求解最優(yōu)問題,通過設(shè)立計(jì)算閾值并構(gòu)造決策函數(shù):

        該模型的重點(diǎn)在于調(diào)節(jié)核函數(shù)和參數(shù)C。接下來,結(jié)合Matlab軟件,對(duì)模型進(jìn)行解算。

        圖2 SVM的超平面

        將數(shù)據(jù)按1∶4劃分為訓(xùn)練集和測(cè)試集,核函數(shù)選取線性核函數(shù)K(x,x′)=xTx,參數(shù)C定為6。訓(xùn)練完畢后得到準(zhǔn)確率為96.610 2%。Box可視化圖如圖3所示,測(cè)試樣本準(zhǔn)確圖如圖4所示。

        圖3 Box可視化圖

        圖4 測(cè)試樣本準(zhǔn)確圖

        本研究希望能通過不同的角度來考察自變量與自變量之間的關(guān)系,因此,用灰色關(guān)聯(lián)度 T 檢驗(yàn)分析對(duì)影響乘客購票行為的自變量關(guān)系??紤]到 T 檢驗(yàn)是關(guān)于時(shí)間變化的,所以,將 Excel 表格數(shù)據(jù)按照乘客購買火車票還是購買高鐵票的行為按照時(shí)間長(zhǎng)度進(jìn)行分類排序,再根據(jù) CCA 方法,篩選出的4個(gè)主要因素時(shí)間長(zhǎng)度、購票價(jià)格、舒適程度和時(shí)間成本,并加以分析。其中,時(shí)間長(zhǎng)度為因變量,其余3個(gè)因素為自變量,主要分析自變量與因變量之間的關(guān)系。

        灰色關(guān)聯(lián)度 T 檢驗(yàn)分析的基本思想為按照因素的時(shí)間序列曲線和相對(duì)變化勢(shì)態(tài)的接近程度來計(jì)算關(guān)聯(lián)度,對(duì)于離散時(shí)間序列,所謂兩曲線的相對(duì)變化勢(shì)態(tài)的接近程度,是指兩時(shí)間序列在對(duì)應(yīng)各時(shí)段Δtk=tk-tk-1(K=2,3,...,n)間各變量經(jīng)標(biāo)準(zhǔn)化后的增量大小來判定的。若在時(shí)間段Δtk間兩增量相等或接近于相等,則這兩時(shí)間序列在時(shí)段Δtk間的關(guān)聯(lián)系數(shù)就越大,反之就小。兩時(shí)間序列的關(guān)聯(lián)度定義為:各時(shí)間段Δtk間的關(guān)聯(lián)系數(shù)的加權(quán)平均數(shù),權(quán)數(shù)為Δtk。

        通過Matlab計(jì)算得到,在選擇乘坐高鐵的乘客中,時(shí)間長(zhǎng)度對(duì)購票價(jià)格、舒適程度和時(shí)間成本的關(guān)聯(lián)度為-0.035 9,0.011 2和0.007 9。在選擇乘坐火車的乘客中,時(shí)間長(zhǎng)度對(duì)購票價(jià)格、舒適程度和時(shí)間成本的關(guān)聯(lián)度為-0.011 3,-0.009 3 和 0.030 5。很明顯,時(shí)間長(zhǎng)度對(duì)于其他3個(gè)變量的影響對(duì)于乘客購票選擇高鐵還是火車是不同的。對(duì)于選擇高鐵的乘客來說,時(shí)間越長(zhǎng),對(duì)舒適程度越為看重;對(duì)于選擇火車的乘客來說,時(shí)間越長(zhǎng),就越不關(guān)心舒適程度。對(duì)于二者來說,時(shí)間越長(zhǎng),乘客會(huì)選擇較低的票價(jià),并且所有乘客對(duì)于出行花費(fèi)的時(shí)間都很重視。

        希望能夠建立某種準(zhǔn)則反映學(xué)生購票行為,對(duì)于學(xué)生購票行為進(jìn)行綜合評(píng)價(jià)打分,根據(jù)CCA分析之后得到的函數(shù)表達(dá)式的系數(shù),對(duì)系數(shù)進(jìn)行AHP層次分析法,得到的系數(shù)如表2所示。

        表2 AHP權(quán)重系數(shù)

        運(yùn)用兩種方法檢驗(yàn) AHP 層次分析法可行性。

        方案1:根據(jù)一致性指標(biāo)公式進(jìn)行判斷。由于共有 8 個(gè)自變量,故 n=8。得到 CI=0.130 6,非常接近 0。隨機(jī)相關(guān)一致性 RI=1.41,CR=0.092 6<0.1,AHP 層次分析法結(jié)果滿足檢驗(yàn)。

        方案2:用模糊綜合評(píng)價(jià)法進(jìn)行分析。首先,確定因素集,也就是評(píng)價(jià)指標(biāo),根據(jù)CCA分析結(jié)果,選出4個(gè)主要因素進(jìn)行模糊綜合評(píng)價(jià)。確定因素集,也就是評(píng)價(jià)指標(biāo)U={行駛時(shí)間長(zhǎng)度,購票價(jià)格,舒適程度,時(shí)間成本},然后確定評(píng)語集V={非常重要,重要,一般,不太重要}。根據(jù)AHP層次分析確認(rèn)各因素權(quán)重,確定模糊綜合評(píng)價(jià)矩陣對(duì)各因素做出評(píng)價(jià),進(jìn)行矩陣合成運(yùn)算。最終求得在顧客購票行為因素中,行駛時(shí)間長(zhǎng)度因素非常重要,購票價(jià)格因素重要,時(shí)間成本一般,舒適程度因素不太重要。

        4 模型的評(píng)價(jià)

        C-SVM 是一種有堅(jiān)實(shí)理論基礎(chǔ)的新穎的小樣本學(xué)習(xí)方法。對(duì)于本文中的樣本較少,邏輯數(shù)據(jù)和數(shù)值數(shù)據(jù)分布不清的問題,特別適用 SVM 模型進(jìn)行求解。C-SVM模型的最終決策函數(shù)只由少數(shù)的支持向量所確定,計(jì)算的復(fù)雜性取決于支持向量的數(shù)目,而不是樣本空間的維數(shù),降低了過擬合的風(fēng)險(xiǎn)。但是SVM也有不足之處,SVM 算法對(duì)大規(guī)模訓(xùn)練樣本難以實(shí)施。

        經(jīng)典的支持向量機(jī)算法只給出了二類分類的算法,而在數(shù)據(jù)挖掘的實(shí)際應(yīng)用中,一般要解決多類的分類問題。只能通過多個(gè)二類支持向量機(jī)的組合來解決,勢(shì)必會(huì)增加誤差的累計(jì),最終使得預(yù)測(cè)結(jié)果偏差較大。

        猜你喜歡
        分類因素分析
        腹部脹氣的飲食因素
        中老年保健(2022年5期)2022-08-24 02:36:04
        群眾路線是百年大黨成功之內(nèi)核性制度因素的外在表達(dá)
        分類算一算
        隱蔽失效適航要求符合性驗(yàn)證分析
        分類討論求坐標(biāo)
        電力系統(tǒng)不平衡分析
        電子制作(2018年18期)2018-11-14 01:48:24
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        電力系統(tǒng)及其自動(dòng)化發(fā)展趨勢(shì)分析
        短道速滑運(yùn)動(dòng)員非智力因素的培養(yǎng)
        色八区人妻在线视频免费 | 偷拍激情视频一区二区| 杨幂一区二区系列在线| 久久久久88色偷偷| 国内精品无码一区二区三区| 国产成人亚洲欧美三区综合| 在线观看视频亚洲一区二区三区| 一区二区和激情视频| av香港经典三级级 在线| 午夜短无码| 开心五月激动心情五月| 欧美怡春院一区二区三区| 国产亚洲人成a在线v网站| 国产亚洲美女精品久久| 国产另类av一区二区三区| 国产一区二区精品久久岳| 嗯啊哦快使劲呻吟高潮视频| 日韩av中出在线免费播放网站| 日韩av一区二区蜜桃| 亚洲欧美日韩另类精品一区| 最新亚洲人成无码网站| 伊人不卡中文字幕在线一区二区| 亚洲精品久久区二区三区蜜桃臀 | av成人综合在线资源站| 国产精品h片在线播放| 久久精品久久久久观看99水蜜桃| 亚洲无码vr| 精品一区二区三区婷婷| 性高朝大尺度少妇大屁股| 在线视频制服丝袜中文字幕| 亚洲精品中文字幕乱码人妻| 大奶白浆视频在线观看| 国产欧美日韩综合精品二区| 久久99久久99精品免观看不卡| 亚洲一区二区在线观看av| 无码字幕av一区二区三区| 狠狠狠色丁香婷婷综合激情| 青青草视频在线免费视频| 日本边添边摸边做边爱喷水| 极品美女扒开粉嫩小泬| 日本成人免费一区二区三区|