亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于相關(guān)性分析的售票曲線相似度計(jì)算模型

        2016-12-05 11:06:57馬敏書房紅征
        鐵道運(yùn)輸與經(jīng)濟(jì) 2016年11期
        關(guān)鍵詞:歷史數(shù)據(jù)計(jì)算公式區(qū)分

        王 浩,馬敏書,房紅征

        (1.北京市高速交通工具智能診斷與健康管理重點(diǎn)實(shí)驗(yàn)室,北京100039;2.北京交通大學(xué)交通運(yùn)輸學(xué)院,北京100044)

        基于相關(guān)性分析的售票曲線相似度計(jì)算模型

        王 浩1,馬敏書2,房紅征1

        (1.北京市高速交通工具智能診斷與健康管理重點(diǎn)實(shí)驗(yàn)室,北京100039;2.北京交通大學(xué)交通運(yùn)輸學(xué)院,北京100044)

        售票曲線相似度作為鐵路短期客流預(yù)測(cè)模型中的重要輸入,決定預(yù)測(cè)結(jié)果的準(zhǔn)確度。為了更合理地計(jì)算售票曲線相似度,在闡述售票曲線相似度概況的基礎(chǔ)上,針對(duì)鐵路短期客流預(yù)測(cè)的問題,提出簡(jiǎn)單計(jì)算模型、常用加權(quán)計(jì)算模型和基于相關(guān)性分析的計(jì)算模型,分別利用各模型計(jì)算得到的售票曲線相似度值對(duì)鐵路短期客流進(jìn)行預(yù)測(cè)。結(jié)果表明,基于相關(guān)性分析的計(jì)算模型的預(yù)測(cè)結(jié)果明顯優(yōu)于常用加權(quán)計(jì)算模型,即合理引入的相關(guān)性分析結(jié)果成分越多,預(yù)測(cè)效果越好。

        相似度;相關(guān)系數(shù);預(yù)測(cè)模型;售票數(shù)據(jù)

        有效的鐵路客流預(yù)測(cè)不但能夠指導(dǎo)鐵路資源的合理配置,而且能夠提高鐵路部門的收益[1-2]。鐵路售票預(yù)測(cè)方法有很多。WICKHAM R R[3]提出改善的打包模型 (Advanced Pick Up),通過有效利用已有的售票信息進(jìn)行預(yù)測(cè),提高預(yù)測(cè)精度;2003 年,WEATHERFORD L R 和 KIMES S E[4]提出一種通過計(jì)算訂票曲線相似度來區(qū)分歷史數(shù)據(jù)在預(yù)測(cè)中所起作用,進(jìn)而對(duì)歷史數(shù)據(jù)進(jìn)行加權(quán)并預(yù)測(cè)的方法;2009 年,TSAI T H[5]提出三階段法 (Three-Stage-Model),并論證合理區(qū)分不同預(yù)售期的售票數(shù)據(jù)在計(jì)算相似度過程中的作用能夠極大提高預(yù)測(cè)精度,但其區(qū)分依據(jù)是歐式距離,簡(jiǎn)單認(rèn)為數(shù)據(jù)重要性大小只與應(yīng)預(yù)測(cè)數(shù)據(jù)的時(shí)間距離遠(yuǎn)近有關(guān)。為更加準(zhǔn)確地描述相對(duì)于同一發(fā)車時(shí)間不同提前時(shí)間的累計(jì)售票數(shù)據(jù),以及不同歷史數(shù)據(jù)對(duì)預(yù)測(cè)結(jié)果的影響,通過對(duì)上一年同期數(shù)據(jù)進(jìn)行相關(guān)性分析 (計(jì)算線性相關(guān)系數(shù)),用計(jì)算所得的相關(guān)系數(shù)來準(zhǔn)確描述曲線相似度,可以有效區(qū)分不同數(shù)據(jù)在預(yù)測(cè)當(dāng)中所起的作用,從而得到更加準(zhǔn)確的預(yù)測(cè)結(jié)果。

        1 售票曲線相似度計(jì)算模型

        1.1售票曲線相似度

        相似度計(jì)算通常通過已知數(shù)據(jù)的變化趨勢(shì)來推算未知數(shù)據(jù)的應(yīng)用,在鐵路售票數(shù)據(jù)的預(yù)測(cè)中存在巨大應(yīng)用潛力[6]。鐵路在售票過程中不斷積累歷史數(shù)據(jù),而歷史數(shù)據(jù)與未來數(shù)據(jù)間有一定的相關(guān)關(guān)系,售票數(shù)據(jù)會(huì)呈現(xiàn)出一定的周期性變化,因而通過計(jì)算不同時(shí)間的售票曲線相似度,可以建立歷史數(shù)據(jù)與未來數(shù)據(jù)的相似關(guān)系,實(shí)現(xiàn)對(duì)未來數(shù)據(jù)預(yù)測(cè)的有效指導(dǎo)。

        假定有 n 個(gè)發(fā)車日的售票數(shù)據(jù) (為方便分析,選擇 n 為 1 周 7 天的倍數(shù),即 n = 7m,m ∈ Z+),Di表示第 i 個(gè)發(fā)車日,其中 di,0表示第 i 個(gè)發(fā)車日的最終累計(jì)售票量,di, j表示第 i 個(gè)發(fā)車日前 j 天的累計(jì)售票量,以此類推。在計(jì)算 Dx日數(shù)據(jù)曲線 (不含 dx,0) 與 Dy日數(shù)據(jù)曲線 (不含 dy,0)的相似度 Dx, y時(shí)(0≤x<y≤n,并且 x,y ∈ Z+),由于 dy,0為待預(yù)測(cè)數(shù)據(jù),數(shù)據(jù)曲線不包含 dx,0,dy,0。Dx, y實(shí)際代表Dx日數(shù)據(jù)曲線 (不含 dx,0) 與 Dy日數(shù)據(jù)曲線 (不含 dy,0) 變化趨勢(shì)的相似程度。

        1.2現(xiàn)有曲線相似度計(jì)算模型

        1.2.1簡(jiǎn)單計(jì)算模型

        曲線相似度的簡(jiǎn)單計(jì)算模型是指計(jì)算由 2 組數(shù)據(jù)所繪成曲線的純幾何相似程度的模型[7]。純幾何相似程度沒有考慮每個(gè)數(shù)據(jù)在計(jì)算中的不同作用,即默認(rèn)為每個(gè)數(shù)據(jù)在計(jì)算相似度過程中所起的作用相同,雖然這種計(jì)算方法在一些預(yù)測(cè)問題中還會(huì)用到,但其容易使問題絕對(duì)化,不能區(qū)分不同數(shù)據(jù)對(duì)計(jì)算結(jié)果的影響,因而只適用于純數(shù)據(jù)計(jì)算,不涉及解決實(shí)際問題。簡(jiǎn)單計(jì)算模型的計(jì)算公式為

        1.2.2常用加權(quán)計(jì)算模型

        曲線相似度的加權(quán)計(jì)算模型是指計(jì)算由 2 組經(jīng)過加權(quán)的數(shù)據(jù)所繪成曲線抽象相似程度的模型,是目前計(jì)算曲線相似度的常用方法。加權(quán)分為多種形式的加權(quán),其目的是為了區(qū)分不同數(shù)據(jù)在計(jì)算曲線相似度時(shí)所起作用的大小。由于曲線上每個(gè)數(shù)據(jù)點(diǎn)賦予了不同的權(quán)重,所賦權(quán)值大的數(shù)據(jù)點(diǎn)在計(jì)算曲線相似度時(shí)所起的作用也大,因而不能只通過 2 條曲線的幾何趨勢(shì)即判斷其相似程度。

        在計(jì)算 Dx日數(shù)據(jù)曲線 (不含 dx,0) 與 Dy日數(shù)據(jù)曲線 (不含 dy,0) 的相似度時(shí),計(jì)算結(jié)果用 Dx, y表示,將三階段法中計(jì)算相似度的模型定義為 Model,則Model 的計(jì)算公式為

        計(jì)算相似度是三階段法中的第一步,TSAI T H經(jīng)過相關(guān)論證,最終得出較為合理的預(yù)測(cè)模型,計(jì)算公式為

        2 基于相關(guān)性分析的售票曲線相似度計(jì)算模型

        2.1相關(guān)性分析方法

        在實(shí)際預(yù)測(cè)當(dāng)中會(huì)發(fā)現(xiàn),用于預(yù)測(cè)的數(shù)據(jù)在預(yù)測(cè)當(dāng)中所起的作用并非由歐氏距離簡(jiǎn)單區(qū)分[8]。為了能有效區(qū)別不同數(shù)據(jù)對(duì)預(yù)測(cè)結(jié)果的影響,可以通過對(duì)相關(guān)性的研究,進(jìn)行以下 2 種形式的線性相關(guān)性分析,用以區(qū)分不同數(shù)據(jù)在預(yù)測(cè)中所起的作用,進(jìn)而對(duì)公式 ⑵ 中 1/j2和 ( y-x) 這 2 項(xiàng)進(jìn)行改進(jìn)。這里分別用第一相關(guān)系數(shù) cj和第二相關(guān)系數(shù) c'k(均為線性相關(guān)系數(shù)) 來表示相關(guān)性分析結(jié)果,其定義如下。

        (1)第一相關(guān)系數(shù)。為了區(qū)別不同提前天累計(jì)售票數(shù)據(jù)與發(fā)車日累計(jì)售票數(shù)據(jù)的相關(guān)性,用上年同期的數(shù)據(jù)進(jìn)行相關(guān)性分析,定義第一相關(guān)系數(shù) cj如下。

        式中:cj為發(fā)車日累計(jì)售票數(shù)據(jù)列 (j = 0) 與發(fā)車日前 j 天 (j = 1,2,…,p) 累計(jì)售票數(shù)據(jù)的相關(guān)系數(shù);di, j為第 i 個(gè)發(fā)車日前j 天的累計(jì)售票數(shù)據(jù);。

        (2)第二相關(guān)系數(shù)。為了區(qū)別不同發(fā)車日累計(jì)售票數(shù)據(jù)與要預(yù)測(cè)發(fā)車日累計(jì)售票數(shù)據(jù)的相關(guān)性,定義第二相關(guān)系數(shù) c'k如下。將 di,0按周進(jìn)行排列,則能分成 m 周,以第 1 列為例,分別求得周一與前一天 (k = 1)、前 2 天 (k = 2)、…、前 q 天 (k = q) 的相關(guān)系數(shù) c'1,c'2,…,c'q。例如,c'1等于星期一這一列陰影部分與星期日一列陰影部分的相關(guān)系數(shù),以此類推,如表1 所示。

        表1 實(shí)驗(yàn)數(shù)據(jù)按照周進(jìn)行排列

        其中:

        這樣可求得星期一與前一天 (k = 1)、前 2 天(k = 2)、…、前 q 天 (k = q) 的線性相關(guān)系數(shù) c'1,c'2,…,c'q。

        2.2基于相關(guān)性分析的計(jì)算模型

        改善模型當(dāng)中的參數(shù)或因式,是對(duì)模型進(jìn)行優(yōu)化的一種常用方法,在引入 cj,c'k時(shí)有多種方法,根據(jù)實(shí)驗(yàn)比較,按下述方法引入可獲得較為準(zhǔn)確的預(yù)測(cè)結(jié)果。為區(qū)分開售時(shí)間段內(nèi)不同日期累計(jì)售票量對(duì)預(yù)測(cè)結(jié)果的影響,把用歐式距離區(qū)分的因式改為引用相關(guān)系數(shù)區(qū)分的因式,即將 Model 中 j2一項(xiàng)改為 1/cj,把所得模型定義為 Model-1。則Model-1 計(jì)算公式為

        為了進(jìn)一步區(qū)分不同發(fā)車日累計(jì)售票量 (即歷史數(shù)據(jù)) 對(duì)預(yù)測(cè)的影響,在 Model-1 的基礎(chǔ)上又將歐氏距離區(qū)分因式 ( y-x) 改為引用相關(guān)系數(shù)分析區(qū)分因式,把所得模型定義為 Model-2。則Model-2 計(jì)算公式為

        式中:k = y-x。

        3 模型比較

        3.1方法比較

        現(xiàn)對(duì)公式 ⑵、⑹、⑺ 即 Model、Model-1、Model-2 這 3 個(gè)模型的預(yù)測(cè)效果進(jìn)行對(duì)比。為減少數(shù)據(jù)波動(dòng)性影響并簡(jiǎn)化預(yù)測(cè)過程,現(xiàn)規(guī)定只通過 1周之內(nèi)的數(shù)據(jù)對(duì)發(fā)車日售票量進(jìn)行預(yù)測(cè)。如表2 所示,以陰影部分為例,當(dāng)預(yù)測(cè)第 i + 6 個(gè)發(fā)車日的數(shù)據(jù) (這里真實(shí)數(shù)據(jù)是 di + 6, 0),則只需要用到陰影部分(1 個(gè)測(cè)試集) 的數(shù)據(jù)進(jìn)行預(yù)測(cè),預(yù)測(cè)完 1 個(gè)數(shù)據(jù),向下移動(dòng) 1 行再對(duì)第 i + 7 個(gè)出發(fā)日的數(shù)據(jù)進(jìn)行預(yù)測(cè) (真實(shí)數(shù)據(jù)為 di + 7, 0) 進(jìn)行預(yù)測(cè),以此類推,這樣可得到從 D7到 Dn共 n-6 個(gè)預(yù)測(cè)數(shù)據(jù)。

        表2 用于預(yù)測(cè)的歷史數(shù)據(jù)

        為了驗(yàn)證新建模型的優(yōu)越性,通過應(yīng)用計(jì)算售票曲線相似度的預(yù)測(cè)方法,對(duì)所選實(shí)驗(yàn)數(shù)據(jù)進(jìn)行預(yù)測(cè),再比較預(yù)測(cè)結(jié)果的精確,從而反推模型優(yōu)越性。這里選取車次為 G1,OD 為北京南到上海虹橋(終到站),席別為二等座,時(shí)間段為 2014年10月7日—2015年3月1日共 147 天 (21 周) 的數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù),基本涵蓋各種情形的訂票數(shù)據(jù)曲線,數(shù)據(jù)具有一定代表性。這里 n = 147,m = 21,根據(jù)上述實(shí)驗(yàn)數(shù)據(jù)的使用方法,即可獲得測(cè)試集個(gè)數(shù)為 141個(gè),從而得到 2014年10月13日—2015年3月1日共 141 天的預(yù)測(cè)數(shù)據(jù)。然后將所得預(yù)測(cè)值與對(duì)應(yīng)的真實(shí)值進(jìn)行比較。由于要預(yù)測(cè)年的部分?jǐn)?shù)據(jù)未知,cj,的計(jì)算由上年同期數(shù)據(jù)計(jì)算所得,計(jì)算結(jié)果如圖1和圖2所示。

        圖1 cj計(jì)算結(jié)果

        圖2 計(jì)算結(jié)果

        預(yù)測(cè)結(jié)果的計(jì)算公式為

        這樣可得到 2014年10月13日—2015年3月1日141 個(gè)發(fā)車日的預(yù)測(cè)數(shù)據(jù) (2014年10月13日的數(shù)據(jù)是由 2014年10月7日—2015年10月12日數(shù)據(jù)預(yù)測(cè)所得,以此類推)。

        3.2結(jié)果比較

        通過計(jì)算預(yù)測(cè)結(jié)果的絕對(duì)相對(duì)誤差 (MAPE) 來分析預(yù)測(cè)精度。

        令 h = i + 6,則 MAPEh的計(jì)算公式為

        為了分析方便并提高誤差分析的可靠性,選取 2014年10月14日—2015年3月1日的 140 天共 20 周預(yù)測(cè)誤差值進(jìn)行分析 (8≤h≤147),對(duì)所得誤差按星期求平均值,計(jì)算公式為

        式中:w = 1 表示星期一;w = 2表示星期二;…;w = 7 表示星期日。

        圖3 計(jì)算結(jié)果

        由圖3可以看出,Model-1、Model-2 的預(yù)測(cè)結(jié)果明顯優(yōu)于 Model,而 Model-2 又明顯優(yōu)于Model-1。由此可知,合理引入相關(guān)性分析結(jié)果,相對(duì)于只單純基于歐氏距離的相似度計(jì)算模型預(yù)測(cè)效果更好,而且合理引入的相關(guān)性分析結(jié)果成分越多,預(yù)測(cè)效果越好。

        4 結(jié)束語

        基于相關(guān)性分析的售票曲線相似度計(jì)算模型為預(yù)測(cè)提供了新思路,這種預(yù)測(cè)模型能夠極大改善預(yù)測(cè)效果,相對(duì)于基于歐氏距離的相似度計(jì)算模型更加靈活,能夠適應(yīng)不同類型數(shù)據(jù)的預(yù)測(cè)。此外,基于相關(guān)性分析的售票曲線相似度計(jì)算方法能夠發(fā)現(xiàn)數(shù)據(jù)間關(guān)聯(lián)性,對(duì)于進(jìn)一步研究其內(nèi)在聯(lián)系有一定指導(dǎo)作用。但是,該模型也存在一些不足,比如實(shí)驗(yàn)數(shù)據(jù)的選取和預(yù)測(cè)過程中數(shù)據(jù)的應(yīng)用具有一定經(jīng)驗(yàn)性,需要進(jìn)一步完善。基于相關(guān)性分析的售票曲線相似度計(jì)算模型的適應(yīng)性分析是下一步重點(diǎn)研究方向。

        [1] 高 慧,趙建玉,賈 磊. 短時(shí)交通流預(yù)測(cè)方法綜述[J].濟(jì)南大學(xué)學(xué)報(bào)(自然科學(xué)版),2008,22(1):88-94.

        GAO Hui,ZHAO Jian-yu,JIA Lei. Summary of Short-Time Traffic Flow Forecasting Methods[J]. Journal of University of Jinan(Science and Technology),2008,22(1):88-94.

        [2] 宋嘉雯,瞿何舟. 基于客流性質(zhì)的鐵路客流預(yù)測(cè)方法[J].鐵道運(yùn)輸與經(jīng)濟(jì),2011,33(3):87-90.

        SONG Jia-wen,QU He-zhou. Forecast Method of Railway Passenger Flow based on the Passenger Flow Characrer[J]. Railway Transport and Economy,2011,33(3):87-90.

        [3] WICKHAM R R. Evaluation of Forecasting Techniques for Short-Term Demand of Air Transportation[R]. Cambridge:Flight Transportation Laboratory,1995.

        [4] WEATHERFORD L R, KIMES S E. A Comparison of Forecasting Methods for Hotel Revenue Management[J]. International Journal of Forecasting,2003,19(3):401-415.

        [5] TSAI T H. A Temporal Case Retrieval Model to Predict Railway Passenger Arrivals[J]. Expert Systems with Applications,2009,36(5):8876-8882.

        [6] 賈俊芳,孫晚華,劉 華. 城際列車開行方案的客運(yùn)量預(yù)測(cè)及評(píng)價(jià)[J]. 北京交通大學(xué)學(xué)報(bào) (自然科學(xué)版),2004,28(6):95-98.

        JIA Jun-fang,SUN Wan-hua,LIU Hua. Traffic Volume Forecast and Evaluation of Intercity Passenger Train Operation[J]. Journal of Beijing Jiaotong University,2004,28(6):95-98.

        [7] 孫晚華,劉 剛. 鐵路城際客流預(yù)測(cè)模型的研究[J]. 北京交通大學(xué)學(xué)報(bào) (自然科學(xué)版),2005,29(3):84-87.

        SUN Wan-hua,LIU Gang. Research on the Model of Forecasting Passenger Flow of the Intercity Train[J]. Journal of Beijing Jiaotong University,2005,29(3):84-87.

        [8] 王 達(dá),榮 岡. 時(shí)間序列的模式距離[J]. 浙江大學(xué)學(xué)報(bào)(工學(xué)版),2004,38(7):795-798.

        WANG Da,RONG Gang. Pattern Distance of Time Series[J]. Journal of Zhejiang University(Engineering Science),2004,38(7):795-798.

        責(zé)任編輯:吳文娟

        The Similarity Calculating Model of Ticket Sales Curve based on Correlation Analysis

        WANG Hao1,MA Min-shu2,F(xiàn)ANG Hong-zheng3

        (1.High-Speed Transport Intelligent Diagnostics and Health Management—The Key Laboratory of Beijing Municipality, Beijing 100039, China; 2.School of Traffic and Transportation, Beijing Jiaotong University, Beijing 100044, China)

        The similarity of the ticket sales curve is an important input in the short-term passenger flow forecasting model, which determines the accuracy of forecasting results. In order to calculate the similarity of the sales curve more reasonably, a simple calculation model, a weighted calculation model and a relational analysis-based calculation model are put forward on the basis of describing the similarity of the selling curve and the short-term passenger flow forecasting, and the short-term passenger flow is forecasted by using the similarity value calculated by the model. The result shows that the prediction model based on the correlation analysis is better than the commonly used weighted calculation model, that is, the more the correlative analysis results are, the better the prediction result will be.

        Similarity; Correlation Coefficient; Prediction Model; Ticketing Data

        1003-1421(2016)11-0072-05

        U293.13

        A

        10.16668/j.cnki.issn.1003-1421.2016.11.15

        2016-02-10

        2016-08-02

        中國(guó)鐵路總公司科技研究開發(fā)計(jì)劃課題(2013F019)

        猜你喜歡
        歷史數(shù)據(jù)計(jì)算公式區(qū)分
        基于充電策略估算動(dòng)力電池容量的方法
        汽車電器(2025年1期)2025-02-03 00:00:00
        區(qū)分“旁”“榜”“傍”
        你能區(qū)分平衡力與相互作用力嗎
        電機(jī)溫升計(jì)算公式的推導(dǎo)和應(yīng)用
        基于設(shè)備PF性能曲線和設(shè)備歷史數(shù)據(jù)實(shí)現(xiàn)CBM的一個(gè)應(yīng)用模型探討
        智能制造(2021年4期)2021-11-04 08:54:36
        基于故障歷史數(shù)據(jù)和BP神經(jīng)網(wǎng)絡(luò)的接地選線方案研究
        2019離職補(bǔ)償金計(jì)算公式一覽表
        教你區(qū)分功和功率
        基于Hadoop技術(shù)實(shí)現(xiàn)銀行歷史數(shù)據(jù)線上化研究
        罪數(shù)區(qū)分的實(shí)踐判定
        天堂国精产品2023年| 少妇人妻精品久久888| 亚洲精品宾馆在线精品酒店 | 米奇777四色精品人人爽| 欧美日韩亚洲成人| 91免费国产高清在线| 久久伊人精品色婷婷国产 | 熟妇丰满多毛的大隂户| 亚洲AV永久青草无码性色av| 国产美女主播福利一区| 亚洲最好看的中文字幕| 岳毛多又紧做起爽| 国产一极毛片| 亚洲一区二区三区美女av| 亚洲一区二区三区中国| 精产国品一二三产品蜜桃| 久久久久久中文字幕有精品| 久久精品国产福利亚洲av| 先锋影音人妻啪啪va资源网站| 国产精成人品| av中文字幕少妇人妻| 手机在线免费观看的av| 亚洲av无码专区在线观看下载| 婷婷综合久久中文字幕蜜桃三电影| 蜜桃av多人一区二区三区| 成人一区二区人妻少妇| 99国产精品无码| 自拍 另类 综合 欧美小说| 亚洲中字永久一区二区三区| 国产欧美一区二区精品久久久 | 激情五月天俺也去综合网| 中文国产乱码在线人妻一区二区| 国产欧美一区二区三区在线看| 精品国产v无码大片在线观看| 区无码字幕中文色| 日本最新一区二区三区在线| 无码少妇一区二区性色av| 在线精品无码一区二区三区| 蜜桃视频网址在线观看| 亚洲精品天天影视综合网| 大地资源中文第三页|