趙長虹 陳玉皓
摘 要:出租車是城市交通體系中不可或缺的部分,合理配置出租車資源對優(yōu)化城市交通,解決人車矛盾有重要意義。隨著移動設備與定位技術(shù)的普及成熟,大量出租車配備了移動定位系統(tǒng),由此獲得大量軌跡數(shù)據(jù)?;诔鲎廛囓壽E數(shù)據(jù)分析城市交通狀態(tài)對改善城市交通狀況與充分發(fā)揮出租車作用有重要意義。目前已有的出租車推薦系統(tǒng)多基于出租車的歷史軌跡,未考慮出租車營運的其他因素。本文基于出租車軌跡數(shù)據(jù),結(jié)合城市交通路況指標與出租車優(yōu)質(zhì)客源模型,研究城市出租車與乘客雙向推薦方法,以此為基礎實現(xiàn)出租車與乘客雙向推薦原型系統(tǒng),向出租車和乘客推薦合適路段。設計實現(xiàn)出租車軌跡數(shù)據(jù)預處理子系統(tǒng),實現(xiàn)軌跡數(shù)據(jù)的預處理與出租車基本營運指標的提取計算。出租車雙向推薦系統(tǒng)實現(xiàn)歷史軌跡查詢模塊與雙向推薦模塊。歷史查詢模塊提供歷史軌跡、乘客歷史上下車點查詢功能。雙向推薦模塊基于雙向推薦系數(shù)為出租車與乘客推薦最優(yōu)路段。
關(guān)鍵詞:出租車;乘客;軌跡數(shù)據(jù)
一、系統(tǒng)研究背景和意義
隨著經(jīng)濟技術(shù)的快速發(fā)展,互聯(lián)網(wǎng)已經(jīng)對商業(yè)、工業(yè)、銀行,及人們的工作、生活產(chǎn)生了深遠的影響。許多傳統(tǒng)的信息和數(shù)據(jù)庫系統(tǒng)正在被移植到互聯(lián)網(wǎng)上,人們獲得信息的來源已經(jīng)不再只是報紙、電視、廣播等傳統(tǒng)媒體。一個新的信息傳送媒體逐漸被人們所青睞。隨著計算機技術(shù)的發(fā)展,網(wǎng)絡正在迅速的改變著人們的生活、學習、工作方式,更多的人開始通過網(wǎng)絡查詢資料,為解決已有系統(tǒng)推薦位置不全面、未考慮乘客偏好需求等問題,重新提出了一套候車位置推薦方法,研究并實現(xiàn)了自己的候車位置推薦系統(tǒng)“易出行”。為實現(xiàn)更加人性化的推薦,在主界面為乘客提供了三個選項:“少走路”、“少等待”,“綜合最優(yōu)”,根據(jù)乘客輸入的實際需求結(jié)合本文的推薦算法為乘客推薦最佳的候車位置,并將每個候車位置的候車時間和距離信息同時推薦給乘客。
二、系統(tǒng)概述
本項目研究并設計的候車位置推薦系統(tǒng),為乘客推薦候車位置的同時預出在該位置需要等待的時間。該推薦系統(tǒng)不僅可以減少乘客的候車時間,提高乘客的出行效率,候車時間的預測也為乘客合理的出行安排提供了依據(jù)。本項目系統(tǒng)采用三層 C/S 軟件架構(gòu)模式,C/S 是客戶端/服務器模式,它可以充分利用兩端硬件環(huán)境的優(yōu)勢,將任務合理分配到 Client 和 Server 端來實現(xiàn)和 Android 客戶端與服務的通信機制來實現(xiàn)。
三、系統(tǒng)需求分析
首先是對于上車點的成本的選擇,我們要從乘客,司機以及企業(yè)三個角度來分析,前兩者已經(jīng)考慮,但是企業(yè)角度方面提高用戶的接駕體驗,獲得用戶粘性以及好評率有待加強,比如在乘車上車之后,司機可以進一步的向乘客做一些目的地的信息推薦,以便達到最佳的下車地點。其次就是在乘客趕往乘車點所需要行走的時間方面級需要乘客有一定的經(jīng)驗和估算能力,如果乘客不能正確的估算行走時間,即便是最近的乘車點有可能不如遠一點的乘車點花費的時間少。然后就是在一些車輛較少而且偏僻的地方,我們可以考慮先乘坐公交車到達最近的乘車點然后再預約乘車,這樣可以實現(xiàn)靈活的乘車,擴大乘車范圍。
四、系統(tǒng)總體設計
(一)上車點的推薦項目中的特征可以分為三類:上車點基礎特征,上車點用戶隱式的反饋特征和用戶畫像特征。距離時間熱度特征可以從日志解析整合模塊的輸出結(jié)果中提取,上車點的用戶隱式反饋特征是根據(jù)歷史訂單通過 HQL對多張Hive表進行操作得到的自建特征,用戶的畫像特征從多個緯度來刻畫這一用戶例如基礎信息緯度,時間維度,地址信息緯度等,這些特征需要調(diào)用API接口獲取。
(二)對于數(shù)據(jù)的收集,我們采用最近鄰算法進行道路數(shù)據(jù)的收集,這是一種高效的移動路徑推薦系統(tǒng),當服務器端得到數(shù)據(jù)如何利用較優(yōu)的方法對數(shù)據(jù)進行處理,特別是面對大數(shù)據(jù)級別時的操作,最佳算法的位置就顯得舉足輕重。但在本項目的應用中存在一種n:n的關(guān)系,此時遞歸的優(yōu)勢就完全展現(xiàn)。
(三)在現(xiàn)有的研究成果中主要在離線部分處理耗時的操作,在線部分負責快速響應推薦請求根據(jù)離線部分是否采用確定的模型匹配技術(shù)可以把離線在線結(jié)合分為離線建模類和無模型類離線建模類最大的特征是在離線部分采用歷史數(shù)據(jù)建立模型,然后對模型進行訓練,并依據(jù)新到的數(shù)據(jù)對模型進行更新在線部分負責輕量級的操作如響應用戶的請求和推薦結(jié)果顯示。
五、總結(jié)
深入研究用戶以及用戶的社交網(wǎng)絡體現(xiàn)出來的隱式聯(lián)系,用戶所謂‘異 常活動,實際上是推薦系統(tǒng)無力解決用戶特定情況下正?;顒拥囊环N不足。通過對于用戶更為細致的歸類、對于用戶隱式特征的深入研究和提取、通過對于用戶社交網(wǎng)絡的深入發(fā)掘和預測,筆者相信能夠得出更加全面和優(yōu)秀的算法,并且為未來基于定位服務的推薦系統(tǒng)提出更好的算法。對未來的展望也是對本文研究的反思。
參考文獻:
[1]韓韜.軟件測試策略和測試方法的應用[J].信息記錄,2018,19(11):97-98.
[2]豆雪珊.應急車輛交叉口優(yōu)先通行輔助方法及協(xié)調(diào)控制策略研究[D].長春:吉林大學,2018.
[3]吳忠勤.大中型客車行業(yè)的發(fā)展狀況與展望[J].商用汽車,2006(7):23-26.
[4]趙苗苗. 基于出租車軌跡數(shù)據(jù)挖掘的推薦模型研究[D].首都經(jīng)濟貿(mào)易大學,2015.
[5]李飛,吳春旺,王敏.信息安全理論與技術(shù)[M].西安:西安電子科技大學出版社, 2016.
[6]蘭旭輝,熊家軍,鄧剛.基于MySQL的應用程序設計[J].計算機工程與設計,2017(03):442-443+468
[7]許陽. 城市軌道交通車站站臺候車乘客分布規(guī)律研究[D].北京交通大學,2015.
[8]王沙沙. 基于AFC數(shù)據(jù)的城市軌道交通路網(wǎng)乘客時空軌跡估計[D].北京交通大學,2018.
作者簡介:
趙長虹(1990-),女,山東棗莊,助教,學士,計算機應用。
基金項目:山東省高等學校國家級大學生創(chuàng)新創(chuàng)業(yè)訓練計劃項目,項目編號:S201913324052