程歆
摘 要 互聯網時代提升用戶體驗主要通過用戶畫像分析技術,即基于個人的手機、網頁瀏覽痕跡等了解用戶需求。本文通過將用戶畫像的概念轉移應用到交通領域,利用交通大數據分析出行者交通選擇行為在不同交通狀況下的異同,為交通規(guī)劃決策提供量化支持和決策依據。
關鍵詞 出行者畫像;出行選擇;大數據;交通行為
中圖分類號 U1 文獻標識碼 A 文章編號 2095-6363(2017)12-0110-02
所謂用戶畫像,一是指單個用戶所有標簽的集合,通過可以獲取的用戶的社會屬性(如性別、年齡、工作、收入等),將用戶所有的選擇偏好綜合起來,勾勒出該用戶的整體特征與輪廓;二是根據其屬性或標簽集進行分類和預測,從而實現特定的目的,如信用評級、受眾類型等的劃分。用戶畫像更深層次的意義,是根據用戶數據和行為,為特定的客戶進行按需定制。在大數據分析中對特定的用戶群體進行分類分析,形成不同維度的屬性標簽,從而采取不同的商業(yè)行為和措施,以達到特定的利益目標。
對于出行者行為的畫像來說,首先需要指出的是分析的對象不是特定的某個出行者,而是每個出行者參與到整個交通系統中所呈現的群體行為,從非集計的角度來分析和研究個體行為對整個交通系統的影響,同時對相同交通行為的選擇結果進行分析,找出影響群體交通選擇行為的主要因素,量化影響因素的程度和范圍。
1 交通大數據
隨著智能交通的發(fā)展,與交通相關的數據已經從傳統的粗放型、局部性的數據逐漸細化,主要的新型數據包括:GPS數據、公交刷卡數據、手機信令數據、網頁爬取數據、卡口數據與路網數據等
2 交通行為畫像
2.1 大數據融合畫像
交通行為畫像就是基于以上的各類交通數據,整個多源數據融合過程其實是作為整個交通大數據應用的一部分,使用多源數據提取出行者的詳細出行信息,形成并探討其實際出行選擇與備選方案之間的差別;對出行鏈效用方程中的參數進行估計,并將出行根據大數據以及傳統的城市人口數據和土地規(guī)劃等結合起來對整個城市的出行者進行泛化和擴樣,利用非集計模型對整個城市的出行者進行仿真并將結果應用到實際工作中;同時,仿真模型再與大數據中的各項觀測數據進行對比,矯正模型參數和精度。整個過程循環(huán)遞進優(yōu)化,同時勾勒的出行者畫像也在不斷的迭代調優(yōu)中更加準確。
2.2 出行鏈
出行者通常會按照自己的意愿或作為社會一份子而產生的活動安排出行,而各項社會活動或生計需求就會產生各種時空上的移動,把出行者的各項活動之間用出行連接起來就形成了出行鏈。
一般情況下,正是大量工作開始時間相近的剛性出行活動導致了交通系統的高峰期,而大量出行時間、地點等的彈性可變的非剛性出行導致了交通系統的不確定性。基于出行鏈的出行理論的主要有以下5點:
1)出行的需求源于社會經濟活動的需要。
2)人的行為受時空的限制要在不同時間和地點進行不同活動, 并且去各個活動地點都要花費時間。
3)通常人的出行都是以家庭為基本單位,家庭影響個人的活動和出行決策。許多決策作為家庭決策的一部分,受家庭中其它成員的限制,所以家庭類型和生活方式也影響個人的選擇。
4)活動和出行決策是動態(tài)的 一次決策受過去和預期事件的影響[1],同時也受到當前環(huán)境的影響,出行計劃可能根據實際情況而實時變化。
5)出行過程中出行者將面臨一定數量的選擇,并在各個選項間衡量對比后作出決策,最終實施的出行計劃雖然可能由于路網的動態(tài)變化和交通系統的不確定性導致與預期有所差別,但卻是決策時選擇集中效用最大的一項。
作為出行行為決策的出行者(或家庭)在出行活動中面臨的一系列可以選擇的、選擇分肢相互獨立的集合中,會選擇他認為效用最大的選擇項,這個被稱為效用最大化行為假說。而量化這一過程的目前廣泛應用的模型為Logit模型,Logit模型正是以某次出行行為的選擇集為基礎設定效用函數,計算各選項被選擇的概率并估計影響各選項的參數,而將每一次的出行連接起來,就形成了基于一天活動的出行鏈。
出行的計算考慮了出行模式,距離、出行時間、換乘因素,出行費用等,而其中的參數就是描述出行者畫像的主要量化指標。這些參數的值決定了不同出行者在面臨不同的選擇方式時的決策結果,對這些參數的估計就是多源數據融合的出行者畫像的最重要的部分,也是對出行者出行過程最精確對描述。
2.3 出行者行為分析和仿真
通過多源數據的融合,可以得到部分出行者的出行,再根據城市土地規(guī)劃、各區(qū)人口數據等將數據進行泛化擴樣,從而得到了整個城市所有出行者一天的交通活動的初始計劃,并利用MATSim對其進行仿真。為保證模型的仿真精度,使用MATSim對整個城市的交通系統的運行狀況及出行者的出行采取開放的方式,即出行者的出行畫像、基本出行集等按照多源交通大數據進行校正,每一次的數據矯正是建立在其他數據源的基礎上進行迭代尋優(yōu),以迭代收斂為主要目標,旨在充分利用和融合各數據源,從而使模型精度不斷提高。
3 應用
對出行者的出行行為進行畫像,根據其選擇偏好進行參數估計,最終通過仿真模型將整個城市的模型進行仿真,其主要的應用可以體現在以下幾個方面。
3.1 交通相關政策的輔助決策
通過對如擁堵收費、劃定公交車專用道、換乘優(yōu)惠、停車費用調控等相關交通政策實施前后整個交通系統運行狀況的仿真,可精確量化政策實施前后各項交通指標,如道路使用效率、出行者廣義出行費用的變化以及出行方式變化比例等,為相關政策和措施提供決策支持。
3.2 片區(qū)交通改善的前后對比
對于某一片區(qū)交通設施、交通組織方式等的改善方案進行仿真,針對改善目的對各個方案進行量化評價和對比,從而選出最有改善方案。
3.3 出行者出行的出行劃分和誘導建議
對整個深圳市區(qū)域內所有出行者的仿真過程,是對出行者出行時所面臨的一系列的決策進行分析,通過對這些離散選擇模型的分析和研究,了解其選擇過程中的決定因素,對整個系統對仿真和掌控了解可以很好地把握各項交通相關決策的臨界點,對出行進行誘導,從而降低路網交通壓力,提高出行者出行效率。
3.4 公共交通優(yōu)化的對比與決策支持
對整個深圳市的交通系統進行仿真,了解使用公交系統的實際情況,掌握公交、地鐵的客流集散情況,可根據實際的客流集散點對公交線路、班次進行優(yōu)化,同時對比優(yōu)化前后的交通狀況。
4 結論
在“互聯網+”的背景下,大數據技術在交通業(yè)務領域的應用不斷擴展,而智能手機、物聯網等技術的不斷更新,進一步觸發(fā)了交通規(guī)劃和管理模式的轉變。在妥善解決個人信息安全與隱私保護的前提下,多源數據的融合和應用在未來一段時間內將成為趨勢。利用數據融合對出行者的交通相關行為的畫像,有利于各方充分利用現有的數據資源,有效實現規(guī)劃和管理的精準實施和相關政策、措施的支撐,同時在出行者行為和選擇模型方面也可進行創(chuàng)新性的探索和實踐。
參考文獻
[1]余孟杰.產品研發(fā)中用戶畫像的數據模建——從具象到抽象[J].設計藝術研究,2014,4(6):60-64.
[2]劉海,盧慧,阮金花,等.基于“用戶畫像”挖掘的精準營銷細分模型研究[J].絲綢,2015,52(12):37-42.
[3]張慷.手機用戶畫像在大數據平臺的實現方案[J].信息通信,2014(2):266-267.