關于大數據時代交通調查新方法的討論
2015-06-27
紐約基于大數據分析公交行程時間,引發(fā)群友關于交通調查新方法、新技術的一系列討論。
關鍵詞:行程時間、居民出行調查、手機信令、數據共享
引子:
WNYC開發(fā)的TransitTimeNYC通過開源行程平臺(Github:OpenTripPlanner和MTA)獲取的數據將紐約市劃分成2930個六邊形,模擬出從每一個六邊形中點到邊緣的時間(地鐵和步行,時間是上午九點),最終建模出4290985條虛擬線路。
關于行程時間分析
劉松(深圳交委)從需求的角度談?chuàng)矶?,比政府去找個指標定義擁堵更客觀。更容易在城市間做橫向比較。
邵源(深圳交通中心)是的,把擁堵體現在人從不同起終點具體的出行上,而不是簡單的片區(qū)車速上。
邵源(深圳交通中心)靜態(tài)的類似分析深圳已經可以做到,接入動態(tài)數據分析的話還需要有相應的技術處理。另外交通方式不同,也可以有不同的細分的行程時間定義。
陳蔚(深圳交通中心)我們在深圳做過類似的分析,固定以中心區(qū)為起點。
付鑫(長安大學)。我們用西安的數據也做了類似的分析。
辛曉紅(深圳鵬途交通)為什么紐約的評估單元用六邊形,不用TAZ?
丘建棟(深圳交通中心)六邊形,是不是類似基站的蜂窩。
辛曉紅(深圳鵬途交通)可能用了手機數據追溯了OD,或者可能是為了簡化算法,滿足Web的速度要求
丘建棟(深圳交通中心)對,web跟技術人員分析不同,響應時間要重點考慮。如果用networkskim,怎么也要好幾分鐘
付鑫(長安大學)一種可能的猜想,用六邊形是使用了泰森多邊形(voronoi)的理想型,保證中心與其他中心之間的距離是等距的
辛曉紅(深圳鵬途交通)如果用泰森多邊形是個區(qū)域分析,不是網絡分析。在中國的城市也可以做。
付鑫(長安大學)是的,感覺那個newYork的案例,本身也是為了說明區(qū)域的可達性差異,只不過這種可達性是在公共交通的支撐下的吧?
交通調查新方法
全永燊(TRC)這幾年北京上海深圳等地已經在嘗試用手機信令數據、公交IC卡數據、浮動車數據以及互聯網手機APP等多種數據采集手段輔助入戶調查(近期),探索最終取代入戶調查的可能及技術途徑。
張?zhí)烊唬ㄉ弦?guī)院)@全永燊(TRC)目前來看有難度。給入戶調查帶來了更多的校核緯度,擴樣校核中有更多的信息了。
全永燊(TRC)盡管如此,這種探索務須堅持下去!
邵源(深圳交通中心)用手機基站小區(qū)的od匹配到交通小區(qū),技術上有沒什么太大障礙?
丘建棟(深圳交通中心)會有不少困難。小區(qū)邊界,是行政邊界不規(guī)則,基站是規(guī)則的。小區(qū)如果比較大,或者放在中區(qū)級別,可以減少這些困難。另外手機會有偏樣,而且手機數據過于海量,本身處理就是瓶頸
劉花(發(fā)改委城市中心交通院)基站數據判斷得有個合理的閾值
陳蔚(深圳交通中心)手機流量數據呢?比信令有無改進@丘建棟
丘建棟(深圳交通中心)@陳蔚深圳交通中心現在手機運營商已經超過了原來的信令或話單的采集手段,而是抽取用大量的app軟件的位置信息。號稱可以1秒采集一個手機位置,取決于你手機裝的app的危險度。裝越多app,則越“暴露”自己。
邵源(深圳交通中心)iphone每經過一個wifi熱點都會有準確位置信息記錄
劉花(發(fā)改委城市中心交通院)現在高校都有了基于出行信息采集的app軟件研發(fā)項目。
丘建棟(深圳交通中心)運營商,還是掌握了鏈路。掌握人的行為,是最大的事情。我們不留遺力,每幾年花了上千萬做居民出行調查,就是為了了解市民都在干什么,在想什么。但是總體做得不算好。
李苗裔(日本國立金澤大學)手機數據分析挖掘是否可以在一定程度輔助和支持居民調查工作
劉松(深圳交委)從政府層面考慮,能否通過手機數據替代入戶調查?采用政府補貼的方式可以提高公眾參與的積極性。
李苗裔(日本國立金澤大學)可能應該是“手機數據+小區(qū)抽樣調查”。感覺手機數據的一些有偏性在一定程度上還是需要調查來verfiy。不過如果是從政府層面主動推動基于移動手機的居民調查,那就另當別論了。
劉松(深圳交委)如果保留小區(qū)抽樣,那在具體操作上就會存在很多困難。站在政府的層面,推動移動技術的數據采集要比大規(guī)模入戶調查簡單的多。從實踐看來,數據也靠譜的多
李苗裔(日本國立金澤大學)這應該是另一個層面了,這樣主動推動甚至可以涉及移動設備的升級?,F在的移動手機數據空間位置多基于基站,整體來看城區(qū)部分精度200-300m,郊區(qū)1km-2km,需要通過出行鏈提取技術提高空間定位精度
劉松(深圳交委)但是我覺得對于深圳,這樣是可行的。全部是市域范圍。200到300的精度,加上gis中地理信息系統(tǒng)的輔助識別,完全可以到居住小區(qū)的精度
李苗裔(日本國立金澤大學)北大柴彥威教授在大上地地區(qū)做了小樣本的基于GPS的居民時空行為調查分析,整個技術流程和理論支撐都是可行的。
劉松(深圳交委)如果讓我選擇入戶調查數據或手機數據,我會選擇后者,互聯網+在交通的具體體現。我們的公眾參與意識太差了
全永燊(TRC)我堅信傳統(tǒng)的入戶出行調查方式被摒棄指日可待。
吳??。ū本┦姓海〡全永燊(TRC)非常贊同,新技術新方法的出現必會對傳統(tǒng)的方法進行革新
利用手機數據調查的技術難點
丘建棟(深圳交通中心)空間移動信息,人的物理移動,手機可以做大量的事情。出行行為,交通方式,目的等主觀人的特征,手機目前還是推算不了,這些信息又非常重要,在規(guī)劃研究中必不可少,需要有學者加強研究,從大數據中提取人的行為與選擇偏好,讓我們模型師早日從大調查中解脫出來。
李苗裔(日本國立金澤大學)其實還是可以解決基本屬性、出行行為和交通方式的識別。經過數據清洗后,把手機數據映射為矩陣,加上時間變量,是可以實現出行行為模式的識別,交通方式等可以通過多源數據輔助實現識別。手機數據可以與taxiGPS、poi等進行耦合,這樣多源數據融合解決問題。
張?zhí)烊唬ㄉ弦?guī)院)我最近做的工作是如何將這些信息與入戶調查融合,把這些越來越多的信息加入到擴樣校核中,實現通用的工具。不管如何,現在的調查能讓我們更加清楚地認識交通現象了
邵源(深圳交通中心)手機等數據現在暫時不能取代傳統(tǒng)居民出行調查的不足在于對出行者特征的掌握尚不足(出行目的、職業(yè)、收入、時間價值等),這些如果能跟各類app綁定分析出些道道并逐步突破,應該有希望取代傳統(tǒng)調查。目前起碼可以進行校核。
劉松(深圳交委)@邵源深圳交通中心一個補貼話費的app搞定啦
丘建棟(深圳交通中心)目前國際上發(fā)達國家城市,是否有用大數據替代居民出行調查的?
Suguimin(上海電科)據我們接觸,這個在歐洲和美國也是一種新的嘗試。
邵源(深圳交通中心)現在類似微信等app已經掌握了非常多的用戶特征,比如:購物喜好、朋友圈特點、移動特點等,已經能做到根據你的特點定向發(fā)朋友圈廣告了。所以,感覺很快我們擔心的事技術層面就可以解決了,起碼在大城市能先做到。
張?zhí)烊唬ㄉ弦?guī)院)我還是很關心和傳統(tǒng)分析技術的結合提升。例如職住分析,手機樣本大,居民調查從一定程度也可以對比。
Suguimin(上海電科)目前拿到的手機數據,難以替代傳統(tǒng)的交通調查,但多種數據融合及挖掘到是很有可能。
數據共享機制
張?zhí)烊唬ㄉ弦?guī)院)手機調查要和傳統(tǒng)定義一致,很多處理的參數還需要調校。可能個把城市的研究不夠,需要大家來做。我最近打算做點對比和參數調校研究,看看居民調查和手機調查的關系如何對接,例如如何定義一次出行,兩種調查的一致性。
全永燊(TRC)@張?zhí)烊桓鱾€城市聯手合作是必要的!
張?zhí)烊唬ㄉ弦?guī)院)@全永燊(TRC)是需要幾個城市來做,有可能手機數據定義的參數處理,每個城市還有差別,要找到規(guī)律。但數據共享可能難,研究結論,或者一起研究共享結論可以。國內研究的技術障礙不大,數據共享和體制障礙大
Suguimin(上海電科)@張?zhí)烊唬ㄉ弦?guī)院)不認同,行政方面,國內對數據的整合能力比國外要強,另外,國內需求更為旺盛。共享方面,國內較弱。但共享的趨勢很快。
張?zhí)烊唬ㄉ弦?guī)院)在沒有法制化的情況下,共享永遠是個夢
Suguimin(上海電科)我們接觸到的部分政府類的數據,包括一些可能涉及隱私的數據,部分地方政府在利用上更為大膽和激進。這個在西方看來是不可思議的
劉松(深圳交委)其實這個就應該政府安排資金,并推動整合。我們現在的問題是,我們總是關心交通的大事,政府的首長卻關心小事。該它做的不做,不該他做的卻讓人無路可走。
李苗裔(日本國立金澤大學)需要有一個城市的技術框架流程和體制機制保障
Suguimin(上海電科)部門間的數據能否整合好,行業(yè)內部的推動及大環(huán)境很重要,就像幾年前我們無法想象打車軟件,但在國內的流行也就幾年時間。這種快速的趨勢對我們是個很好的機會,當然挑戰(zhàn)也很多。深圳推出的共享模式,值得大家借鑒啊,特別是其他地方的政府。
丘建棟(深圳交通中心)深圳市總體創(chuàng)新環(huán)境和條件,確實走得比較快,政治環(huán)境輕松,敢干,能干事。未來交通實驗室,先行先試了。
孫永海(深圳發(fā)展研究中心)深圳數據共享已經取得了很大進步。交通和交警和規(guī)劃已經有了共享。相信隨著技術進步,越來越開放。
Suguimin(上海電科)現在大家主要討論數據的共享,但似乎漏掉了,數據安全問題,以手機數據為例,運營商如何提供數據,才能最大化的保護個人隱私。僅僅手機號加密是否有效?
王忠仁@上海電科_suguimin隱私安全的確是大問題。應該循序漸進。
趙一斌(華為)@上海電科_suguimin大數據技術體系里面,其中一個重要的專項就是數據脫敏,保護隱私。所以不用擔心隱私問題。
感謝以上發(fā)言者分享觀點!
交通先鋒論壇(未來交通實驗室)維護單位:
深圳市城市交通規(guī)劃設計研究中心
廣東省交通信息工程技術研究中心
深圳市交通信息與交通工程重點實驗室
整理/周子益
校核/陳蔚