城市軌跡大數(shù)據(jù)是個怎樣的“富礦”

近年來,隨著無線通信的廣泛應用,車輛GPS、手機信令、交通卡等空間行為大數(shù)據(jù),被用來非常精確地揭示人類行為移動模式,從而解釋城市的社會經(jīng)濟環(huán)境。如今,可利用的空間行為大數(shù)據(jù)已經(jīng)包括:移動電話數(shù)據(jù)、車輛軌跡數(shù)據(jù)、智能卡數(shù)據(jù)、Wi-Fi和藍牙數(shù)據(jù)、社交媒體用戶數(shù)據(jù)等。
這些空間行為大數(shù)據(jù),為確定人類的生活模式提供了一個非常有前途的來源。由于大數(shù)據(jù)可以記錄連續(xù)的空間行為,且隨時間和空間精確變化,研究使用這些數(shù)據(jù),可以細致揭示城市居民個體不同空間和時間下的交通出行模式。
近幾年,包含交通智能卡和手機運營商數(shù)據(jù)在內(nèi)的城市軌跡大數(shù)據(jù),正在國內(nèi)外成為科學研究和商業(yè)應用的熱點。隨著數(shù)據(jù)處理、模型設計、統(tǒng)計驗證方法的不斷成熟,大數(shù)據(jù)正被不斷應用到城市生活不同場景的實踐中。
交通智能卡數(shù)據(jù)
交通智能卡(Smart card)最初應用于公共交通的自動收費系統(tǒng),如公共汽車、地鐵和停車場。智能卡系統(tǒng)也被引入商店、餐館和醫(yī)院。如今,幾乎在世界各大城市都有自己的智能卡系統(tǒng)。
雖然交通智能卡的主要目的是收集收入信息,但同時也產(chǎn)生了大量非常詳細的交易數(shù)據(jù)信息。這些數(shù)據(jù)既可以幫助公交系統(tǒng)的日常運營,也可以用于相關網(wǎng)絡的長期戰(zhàn)略規(guī)劃。可實現(xiàn)三級管理的各種用途:戰(zhàn)略(中長期規(guī)劃)、戰(zhàn)術(服務調(diào)整和網(wǎng)絡發(fā)展)和運作(客流統(tǒng)計和績效指標)。
一般,智能卡包含信息包括卡ID、交易數(shù)據(jù)(時間、類型和車費)、旅行數(shù)據(jù)(出行模式、時間、票價、車站和路線ID)和個人識別數(shù)據(jù)。因此,智能卡中的數(shù)據(jù)可以用于出行需求預測或個人出行模式檢測。然而,不同于基于距離的票價,智能卡數(shù)據(jù)沒有登記行程,僅有出入站地點。因此,使用智能卡數(shù)據(jù)的一個主要挑戰(zhàn),是如何識別一個完整的旅行軌跡、估計各種多通道傳輸?shù)目赡堋?/p>
曾有學者使用倫敦智能卡數(shù)據(jù)中的個人旅行信息,揭示城市的結構,提供新的方法來模擬城市系統(tǒng)的流量;基于北京市14個工作日的地鐵刷卡客流量數(shù)據(jù),將195個地鐵站點分為居住導向型、就業(yè)導向型、職住錯位型、錯位偏居住型、錯位偏就業(yè)型、混合型、綜合型及其他型8種不同類型;使用上海申通地鐵數(shù)據(jù),對世博會期間上海軌道交通客流特征進行統(tǒng)計分析。所有這些實證研究表明,智能卡數(shù)據(jù)對理解城市系統(tǒng)的動態(tài)(各種旅行行為和交通規(guī)劃)非常有效。
國內(nèi)外學者在公共交通中使用智能卡數(shù)據(jù)進行的研究,主要分為三大類:戰(zhàn)略層面上,涉及長期的網(wǎng)絡規(guī)劃、客戶行為分析和需求預測;戰(zhàn)術層面上,重點是地鐵時刻表調(diào)整、縱向和個別的出行模式;業(yè)務層面,研究相關的供應和需求指標,以及如何完善智能卡系統(tǒng)可操作性。一旦智能卡搭載上持卡人資料,比如采用使用者實名制登記,其所呈現(xiàn)的信息的社會人口屬性會更強。
手機運營商數(shù)據(jù)
無論在國內(nèi)還是國外,移動手機的運營商數(shù)據(jù),作為一種軌跡數(shù)據(jù),也已被廣泛用于各類研究和商業(yè)應用。
手機數(shù)據(jù)有兩種類型:基于信元塔的數(shù)據(jù),主要包含小區(qū)塔流量和切換信息;基于移動電話的用戶數(shù)據(jù),通常包含匿名用戶ID、小區(qū)塔ID,以及電話、位置、日期和時間的信息。目前,出于數(shù)據(jù)類型和研究目的的不同,用來處理和分析手機數(shù)據(jù)的方法,包括傳統(tǒng)的數(shù)據(jù)挖掘技術,如聚類方法和基于規(guī)則的算法,新技術有可視化工具和復雜的機器學習方法。
手機數(shù)據(jù)在出行交通行為研究中最基本的應用是檢測逗留(訪問)和提取出行次數(shù)。通常情況下,結合連續(xù)定位數(shù)據(jù)和歷史定位數(shù)據(jù)、計算個體在每個區(qū)域的定位頻率,可以檢測該用戶的停留情況。只需要手機使用的四個時空點,就能定義一個人的活動痕跡。
用戶的交通方式,可以使用蜂窩網(wǎng)絡的數(shù)據(jù),根據(jù)連接信號強度的波動變化率,做較粗略的估計。目前通過這類數(shù)據(jù)可識別的出行方式,主要包括停止、步行和機動車出行方式。
范圍更廣的交通方式,可以使用手機內(nèi)置的GPS和運動傳感器,采集更準確的定位和運動狀態(tài)信息,判斷行駛速度和可能的方式。例如,利用智能手機內(nèi)置GPS和加速度傳感器收集的數(shù)據(jù),可以確定五種運輸方式,包括步行、跑步、騎自行車、停止、開車;區(qū)分八種出行方式,包括汽車、自行車、公共汽車、電車、火車、地鐵、步行、摩托車等。應用于上述數(shù)據(jù)分析的分類技術,包括決策樹分類器、隱藏的馬爾可夫模型、基于規(guī)則的分類器、人工神經(jīng)網(wǎng)絡、貝葉斯分類器等。
城市動力學研究早已開始大規(guī)模使用手機數(shù)據(jù)。曾有一個名為“移動風景”的項目,使用手機數(shù)據(jù)可視化展示了米蘭城市在時間和空間上的演化。“實時羅馬項目”,則使用羅馬的手機和出租車數(shù)據(jù),描繪了城市脈搏。隨著手機運營商數(shù)據(jù)的部分開放,國內(nèi)對手機信令的研究近幾年開始增多,主要集中在城市規(guī)劃和交通領域中。比如,基于手機信令,對軌道交通早高峰客流和居民的職住通勤關系、大都市圈規(guī)劃進行研究。
傳統(tǒng)的出行行為研究很難做到這樣幾乎覆蓋到整個人口的樣本。而手機數(shù)據(jù)最獨特、最吸引人的特點,就是它們的普及規(guī)模。由于其為研究者提供了縱向和個別的大量細節(jié),因而非常適合用來研究城市管理問題。(感謝陳瑤博士為本文提供學術支持)



