人と地域にあたたかい社会システムを求めて


ホーム>公益事業情報>米谷・佐佐木基金>過去の授賞式>第11回米谷・佐佐木基金>研究報告講演

公益事業情報

米谷・佐佐木基金

研究報告講演

井料隆雅氏

井料 隆雅
神戸大学大学院 工学研究科 教授

【 研究題目 】
交通システムのダイナミクスを理解し制御するためのデータ活用理論
〜ポスト・ビッグデータ時代の交通工学〜

はじめに

はじめに

 

 米谷・佐佐木賞の受賞から1年後ということで、進捗の報告をさせていただきます。タイトルは「交通システムのダイナミクスを理解し制御するためのデータ活用理論――ポスト・ビッグデータ時代の交通工学」です。

 二つの中身がございます。交通システムが日々どのように変化していくかというダイナミクスとデータの活用、そして、そういうダイナミクスで動くことを前提としたうえで、ビッグデータをどのように扱っていくべきかという二つのトピックです。

研究の背景と目的(1)

研究の背景と目的1

 

 研究の背景と目的を簡単に説明させていただきます。交通システムは、教科書的には均衡という概念を使って、混雑のなかでドライバーの経路選択が釣り合っている状態で計画をするのが伝統的な手法だと思います。ただし、いわゆる交通量配分で使っている交通流モデルは簡便なもので、実際の交通システムにはボトルネックがあったり渋滞したりします。そのなかで複雑なネットワークを考えて計算をしていくと、渋滞のパターンはなかなか安定しません。このような安定しない状況がよく起こることが、いろいろ研究していて分かってきました。このような状態ですと、均衡を前提にして計画・運用することには限界があります。そこで、どのようにして計画・運用するのかということを一つの課題として考えました。

研究の背景と目的(2)

研究の背景と目的2

 

 交通システムのダイナミクスを理解して、それを役立てるには、対となるデータが必要なわけですが、そのデータとしては時間軸方向の分布網羅性が高いデータ、いわゆるビッグデータが有用だと考えています。

研究課題

研究課題

 

 一方で、ビッグデータについては最近いろいろ言われてはいますが、実は制約も多いということがあります。知りたい情報を入手できるとは限らないとか、個人情報保護など社会的制約も大きいこともあって、いろいろな制約があります。

 これらの問題の解決に向けて、交通システムの動学的理解と制御のために有用なデータ活用理論を構築することを目指すために、二つの課題を設定しました。一つは「匿名性を担保したデータの活用のための方法論」、二つ目は「非集計的交通行動と集計的な動学モデルの関連を解析するための理論体系の構築」です。これら二つについて、研究の進捗を報告させていだきます。

課題1 − 匿名性+データの活用(1)

課題1_匿名性+データの活用1

 

 課題1は匿名性とデータの活用です。非集計的な追跡データは個人情報になりえます。ですから一般的に、いろいろな集計をしたり劣化させることで、個人情報を消そうということが行われています。そのような処理によってデータの質はどうしても劣化するわけですが、質の劣化が最終的に交通計画の運用にどのような影響を与えるのかということと、また、質の劣化によって個人情報の漏洩のリスクは減るわけですが、そのトレードオフについて明らかにするのが一つの目標でした。

課題1 − 匿名性+データの活用(2)

課題2_匿名性+データの活用2

 

 短期的な将来の交通量予測を目的とするのであれば、個々人の行動を追跡したデータは実はあまり有用ではないのではないか、ということを統計学的に示した研究がありました。 なぜかと言いますと、追跡したデータというのは過去のデータで、将来のことをかならずしも語ってくれるわけではありません。将来を語る力には限界があります。我々が将来のことについて計画したり運用したりするときに過去のデータに頼ることは、ロジックとしては適切なのかということがあります。

「前駆行動」

前駆行動

 

 それなら将来のデータを用いればいいではないか、ということです。将来予測に有利であろうということで考えたのが、この「前駆行動」という言葉でした。実際には将来のデータをタイムマシンで持ってくるわけにはいかないので、かわりにこの前駆行動というものをとってきます。

 具体的には、利用者が実際に交通システムを使用する直前に引き起こす行動について何らかのかたちでデータがとれれば、それによって将来予測ができるのではないかということです。過去のデータを一所懸命に追いかけるよりも将来のデータ、将来そういうことが起こる前に前駆的に起こる行動を見たほうがいいのではないかと考えて、このような言葉を作ってみたわけです。

前駆行動データ活用の検討(1)

前駆行動データ活用の検討1

 

 昨年の今頃に研究していたことで、そのあとのITSシンポジウムで「限定的な利用者行動追跡データに基づく利用者数の短期間予測問題」というタイトルで発表させていただいております。

 この問題では、ネットワークのなかで、時刻という意味で動的に、0、1、2、3というように時間とともに流れていく交通流を考えて、その交通流がある時間においてあるリンクでどれだけ流れるかということを、一つ前の時間のデータから予測することを考えています。

 これは統計学的に揺らぎます。ポアソン分布に従って、この経路交通量は揺らぐのです。ただし、この期待値はきちんとします。この期待値をきちんとするには何らかの過去の追跡データが必要ですが、これについては平均化することによって個人情報が消えている集計的なデータと考えます。

前駆行動データ活用の検討(2)

前駆行動データ活用の検討2

 

 ここで考えている問題は、ある時刻t−1のリンク断面交通量――これは前駆行動データの一種とここではしていますが、これを観測し、時間帯tのリンク断面交通量を予測する問題を考えるということです。少し前のデータを使いますが、ただし、ここで見ているのはリンクの断面交通量ですから集計的なデータで、これには個人情報が入っています。

前駆行動データ活用の検討(3)

前駆行動データ活用の検討3

 

 図のようなネットワークだった場合に、このリンク2番と3番の交通量がある時刻のときにどうなるかを見るとき、その時刻の一つ手前で、一つ上流のリンク1の交通量を見ればいいだろうということは想像がつきます。

 もしリンク3がなくて、リンク1とリンク2が二つ並んでいるだけなら当然それでおしまいですが、二つに分岐しているので、どちらに流れるかわかりません。ただし、確率論で計算すると、いくらかの数学的操作は必要ですが、このように二つに分岐している場合でも、このリンク1の観測を条件として、一つ後のリンク2と3の交通量をより高い精度で推定することが可能であると言えます。

前駆行動データ活用の検討(4)

前駆行動データ活用の検討4

 

 このようなやり方を使って、一つ前の時刻のデータを使って精度改善がどれだけできるか、ネットワークをランダムに発生させて、どのような条件でどれだけ改善するか表にしてみました。

 数字は誤差の相対的な改善の度合いです。1は何も改善していませんが、0.13は誤差が1割ぐらい減っています。表の色が濃い部分ほど改善している状況です。条件にもよりますが、この前駆行動データが予測誤差の減少に有効であることを数値的に示したということです。

前駆行動データ活用の検討(5)

前駆行動データ活用の検討5

 

 先ほどの例と昨年の春に発表したものとを比較したところ、過去の非集計的な追跡データから予測するよりも、集計的でも何でもよいので将来の行動に直接リンクしているデータを使ったほうが精度向上に寄与することを結果として示しました。

 ちなみに、習慣的な行動を分析するには、過去の行動履歴は当然いいわけです。たとえば私が毎日大学に行っているとか、私は毎週東京に帰ったりしていますので、そういうことは予測できると思いますが、たとえば今日、京都に来ることは、恐らくだれも予測できません。私が京都にこの前来たのは3月です。

 では、それをどうやって予測すればいいかというと、前駆行動を見ればいいわけです。前駆行動というのは、この場合はたとえばメールです。私が京都に住んでいる方とやりとりしたメールを見れば、この人は京都に行くんだなということがわかります。このように、過去のことを見るよりも前駆行動を捉えるほうが、私の将来の行動予測には効いているということです。

 頻度が1週間に1度ぐらいだといいのですが、実際の交通システムには、結構、低頻度な利用者がいます。阪神高速さんのETCの統計データを分析した結果を昨年も発表させていただきましたが、結構、低頻度の利用者の寄与が大きいのです。そういう人の行動は過去のデータで予測できないので、これを一所懸命に分析したところで、交通システム全体の利用者の予測精度を上げるには限界があります。それよりも将来に直結したデータのほうが、集計的でも何でもより有効であるということを、例として示させていただきました。

過去の追跡データの価値は?

過去の追跡データの価値は?

 

 過去の追跡データはもちろん価値がないわけではありません。平均的なOD需要を知るためや、経路交通でも使っていましたし、交通行動の一般的な法則をとるという意味でも大変、有用なデータです。

 ただし、過去のデータは結局、何らかの平均化がされています。パラメータ推定というのは結局のところ平均化ですので、それによって個人情報は消えることが期待できます。ですから、我々が過去のデータを有用に使うときには匿名性についてはすでに解決されていると考えていいということです。その意味では過去の追跡データは匿名性という意味でも問題なく価値を発揮できると考えられるわけです。

 ただし、実際に生のデータからどう集計するか、集計したあとのものが残っているか残っていないかについては心配がありますので、それについてはランダマイゼーションによって匿名化を担保する方法を提案しているところです。こちらはまだ実装はしていなくてコンセプトの提案だけです。

課題2:集計と非集計

課題2_集計と非集計

 

 もう一つの課題について、説明させていただきます。先ほどのように集計的なデータをいろいろな理由で使うことが多いと思われますが、そうするとモデルも集計的にならざるを得ません。集計的なモデルは操作性も高いなどの利点は多いのですが、何らかの非集計的な行動モデルによる根拠がほしいというところがあります。そこで、複数の主体のミクロ的な相互作用から、既存のマクロ的な動学モデルの導出を試みるということが、二つ目のテーマでありました。

情報収集行動と動学モデル(1)

情報収集行動と動学モデル1

 

 ここで実際に行ったのは、一人ひとりの利用者の日々のミクロな情報収集行動を、まず細かく定式化することです。実は、定式化してゲーム理論における「集団ゲーム」の考え方を応用して、それをミクロなかたちに変換するということを行いました。当たり前に聞こえるかもしれませんが、テクニカルには非常に細かいところが多くて、大変、苦労したところもあります。資料の右下に小さく論文タイトルを書いていますが、なぜ小さく書いているかというと「submitted to」なので小さく書いています。「Transportation Research Part B」に出しています。もうレビューの2回目で、もうすぐ通るかなというところまでは来ているはずです。

情報収集行動と動学モデル(2) − ミクロな情報探索および選択モデルを定式化

情報収集行動と動学モデル2

 

 このようなフローチャートを使って、ミクロな一人ひとりの情報探索――他の人から口コミで聞こうという情報探索に基づいて、どのように選択肢を次の日に変えるかという日々の選択行動を記述しました。この一人ひとりは、選択を変えるときに、「ランダムにでたらめに一つ選択肢を試してみよう」とするか、あるいは「他の人から聞く情報を探索して従ってみよう」とするか、いずれかを行うとしています。

 この探索については、一度に何人から情報を得るか、つまり「一度に全員から得る」か「一度に一人からしか得ない」か、または「その中間」なのかについてパラメータとして設定できるようにしてあります。これは探索モデルとしては簡単すぎるのですが、そのあとのマクロな理論式の変換を考えて、簡単に抑えています。

情報収集行動と動学モデル(3) − マクロな動学モデルを数学的操作により導出

情報収集行動と動学モデル3

 

 ゲーム理論でよく使われている動学と対応をどのようにとれるかを解析し、数式に示しました。

情報収集行動と動学モデル(4) − 混雑などの相互作用がない場合の計算例

情報収集行動と動学モデル4

 

 実際に数値計算しますと、一度に一人しか聞かないような場合には、いわゆるS字のカーブを描きます。最初はあまりいい目的地やいい店、いい選択肢は普及しないのが、途中で非常に速く普及して、最後にまたなだらかになるという、よく見られるカーブが出てきます。一方で、一度にたくさんの人から聞くと、最初に一気に普及していって、あとはなだらかになるという指数関数的な挙動になるということ確認しています。

情報収集行動と動学モデル(5) − ボトルネック混雑が存在するときの出発時刻選択問題は均衡解に収束するか?

情報収集行動と動学モデル5

 

 また、ボトルネック混雑、いわゆる出発時刻選択問題と言いますが、混雑を避けるスケジュールの費用と混雑のトレードオフをとるようにドライバーが毎日出発時刻を変えているような問題を日々繰り返したら、それは均衡解に収束します。そこで、このモデルで均衡解に収束するかを試しています。

情報収集行動と動学モデル(6)

情報収集行動と動学モデル6

 

 実はこれは収束しなくて、どのくらいの人から同時に情報を集めるかという探索行動のパラメータによって、結構、結果が違います。たとえば一度にあまり聞かない場合には、あまり安定せずに均衡解からかなりはずれてきます。一方で、多くの人から聞くと均衡解にかなり近くなります。収束はしていないのですが見かけ上、かなり近いところに収束するという結果が得られています。

 ミクロな人びとの行動がマクロの結果にどう影響するかについては、まだここには数値計算が入っていますが、マッピングには一定の程度で成功したということです。

今後の方向性

今後の方向性

 

 今後の方向性については、前駆行動というのがまだ抽象的ですので、もっと一般化し、具体的にしていきたいと思います。先ほど申しあげたメールの事例なども考えていますが、どのようにモデルとして落とし込むか、そもそもどのようなデータが現実に取得できるかをもう少し固めたうえで、将来予測への活用プランを見せていきたいということが一つ目のテーマです。

 二つ目のテーマにいては、情報収集行動という限られた行動がありましたが、人間が意思決定するときにどのようなことをしているかをもう少し一般化して、それを集計化するとどのようなモデルが出るかということは見てみたいところです。

 あとは、論文を書いているときにレビュアーから、「集団といっても実際の人数はかなり少ないこともあるので、それによる揺らぎもきちんと扱ったらどうなのか」というコメントもあったので、このような点も見ていこうと思っています。

 最終的にはこれらを結合して、データを用いて交通システムを動学的に制御するための理論を確立したいと考えています。道のりはまだ長いところもありますが、ここ1年の成果をさらに発展させていこうと思っています。ありがとうございました。

  • 公益事業情報TOP
  • 米谷・佐佐木基金TOP
  • 選考結果
  • 過去の受賞式
関連リンク

情報化月間はこちら


ページの先頭へ