第2章異分野データ連携のケーススタディ

2–1 実空間データの分野横断的利用による環境問題対策支援

2–1–1 背景・目的

オープンデータの世界的な潮流の中で、実世界を反映した様々なセンサーデータや科学データ、ソーシャルデータのオープンデータ化が進む中、これらを情報資産としてメタレベルで集約し異分野のデータを横断的に相関検索したり可視化したりする技術を研究開発することで、近年のビッグデータ研究の中でも特にデータの多様性を生かし分野を超えたコネクションメリットを生み出すための技術を提供し、環境と社会の複雑な相関性を分析する科学的研究やその対応策を推薦するサービス開発の促進につなげることが期待されている。これらを目指して行われた情報通信研究機構における情報利活用基盤技術の研究開発、及びそれを発展させた実空間情報分析技術の研究開発における取組を以下に説明する。

2–1–2 取組と成果

2–1–2–1 実空間オープンデータの分野横断的利活用技術

情報利活用基盤技術の研究開発では、実世界を反映したセンシングデータ、科学データ、ソーシャルメディアのテキストデータなど、150種類・180万件にのぼる大量かつ多様なオープンデータを情報資産として登録し、これら異分野にまたがる情報資産を統一的に管理するための情報資産リポジトリを構築した。これだけ大規模に異種・異分野のオープンデータを登録したリポジトリは、世界的にも他に類を見ない。これらの情報資産を、種類や分野の違いを超えて横断的に利活用できるようにするために、分野横断相関検索技術Cross-DB Searchを開発した。Cross-DB Searchは、特に実世界の事象・現象について観測・収集された様々な分野のデータを対象に、時間的、空間（位置）的、オントロジ（概念）的に相関性の高いデータ集合を発見する検索技術であり、例えば “森林破壊”というクエリに対し、南米地域では“乾燥化”、アフリカ地域では“土壌劣化”や“砂漠化”、東南アジア地域では“汚染”など地域ごとの特性を強調した相関データを発見することが可能になる。こうした相関検索は、従来のオープンデータアーカイブで主流であるカタログ検索に比べ、特に環境問題に関するデータの探索に有効であり、Cross-DB Searchではキーワードクエリから時空間的に相関の高いデータを発見できるようにする時空間・テキスト疑似適合性フィードバック手法STT-PRF[1]や、時間・空間・オントロジの複合相関クラスタリングなどの基盤技術を開発し相関検索を実現している。このCross-DB Searchを、オープンデータの横断的利活用への期待が大きいオープンサイエンスに応用すべく、NICTが国際プログラムオフィスを務める世界最大規模の科学データアーカイブWorld Data System (WDS)との連携プロジェクトを実施し、Cross-DB Searchの応用システムにより100万件にのぼるWDSデータを対象とした分野横断検索を可能にした。これにより、ある気象現象の周辺で観測・調査された分野の科学データを分野横断的に発見する応用システムを開発し、例えば異常多雨を示すデータの周辺から土壌汚染等や毒性に関するデータを発見するなど、オープンデータを使った環境問題の事例調査などに役立てた（図 2）。

図 2　Cross-DB Searchによる分野横断相関検索

さらに、オープンデータを活用し環境変化と社会の反応の相関を幅広く分析できるようにすることを目指し、異分野実空間データの統合分析基盤（イベントデータウェアハウスシステム）の開発を行った（図 3）。複合イベント解析では、センシングデータの変化パターンを記号化した相関ルールマイニング技術[3]により、例えば、降雨センサーの値が急に変化した地域・時間帯で同じく変化したSNSセンサー（SNSメッセージの発信頻度をトピックごとに計測）を特定し、様々な豪雨被害を表す複合イベントをスケーラビリティ高く発見することを可能にしている。また、相関データ予測技術では、様々な分野のセンシングデータの間の時系列的な相関性をDynamic Recurrent Neural Network (DRNN)を用いて深層学習しデータ予測を行う手法[4]を開発し、例えば、過去のPM2.5データと気象データ（気温、湿度、風速、降雨など）やソーシャルデータ（SNSキーワードの出現頻度）などを入力として、それらの地域ごとの時系列的な相関を学習しその後のPM2.5データを予測することを行う。こうした技術は、従来のように複雑な科学モデルを作らなくても、オープンデータを使って過去に発生した代表的な事例を学習し、類似した状況の発生を予測することが可能になる。

図 3　異分野実空間データ統合分析基盤技術

2–1–2–2 環境対策支援への応用

近年、地球温暖化やヒートアイランド現象により被害が甚大化しているゲリラ豪雨への対策を支援するシステムの開発と実証に取り組んでいる（図 4）。このシステムでは、大阪と神戸に設置されたフェーズドアレイ気象レーダーを用いて積乱雲の発達を示す渦の発生（ゲリラ豪雨のタマゴ）を早期にとらえ、30分以内に地上で50mm/h以上の豪雨が発生する地域を予測しデジタル地図上に可視化する。また、河川に降った雨が流れ込む集水域や、アンダーパスの位置、浸水被害が起きやすい場所を表示したり、事前に登録したメールアドレスに警戒情報を送信したりすることで、ゲリラ豪雨が降る前に警戒や対策を行えるようにしている。現在、このシステムを使ったゲリラ豪雨対策支援の実証実験を神戸市で実施している。その過程で、探知の正確性の水準等の更なる向上はもちろんのこと、限られた人員で効果的な対策を行うためには、豪雨の発生だけではなくその結果生じる様々なリスクも予測することが重要であることが分かってきた。そこで、ゲリラ豪雨早期探知と連動して交通障害などのリスクをリアルタイムに予測するAI技術の開発や、予測されたリスクを回避して目的地までの安全な経路を案内する地図ナビゲーション技術による行動支援技術の開発などに取り組んでいる。

図 4　ゲリラ豪雨対策支援システム（左）とリスク予測に基づく地図ナビゲーション（右）

さらに、我々が新たに着手した環境対策支援のケースでは、衛星やライダー観測などを使って取得された大気環境データをもとに、大気モデルによるシミュレーションを用いて地球規模から市町村、道路レベルまでの大気汚染をスケーラブルに予測する技術[5]の開発に取り組んでいる（図 5）。このような予測技術は世界的にも類を見ず、アジア圏の広域な越境汚染を加味しつつ生活空間の局所的な大気汚染を数時間～数日前に予測することを目指している。また、予測データから健康リスクを推定し、ピンポイントな健康被害予測や対策支援に応用することにも取り組み、将来的には、街の至る所に配備された小型センサーや人々が携帯するパーソナルセンサーからのデータも統合し、よりきめ細やかなリスク予測を可能にすることを目指している。

図 5　マルチスケール・マルチモーダルな大気汚染データの同化予測技術の研究開発

2–1–3 知見・課題

近年のIoTの急速な普及に伴い、2020年までに国内では約10億台のデバイスがネットワークにつながると予想され、多種多様なIoTデータを横断的に利活用し環境対策や健康管理、産業効率化などで高度なサービスが創出されると期待されている。こうした中で、環境や社会生活に密接に関連する実空間情報を適切に収集分析し、社会生活に有効な情報として利活用することを目的としたデータ利活用技術の開発は、今後ますます重要になってくると思われる。また、高度化された環境データを様々なソーシャルデータと横断的に統合し相関分析することで、交通等の具体的な社会システムへの影響や関連をモデルケースとして分析できるようにする技術とともに、これらの分析結果を実空間で活用する仕組みとして、センサーやデバイスへのフィードバックを行う手法及びそれに有効なセンサー技術の在り方に関する研究開発を行うことで、社会システムの最適化・効率化を目指した高度な状況認識や行動支援を実現することが期待される。こうしたIoTデータの横断的な利活用を実現するには、データの取得、分析、行動支援をIoT上で有機的に連携させ、環境対策の目的に応じてシステムを全体最適化することが重要である（図 6）。すなわち、①生活空間に役立つスケールでの環境変化の早期探知や予測、②環境変化と様々なリスクの相関を場所・時間毎に学習・予測、③早期探知と連動しリスクを効果的に回避・軽減する行動支援、④行動支援に沿った実空間データの効果的な収集を繰り返しならが、スパイラル的にシステム全体を最適化していくパラダイムへのシフトが求められる。

図 6　IoTにおける異分野データ連携の在り方

2–2 「はたらく車」走行データによる都市経営の高度化

2–2–1 背景・目的

地方自治体の公用車、各種交通機関の交通車両、物流や点検事業者の民間車両など、日常的に走行頻度の高い業務車両（＝はたらく車）が多数存在する。その走行データは広く利用可能な収集・蓄積・分析等が行われておらず、社会にその価値が還元されていないのが現状である。これらの“はたらく車”に着目し、車両走行情報等のデータが都市経営の高度化や課題解決に利用されることで、１つの車両という資産が様々な価値を生み出すことが期待できる。その実現のためには、データ収集・蓄積の基盤環境や、収集したデータが都市経営に活用されるための分析手法など多様な検討が必要となる。これらの検討により様々な分析モデルが開発されることで、具体的にデータの価値が向上すると考えられる。また、取得データや分析データが公共財化され、都市間での比較が行われたり多様な分析が行われることで、更なる活用場面が生まれ、データ価値＝車両資産の価値が最大有効化していくことが期待できる。

2–2–2 取組と成果

2–2–2–1 はたらく車プラットフォームの開発

走行情報等を収集するための端末として、OBD2端末の開発を行った。GPSセンサーの他に、路面性状の分析に利用するため100Hzの分解能で計測が可能な加速度センサーを実装し、自治体で保有する公用車への取付けを行った。車両には通常、OBD2インタフェースが搭載されているが、適合させるための互換プログラムがメーカーや車種により異なっており、全ての車両へ対応させることは困難である。これを補完するためスマートフォンを用いたセンサーアプリの開発を行い、OBD2では取付けが出来ない車両へのカバレッジ補完を行った。取付けにおいては兵庫県加古川市、神奈川県藤沢市の協力を得て、合計300台の車両への設置が完了した。

取得したデータについて、車両の管理を目的として日毎の走行履歴を閲覧出来るビューワーを開発した（図 7）。この他、各分析手法によって得られるデータを業務に活用するため、特定業務に特化したシステムや分析ビューワーの開発を行う。

図 7　路面劣化状況分析ビューワ

2–2–2–2 日常点検における車両データの有効性

近年、各自治体とも数十～数百台の公用車を保有しており一定の資産となっているが、カーシェアリングの活用等の議論もある。一方、公共施設等総合管理計画（総務大臣がH26に自治体に策定要請）の中で指摘されているように、公用車も市民サービス、社会基盤施設の価値を高めるものとして考えられるとよいように思われる。とくに本研究項目では、日常の公用車のデータから、多様な価値を（ものによっては車種別に）計量可能かどうかを見るとともに、とくに複数の自治体で相対的なばらつきがあるかどうかを調べるという意味で、加古川市と藤沢市で比較を行った。

１）走行状況の可視化

公用車の車種別の軌跡状況を重ね合わせた。1日の範囲ではさほど移動範囲が大きくないものの、複数期間を重ね合わせると概ねのカバー範囲を見ることができた。特に道路パトロール車（赤色）や広報車（緑色）などが広い事が確認できた。（図 8）

図 8　パトロール系車両走行状況

２）稼働率

各車両、10分間の間に10m以上移動したものを稼働として回数をカウントし、稼働率は稼働回数から稼働日数を除算し平均値を算出した。稼働率としては道路パトロール車、公共応急作業車、パトロール車、共有車両などが20%以上とやはり高く、スクールバス、ごみ収集車等、決まった時間にしか稼働しないものの方が6-8%程度と低いようである。

また、加古川市と藤沢市を比較すると、車種分類の粗密の違いはあるものの、加古川市の方が全体的には稼働率は高いことが分かった。（図 9）

図 9　稼働率比較（加古川市vs藤沢市）

３）リンク速度カバー率

両市ともデジタル道路地図協会のDRMデータを用いたところ、リンク数は2～3万の間でほぼ似ている状況である。まずは、朝・昼・夜など時間帯によって道路の込み具合などは異なるので、1時間ごとに各リンク速度がどれくらいカバーできるかという意味でまとめ、9-18時の間のみ、時速1km以上のもののみカウントした。加古川市が2か月間で概ね45%程度、藤沢市は35%程度となっており、台数の多少の違いを加味すると概ね同じ程度のカバー率という事ができる。一方で、時間帯別でカバーすることが難しい場合、一回でも通ればカバーしたと換算すると、ともに80%程度となっている。（図 10）

図 10　リンク速度カバー率（加古川市vs藤沢市）

４）公共施設への立ち寄り率

15分間で同じ場所（300m圏内）に留まっていた場合を対象とし、留まっていた（STAY）と判断した場合、一番近い公共施設に立ち寄ったと判断する。また、公共施設データは、国土数値情報公共施設データ（平成18年度）を利用した。その結果、それぞれの車両がミッションに応じた施設に多く立ち寄っていることが概ね確認できている。（図 11）

図 11　公共施設立ち寄り率（加古川市vs藤沢市）

2–2–2–3 道路保全業務に対するデータの有用性の検討

加速度データから道路保全業務に必要な路面性状値を簡易的に得る方法に関する検討を、加古川市の公用車で取得した走行データを用いて実施した。

１）公用車の加速度データから路面性状値を簡易的に得る手法の検討

車載の振動センサーは、車種や車内の状況により様々な向きで設置される。本研究では、振動センサーから取得される3方向の振動データから、鉛直方向の振動成分のみを抽出する必要がある。また、車両条件の影響も極力排除しなければならない。

そこで、始動直後は静止状態であることを前提に計測開始直後の正常取得データを用いて、重力作用方向を推定し、アフィン変換による鉛直方向の振動成分抽出を行った。

鉛直振動成分から、路面性状値の算出を行い、本検討においては鉛直振動成分の分散値を路面性状値とし、3段階で評価する事とした。

２）道路保全業務に必要な路面性状値の経時変化を得る手法の検討

道路保全業務を行うにあたり、対象となる路面性状の経時変化を捉える必要がある。一方で同じ道路でも走行位置が微妙に異なり、また、同じ場所であったとしてもその位置は一定の誤差を含んでいるため、ピンポイントで路面性状データの経時変化を得ることは困難である。そこで、一度走行した車両の位置情報から、一定範囲（円形：以下エリアブロックと呼ぶ）における評価を集計し、１）で算出した路面性状値の経時変化を捉える手法を試みた。

３）専用検査車で測定したデータ(MCI)との相関性の比較検証

本プロジェクトで算出した振動の大きさ指標について、0.6以下、0.6～0.7、0.7以上にて閾値を設け、専用検査車で測定したデータ(MCI)分布の比率を比較した結果、おおよそ路面性状実測の分布と符合することを確認した。（図 12）

図 12　計測データとMCI相関比較

４）加古川市の道路保全担当部署からのヒアリング

加古川市の道路保全担当部署関係者と町田市の道路行政の事例を基に、公用車の加速度データから路面性状値を簡易的に得る手法の有用性について、協議を行った。協議の結果、財政面、路面性状値の公開等について様々な問題はあるものの、「路面の劣化状況を計測し、可視化することは非常に有用。ぜひ進めてもらいたい」との評価を得た。

以上の検討の結果、車載加速度センサーを用いて、車種に依存せずに路面性状データを取得出来る本検討手法は、日常的な定期健診のレベルでは、実用性を有する精度があると考えられる。また、加古川市の全域に渡る分析評価結果及び、加古川市の道路管理担当者からのヒアリング結果より、本技術を用いた路面性状評価結果は、中期的に道路保全の業務改善、コスト削減に活用できる見込みがあると考えられる。

2–2–2–4 ゴミ収集車におけるゴミ積載の重量分析

運転時の車両振動データからゴミの積載重量変化を簡易的に得る方法について、藤沢市のゴミ収集車で取得した車両走行データを用いて分析を行った。

１）車両走行データによる振動変化抽出方法の検討

ゴミ収集車両は簡易的にバネ-マスの力学モデルで表現することができる。従って、空載状態から満載になるにつれ、車両重量が重くなることにより、車両の固有振動数は低い方へ変化することが想定される。そこで、車両の走行振動データの1成分を用い、走行時間中のフーリエスペクトルの変化の中から重量変化に伴う低振動数への変化をとらえることができれば、運転時のゴミ収集車の積載重量の変化をとらえることができる可能性がある。以下の手順に従って、積載重量変化を簡易的に得ることとした。①1秒毎に計測されるデータからFFT処理により振動数データを取得する。②一般に、車両のバネ上の振動数は10Hz以下であると想定できることから、積載の変化に伴う10Hz以下の振動数データのみを抽出する。③振動データの図心振動数を算出する。④図心振動数を、その時刻の車両重量を簡易的に表す指標として評価する。

２）可視化による重量変化ポイントの確認

１）で検討した振動変化抽出方法を用いて、2015年12月10日計測データを使い、重量変化ポイントの確認を行った。（図 13）

図 13　藤沢市重量変化ポイント

以上の検討により、収集業務のルート上に、重量が大きく変化したと想定されるポイントを多数確認できた。この手法をより詳細に検討することによって、藤沢市で収集している実計測のデータを用いて、どのエリアでどれくらいゴミの量が出ているか分析出来るようになると考えられる。

2–2–2–5 公用車データと都市関連情報の組合せによる防犯まちづくりへの活用展開

１）本取組のアプローチ

短期での防犯性向上が期待できる公用車データ（パトロール車両の移動軌跡）を活用したソフト面からのアプローチを指向し、各自治体の都市構造を踏まえた犯罪抑止モデル（図 14）を構築する。今回のモデル構築等の短期的取組と、防犯まちづくりによる中長期的取組（主にハード面）との連携により、相乗効果が期待される。

図 14　犯罪抑止モデルの構築イメージ

２）犯罪発生要因と予測

「犯罪は予測できる（著小宮信夫教授）」では、機会なければ犯罪なしという犯罪機会論に基づき犯罪の起こりやすい景色を検証し、それを安全な景色に変えることで安全な町づくりが行えることを提案しており、これに基づき加古川市で取得したデータを分析、評価を進める。また、日本等で通常行われている「ランダム・パトロール」ではすべての時間と空間をカバーできず、それぞれの場所が見られているのは1日に15秒という研究結果がある。イエール大学のリース教授の研究では、逮捕の93％は市民からの通報に基づくものであり、実際に「ランダム・パトロール」中で犯罪者を検挙することはほとんどないとの結果も出ている。それに対して、問題指向型パトロールでは大きな防犯効果が期待できる。犯罪発生マップ、未来のホットスポット、問題指向型のパトロールを取り入れ、心理学や社会学に基づいたパトロールに進化させることで犯罪を激減させ、安全な町づくりにつなげることが期待できる。

３）加古川市内の犯罪発生状況

①時間帯別の犯罪発生状況（図 15）では、朝の通学時間帯と午後に集中しており、特に小学生等の幼少人口が街頭に溢れる朝の７～８時台や、午後の通勤通学帯にピークが見られる。朝のピーク時には露出が主な犯罪を占めるが、１５時以降には暴行やちかんが増加している。１９時以降にはちかんが犯罪の半分以上になる。②犯罪発生箇所と年少人口（図 16）では、暴行、ちかん、露出等の犯罪は学校や都市公園の近くで多数発生している。その多くが年少人口の多い地域に集中している一方、年少人口の少ない地域ではほとんど発生しておらず、犯罪空白地域となっている。③小学校区と犯罪発生箇所では、JR線と新幹線に挟まれた地域の多くの学校区がワースト10に入る。④小学校周辺のホットスポットでは、学校や都市公園、年少者人口の高い地区、学校と学校の間、学校と駅の間等で犯罪が起こりやすいホットスポットが存在するようである。物理的死角に入っている場所等がホットスポットとなっている。⑤小中学校と犯罪発生箇所カーネル密度推定では、１７時台までの犯罪は、学校の近辺や、近くに他の小学校がある場合には学校間、また学校と駅の間で多く発生しているように見受けられる。１８時以降はほとんどが学校から離れた街中のバス停や駅の近くで発生しているのが見られる。

図 15　時間帯別の犯罪発生件数

図 16　犯罪発生箇所と年少人口

４）防犯パトロールの現状

現在、パトロールは市を４つのグループに分けて行なわれている。ランダム・パトロールではなく、学校や幼稚園、駅などの防犯上重要と想定される箇所は定常経路に位置付けられている。パトロール経路はいくつかあり日ごとに違う経路がとられるが、犯罪が複数発生した箇所等のホットスポット等も定常的巡回経路に含まれている。犯罪発生回数の多い地区程よく巡回されている。通学路の主要部分を現状の定常的巡回経路と比較すると、通学路のかなりの部分が経路に含まれていないことがわかる。

５）防犯パトロールにおけるルート見直し

地理情報システムの「巡回セールスマン機能」の考え方をベースにして、新巡回経路の検討を行った。巡回セールスマン機能は、起点から全てのターゲットポイントを経由し、起点に戻ってくる最短の経路を作成する。各車両の新巡回経路では重要経由地や犯罪発生場所を経路に含む。最短の経路をとっているため街中などの犯罪多発地域では限られた時間内で効率よく巡回ができる。パトロール地域をより効果的に区分すれば、市内すべてをカバーしながらも歩行者の居ない地域を走行する時間を短縮することができる。ホットスポットをパトロールする時間を確保しやすくなると思われる。走行距離の長い郊外の経路を学校区で分けることにより、距離の離れている２つの重要地点を2つの巡回車両に効率的に分ける。定常巡回経路の総合走行距離は短くなるが、経路以外にも学校区内をすべて巡回する方針に変わりはない。巡回車ごとの走行距離も最初の案より平均化されよりパトロールに重点を置くことができる。

2–2–3 知見・課題

現在までに、車両からのデータ収集、および取得データを用いた分析手法の検討を行い、指標化された数値による評価や可視化の分析により、分析結果が自治体に還元されるモデル案および活用可能性の評価を得た。しかし、自治体が抱える課題はそれぞれに異なっており、データの活用目的は多岐に渡っている。分析手法が自治体の実業務において活用されるためには、自治体の各業務を担当している担当部課室への連携を深め、ヒアリングと効果検証、分析モデルへのフィードバックを行い、効率的にデータを活用するための運用方法をさらに検討していくことが重要である。また、自治体間での比較や外部研究によってデータ価値を高めることにおいて、オープン化基盤との連携について検討を進めることが出来た。実際にデータがオープン化されていくためには、連携手法・データ量・リアルタイム性などの環境要件の他、プローブデータに紐づく属性情報等のプライバシーに関わるデータの扱いも検討していく必要がある。今後は時代の背景に合わせ、データ単体に含まれるプライバシー性も考慮しつつ、運用方法を考えていくことが重要である。

2–3 大規模ドライブレコーダデータに基づく運転者指向サービス

2–3–1 背景・目的

運送業、倉庫業、営業、公共交通機関等、多数の車両および運転者を管理する事業者にとって、安全運転の維持による事故の抑制、省エネルギー運転による燃料費の削減は最も重要な課題である。近年、商用車向けのテレマティクス端末の普及が進み、2013年度の出荷台数は29万台に達すると予測されている（矢野経済研究所2012年調査）。大手事業者ではドライブレコーダの設置を進め、日常運転の振り返りや事故の分析、危険な道路の情報共有等により、事故数を減少させ、省エネルギー化を図る取り組みが行われ効果を上げている。事故防止に関しては、ヒヤリハットや事故のケースにおける詳細なデータ解析に基づく研究が多く行われているが、平常時の運転挙動についてはまだ十分に活用がなされていない。保険業においてはテレマティクス保険と呼ばれる走行距離や運転挙動により動的に保険料を変化させるサービスが始まる等、多様な運転者指向サービスに結びついているものの、走行距離、急ブレーキ回数等、単純な統計情報に基づくサービスが主体であり、ビッグデータが十分に利活用されているとは言い難い。精緻な解析に基づくサービスを行うためには、長期間にわたり多数の車両および運転者のデータを蓄積し、総合的に解析する事が必須であるが、ドライブレコーダデータには、GPS、加速度計、定期的に撮影された静止画像、危険な事態が起きた時間帯の動画など、多種類かつ膨大な情報が含まれる。大手事業者では数千から数万台の営業車両を有しており、通常のデータベースエンジンでは太刀打ちできない規模となる。

本研究開発では、長期間にわたるドライブレコーダデータの解析により運転スタイルの把握や、技術向上、疲労蓄積等を把握することで、運転者のマネジメントを支援するサービスやなど、様々な運転者指向のサービスの実現を目標とし、そのための基盤技術の研究開発を実施している。

2–3–2 取組と成果

2–3–2–1 大規模ドライブレコーダデータの蓄積・処理基盤の構築

本研究開発では、業務用ドライブレコーダの販売事業者である株式会社データ・テックと協力して、大手顧客事業者から数千台、数千運転者規模のドライブレコーダデータを収集・蓄積するシステムを構築し、継続的にデータ蓄積を行っている。収集データは、学術実験用のデータアーカイブとして東京大学生産技術研究所に保管されている。

ドライブレコーダによって収集されるデータの詳細を表 1に示す。0.5秒ごとに1度記録される軌跡データと、何らかの運転操作が行われたときに記録される運転操作データの2種類があり、運転操作データは操作時の代表的な測定値（速度、加速度等）がすべての運転操作について記録される。

表 1 ドライブレコーダによる収集データ

データレコード種類	記録項目
軌跡データ	日時、運転開始時からの経過時間、緯度経度、GPS速度等
運転操作：ブレーキ	日時、運転開始時からの経過時間、緯度経度、速度、前後加速度等
運転操作：ハンドル	日時、運転開始時からの経過時間、緯度経度、速度、方位角速度等
運転操作：交差点右左折	日時、運転開始時からの経過時間、緯度経度、進入前前後加速度、進入速度、方位角加速度等
運転操作：停止	日時、運転開始時からの経過時間、緯度経度、速度、停止時間等

主なデータ収集元は、数千台規模でドライブレコーダの導入を行っている大手運送事業者であり、2015年4月より継続的に、都内16営業所、1400人強のドライバーの運転記録を収集し、現在も継続的にデータ蓄積を行っている。試験的に取得した2営業所のデータを含めると、合計18営業所、2000人強のドライバーの運転記録がアーカイブされた。アーカイブに含まれる運転時間の合計は16万時間弱に達し、世界的に見ても類を見ない大規模な運転操作記録アーカイブの構築に成功した。

また、神奈川県の大手バス事業者からもデータの提供を受けることで合意し、同システムでデータの収集と蓄積を開始した。23営業所、2700人強のドライバーの、1か月分程度の運転記録を試験的に収集し、蓄積システムが問題なく稼働することを確認した。収集対象はバスであり、決まった経路を決まったダイヤで運行する路線バスが主となるが、チャーターバス、高速バスなどのデータも一部含まれている。

運転者指向サービス基盤技術の研究開発

本課題では、運転者マネジメント支援や災害時情報提供サービス等の運転者指向サービスを実現するための交通ビッグデータ解析手法の確立を目指している。そのために必要な検討課題として、運転者指向サービスのひとつの大きな目的である安全運転実現に向けて、ドライバーの運転経歴と運転操作特徴との関係に着目した交通ビッグデータ解析実験、ならびに交差点等での事故の発生とそこでなされる運転操作との関連性に着目した交通ビッグデータ可視化実験を行った。

2–3–2–1–1 ドライバーの運転経歴と運転操作特徴との関係に着目した交通ビッグデータ解析実験

運転者マネジメント支援において重要なアプリケーションのひとつである、安全運転支援サービスへの応用を念頭に、交通ビッグデータを利用したドライバーの安全運転度合いに関する解析手法を検討し、現在の運転操作特徴をもとに過去の事故歴の有無を判定する実験を行った。ここでは、安全運転に関する性質に着目し、運転操作の特徴によってドライバーの過去の事故歴の有無を判定する。機械学習手法を利用し、運転操作時の頻度分布を特徴量として判定器を作成することで、過去の事故歴の有無の判別を試みる。

運送会社の協力により、ドライバーの過去10年にわたる事故履歴と運転経歴を利用することができた。事故履歴のみの情報では、あるドライバーが事故を起こしていなかったとしても、必ずしも無事故期間が長いことを意味しない。例えば、そのドライバーが運転を始めたばかりであれば、事故記録がない場合であっても安全なドライバーである保証はない。そこで、ドライバーの運転経歴を利用し、最も古い運転経歴記録をドライバーが運転を開始した時点とみなして、ドライバーの運転経験年数を推定した。事故の発生率は低く、あまり短い期間では安全かどうかを判断する指標にはならないと考えられるため、ここでは5年以上の運転経歴を持つドライバーを対象に、5年間の事故の有無に関する解析を行った。

図 17はブレーキ操作時の速度、前後加速度、前後躍度の頻度分布を示している。ドライバー全体の頻度分布(系列all)に対し、5年以内に1回以上事故を起こしているドライバー(系列accident 5Y)と、その間無事故だったドライバー(系列safe 5Y)とは、おおむね一致するものの差異が現れる箇所も見られる。運転操作は状況によって大きく影響を受ける。例えば、ハンドル操作時の角加速度は運転速度によって影響されることが考えられる。これを考慮するため、運転操作が行われた速度帯、及びその操作が行われた道路の特徴別に集計して、分布を特徴量化する。

図 17 ブレーキ操作時の頻度分布（上から、速度、前後加速度、前後躍度）

ブレーキ操作時前後方向躍度について、運転操作が行われた時の速度を、10km/h未満、10〜15km/h、…、30km/h以上、の6つの速度帯に分けて集計した時の分布の違いを図 18に示す。Y軸は、事故の有無で分割したドライバーグループごとの、全ドライバーの分布からのずれを表している。速度帯ごとにずれの特徴が異なり、特に低速から中速域において事故ありのドライバーが高い躍度の操作を多く行っていることがわかる。また、右側の軸近くの棒グラフは、集計対象操作のエントリ数を示している。数値目盛りは右側のY軸となる。操作数の割合も速度帯ごとに異なっていることがわかる。このような違いを考慮するために、運転操作を速度帯ごとに分割して集計し、分布を求めることとする。

図 18 速度帯別・ブレーキ時前後躍度分布の平均ドライバーからのずれ

運転操作が行われた場所のGPSデータを数値地図とマッチングすることで、操作が行われた道路に関する情報を得ることができる。数値地図データとしては、東京大学空間情報科学研究センター研究用空間データ基盤より住友電工システムソリューション株式会社による拡張版全国デジタル道路地図データベースの提供を受けて利用している。マッチング方法は、単純に最近傍の道路セグメントを探索するものとした。ただし、最近傍道路からの距離が30m以上の場合は、道路情報なしとして扱った。道路が対応付けられない状況は主に、大規模な施設内の構内道路など、数値地図に掲載されていない道路を走行している場合に発生する。ここでは、特に操作に大きな影響を与えると考えられる特徴として、道路の幅について考慮することとした。図 19は、ハンドル操作時の角速度分布を道路幅ごとに集計したものを示している。上から順に、道路幅不明、13m以上、5.5〜13m、5.5m未満の分布である。道路幅ごとに分布の形が異なっていることがわかる。また、5.5m未満の細い道では、事故ありのドライバーの方が角速度が高い操作を行っている頻度が多いなど、事故の有無に違いによる分布の違いも見て取れる。

図 19 道路幅別・ハンドル操作時角速度分布

本実験では、5年間以内の事故の有無を正解データとし、SVMを用いて運転者を分類する実験を行い、特徴量ごとに分類性能を比較した。利用する特徴量の素性を以下のように変化させ、判定性能を比較した。

年齢・運転歴・性別のみを利用したもの (a)
(a)に加え、ゴールド免許の有無を利用したもの (b)
(b)に加え、速度帯別に分類した運転操作分布を利用したもの。
(b)に加え、速度帯と道路幅の組み合わせで分類した運転操作分布を利用したもの。

それぞれの場合で得られたF値を図 20に示す。従来知られている年齢・運転歴・性別のドライバー属性のみを用いた場合、高い分類性能は得られていない。これは、対象としているドライバーが全て運転を業務としており、専門的な教育を受けているためであると考えられる。ゴールド免許の有無に関する情報を追加したとき、F値は若干改善するが、やはり同様の理由でそれほど高い性能ではない。運転操作の分布に関する特徴量を追加することで、F値は0.7強まで改善する。さらに道路特徴も考慮することで、最高0.82のF値が得られ、運転操作分布に着目することで過去の事故履歴を高い精度で判別できることが示された。今後は、運送会社やバス会社における運転者管理や運転者教育にこうした運転者特徴分析の結果を活用していく予定である。

図 20 ドライバー判別の精度

2–3–2–1–2 大規模ドライブレコーダデータのインタラクティブ可視化技術

運転者マネジメント支援において重要なアプリケーションのひとつである、安全運転支援サービスへの応用を念頭に、ドライブレコーダから得られた大量の車両の運転操作の情報と道路特徴データを用いることで，道路のリスクを把握することを目的とした可視化探索システムを構築した。本システムでは、指定した条件を満たす運転操作が集中している箇所を見つけ、その箇所での運転操作の詳細な分析を行うことを目的としている。分析・可視化システムの全体図を図 21に示す。探索の流れとしては，まず操作発生頻度を表すヒートマップを用いて、運転操作が集中している箇所を広域的に探す。この際、フィルタリングを行い、対象を絞って探索することも可能である。詳細に分析したい道路がある場合、操作発生地点のドットマップを用いることで、道路のどこで運転操作が行われたかを知ることができる。各運転操作には操作前後3 秒の車両の位置情報が紐付けてあるため、操作前後の車両の軌跡も合わせて表示することで、車両がどこからどこへ向かう時に操作が行われたかが分かる。さらに、ある道路で記録された運転操作全体の傾向を知りたい場合、その道路を地図上で選択することで、その範囲で記録された運転操作の分布をヒストグラムで表示する。また、道路を複数選択することで、それらの範囲で記録された運転操作の分布を比較し、傾向の違いを分析できる。加えて、道路状況を詳しく知りたい場合はインタフェース上のボタンを押すことで素早くストリートビューを見ることができ、実際の道路状況を把握可能である。本システムは、運転操作から道路の潜在的なリスクを発見しそれを運転者への注意喚起や道路改善につなげていくために活用していく予定である。

図 21 運転操作分析・可視化システム

2–3–3 知見・課題

本研究開発では、大学、ドライブレコーダメーカーとその顧客企業の3社が密に連携をとることによって、大規模なドライブレコーダデータの蓄積とそれを活用したサービス基盤技術の開発が行われている。大学にとっては、普通では扱えないような大規模な実データによる学術的実験が行えるメリットがあり、ドライブレコーダメーカーには今後の製品開発に活かせる知見が得られるというメリットがある。顧客企業には、実際の運転者の安全運転推進に実験結果が活用できるというメリットがあり、各組織に相互にメリットのある連携が組めていることが成功の鍵となっている。また、運送会社からバス会社へと横の展開ができたことも大きなポイントである。

こうした連携研究においては、データホルダの持つ比較的小さな課題からスタートすることが重要である。今回、運送事業者やバス事業者の主要な課題は安全運転であったため、運転者の解析からスタートし信頼関係を構築した上で、徐々に公共性のある道路の危険性分析へと展開していくことができた。

本研究開発での知見を、他の分野で生かすことを考えると、やはりデータホルダの持つ課題に興味を持ち、解くことができる研究機関とのマッチングをサポートする何らかの組織が必要であると思われる。今回我々は偶然の出会いにより良い連携を組むことができたが、このような連携を続けて生み出せるような枠組みが求められる。

2–4 スマートシティを実現するソーシャルビッグデータ利活⽤・還流基盤

2–4–1 背景・目的

そこに住んだり滞在したりするだけで、自治体や企業等様々なステークホルダーの生産する高付加価値情報の力が、その人の生活の質(QoL)を向上させてくれる街や都市を、オープン・スマートシティという。従来のスマートシティで目指されている都市エネルギーや交通渋滞の解消といったシティオフィスの視点からの都市リソースの最適化機能だけでなく、実空間情報を含むオープンデータの利活用を進めることによって、住民の視点からも、住民のQoLの向上に資するサービスや災害時の安心・安全の保障のためのサービスといった付加価値の高いサービスを容易に実現可能となるソーシャルビッグデータ利活用基盤が重要となってきている。

そこで慶應義塾大学では、東京大学、東京電機大学、NTT等と協力して、都市のインフラストラクチャと人流をリアルタイムにマネジメント可能とすること、すなわちリアルタイム都市マネジメントを可能とすることを目的として、ソーシャルビッグデータ利活用・還流基盤（以下、同基盤と呼ぶ）の研究開発を行い、その有効性を検証するための実証実験をNICTの保有する技術や藤沢市と連携して実施している。同基盤は、大きく分けて（1）ソーシャビッグデータ収集技術、（2）ソーシャルビッグデータ保護・増幅・配送技術、および（3）異種データ融合・都市状況把握・未来推定技術で構成される（図 22）。また、神奈川県藤沢市を主なフィールドとして、集中的な実証実験を進めている。

図 22　ソーシャルビッグデータ利活用・還流基盤の構成

2–4–2 取組と成果

ソーシャルビッグデータ収集技術については、慶應義塾大学SFC研究所（以下、SFC研究所）を中心として、(1)公共車両を活用して藤沢市全域の環境情報を細粒度に収集するオートモーティブセンシング、自治体職員の協力を得て大量のラベル付き画像データを収集する参加型センシング、および大量のウェブページからデータを獲得する仮想センシングの各技術から得られる多種多様なデータをリアルタイムに配信している。

オートモーティブセンシング

　藤沢市には、環境省が設置した大気汚染常時監視測定局が5局存在するものの、43万人の市民一人一人が自らの周辺の大気汚染状況を細かく知るためには、それらの間を埋める新しいセンシング技術が必要である。国内外の幾つかの都市では、公共交通機関の車両にセンサーを搭載し、走行経路上の環境情報を収集する取り組みがなされている。例えばスペインのサンタンデール市では、路線バスにCO2センサー等を搭載してバス路線上の環境情報を収集している。SFC研究所では、市内全域の環境情報をくまなく収集するために、路線の限られる公共交通機関車両ではなく、清掃車にセンサーを設置して、環境情報と位置情報を最大1秒あたり100回、リアルタイムに収集している[8]。

　図 23に、センシングデバイスの実物と清掃車に装着した例を示す。当デバイスは、照度、紫外線、加速度、地磁気、位置情報（緯度、経度）、およびPM2.5 を計測するセンサーを搭載しており、USB ケーブル経由で二進数のデータを出力する。一組のデバイスは上述したセンサーに加え、清掃車のシガーソケットから電力を取るアダプター、USB ケーブルからセンサー情報を入力してネットワークに出力するLinux 端末であるOpenBlocks BX1 、および携帯電話網を介してインターネットに接続するためのSIM カードとで構成される。

図 23　センシングデバイスと清掃車への装着例

藤沢市環境事業センターの協力を得て、上述したセンシング装置を、藤沢市内を走行する清掃車に装着した。センシング装置は、清掃車のシガーソケットから12V 電源を取り動作する。環境事業センター職員との事前の打ち合わせより、清掃員がセンシング装置の操作を全く行わなくてもよいこととするよう要求があったため、清掃車のエンジンON ・OFF とセンシング装置の電源ON ・OFF とが同期するようにした。

収集したデータは、環境事業センター等での清掃車位置把握や、藤沢市環境部での環境情報可視化を行うために、地図上にリアルタイムに表示する。図 24にそのアプリケーションのスクリーンショットを示す。1秒あたり100回のセンシングを行っているため、走行中の清掃車であっても、その位置や環境情報を細粒度に表示可能である。

図 24　環境情報可視化アプリケーション

参加型センシング

SFC研究所と神奈川県藤沢市は、参加型センシング技術とタブレット端末を活用してゴミと資源の収集事業を効率化する「みなレポ」システムの運用を平成28年10月より開始した。「みなレポ」は、市職員の行政業務に関わる都市データの「収集」と「理解」を、市職員が持つスマートフォンやタブレット端末を通じて市職員自身が収集するとともに、収集したデータのラベル付けを行なってもらい、蓄積されたデータに対してリアルタイムな分析を行う。これにより、（１）これまでデータ化がなされていなかった市職員の業務上の発見・知識をビッグデータとして知の情報財とし、（２）収集したデータを業務関係者で迅速に共有することで行政業務の効率化を行うと共に、（３）蓄積されたデータを分析し知識とすることで新たに発生した事象に対する理解・対応を瞬時に行うことを目的としている。

具体的には、藤沢市のゴミ・資源収集などの業務に関わる、「集積所の管理」、「集積所の不適正排出」、「不法投棄」、「落書き」などの情報を、写真やコメントともに収集、担当職員間のみでセキュアかつ迅速に共有される。また、水害時の｢道路の冠水｣、｢通行止め｣などの危険情報の集約に活用できると考えられる。藤沢市環境部の職員は、iOSおよびAndroidデバイスにインストールされた「藤沢みなレポ」アプリケーションを用い、行政業務上遂行に重要となる市内の情報を収集・共有できる。同アプリケーションでは、収集する情報を、その属性情報や詳細なコメント、対応の緊急レベル等と紐付けることが可能となっている（図 25）。収集された情報は業務上即時に活用されるとともに、蓄積・分析を行うことで、知の情報財とした様々な活用を予定している。また、収集されたデータはリアルタイム・センサーデータとして即座に職員内で共有され、Webビューワーを通じ詳細情報の閲覧、情報に関する議論や、対応が必要なタスクの管理などを行える（図 26）。

図 25　藤沢みなレポアプリケーション

図 26　藤沢みなレポWebビューワー

仮想センシング

実空間に種類を問わず大量のセンサーを設置することは現実的には困難であり、また、いかなるセンサーハードウエアを用いても検出することのできない値（たとえば日毎の魚の漁獲量や種類など）も存在する。そこでSFC研究所では、ウェブページ上のIoTデータを仮想的なセンサーノード（仮想センサーノード）を用いて獲得し、アプリケーションへ配送する機構として、オープンデータ・リセンシング技術を構築している[9]。本技術は、Sensorizerという技術として実現を行っている。1つの仮想センサーノードは、1つのウェブページを対象として動作し、1つ以上の仮想センサーを含むことができる。各仮想センサーはウェブページ内のほぼ任意のエレメントからデータを獲得する。例えば、図 27に示す店舗の待ち時間のページでは、店舗名、待ち時間、待ち人数等の各エレメントにそれぞれ仮想センサーを割り当てられる。この場合の仮想センサーノードは、それら複数の仮想センサーノードを含む複合オブジェクトであると考えることができる。仮想センサーノードには表 2に示すメタデータが割り当てられている。従って、各仮想センサーが対象とするエレメントは、仮想センサーノードの対象ウェブページURLと、仮想センサーの対象エレメントXPathとでウェブ空間内で一意に識別される。

図 27　ある店舗の待ち時間を示すウェブページ

表 2　仮想センサーノードのメタデータ

仮想センサーノードは、http://www.sfcity.jpで公開されている仮想センサーノード構築プラグイン（図 28）を組み込んだ任意のChromeウェブブラウザ(以下、単にブラウザと呼ぶ)上で作成でき、後述するSensorizerサーバ上で動作する。仮想センサーノードの作成は、ブラウザ上の仮想センサー生成モジュールを用いて手動、自動双方で行える。これまで100,000個以上のWEBページのセンサー化を行った。また、取得したデータの種類も多岐に渡り、株価、ガソリン価格、漁獲量、電車の遅延情報、献血量、チラシ・広告数、アルバイト募集件数、不動産価格・部屋の家賃、駐車場の埋まり方、渋滞情報等多様なデータがセンサーデータストリームとして得られている。今後、これらのデータを流通させ、都市のコンテクスト分析に役立てて行く予定である。

図 28　Chromeブラウザ用プラグイン

ソーシャルビッグデータ保護・増幅・配送技術についてはまず、通信プロトコルXMPPを用いて多様なセンサーデータを流通させることが可能なプラットフォームを構築している。これまでに、XMPPサーバとしてOpenfireをベースとして実装したSOXFire[7]を構築し、運用を開始した。また、アプリケーションライブラリとして、Java、JavaScript、Objective-Cの各言語でAPIを構築した。図 29に概念図を示す。実社会ビッグデータの利活用に際しては、データを取得するためのセンサー設置者およびWEB 情報提供者と、データ利用者は異なることが通常である。この場合、データ利用者がデータを利用する際に、そのデータがどういったデータであるのか（単位は何か、データ幅は何か）知る必要がある。すなわち、センサーデータそのものに加え、そのセンサーデータが何であるのかを表現するメタ情報を付与した上で、データを流通可能とすることが必要である。現在、センサーデータ流通プロトコルとしてMQTT やCoAP 、RESTful 形式など多様なプロトコルが提案・利用されているが、本研究では上記の要求を満たすため、拡張が容易で形式化されたXML を用いるXMPP を採用している。本プラットフォームは、XMPP 上のpublish/subscribe 機構を用いてセンサーデータを分散配信するSensor OverXMPP 機構( 以下、SoX と呼ぶ) を用いて実現されている。SoX では、センサーデータとメタデータの分離、柔軟なアカウンティングなど多様な機能を実現しており、海外研究機関スマートシティプロジェクトUrbanOpus (カナダ)、ClouT（欧州）、⼤学CMU（⽶国）との連携を通じて、利用者が拡大しつつある。

図 29　SOXFireの概念図

次に、参加型センシングのためのプライバシ保護技術として、Perturbation技術を用いたモバイルセンシング技術の研究開発を、東京大学を中心として進めている。Perturbation技術を用いた手法はノイズ付加後のデータを大量に回収し、特定の処理を施すことで真のデータ分布を復元できる。一方、この復元精度はデータ数に依存するという性質を持つため、所望の復元精度を満たすのに必要なデータ数を確保するためにユーザへ参加を促すインセンティブ付与が必要となる。そこで、こうしたインセンティブ付与手法の実現を目指し、測定対象のモデルを用いて、復元後データから現在の復元精度を推定する手法を開発した。Perturbation技術を用いた場合、データ回収者は元々の真のデータ分布が分からないため、厳密な復元精度を知ることができない。しかし多くのモバイルセンシングで測定対象となる気温や騒音、大気汚染物質濃度等の環境情報は、時間的、空間的な相関をもつあるモデルに従うことも多いと考えられる。このような場合、あらかじめ測定対象のモデルが既知であれば、そのモデルを利用することで真のデータ分布を知らなくても復元精度を推定できると考えられる。現在の復元精度を推定することで所望の復元精度を満たすために必要なデータ数との対応付けが可能となる。

　また、センシングインフラを最適化する時空間内挿技術の研究開発を、東京大学を中心として進めている。時空間内挿技術の応用例として、携帯電話の通話データ（CDR）から人の移住を発見する時空間データクラスタリング手法が挙げられる。これまでに、CDRデータから人物の居住地の変化を発見できるかどうかを確認し、このタスクを実行するアルゴリズムを開発した。最初に人口統計の観点から滞留変化の検出を定式化し、その後にMoveSenseと名付けたシーケンシャル時空間クラスタリング手法を提案した。提案手法をを検証するために16万人のユニークユーザの35億以上の通話記録を含む大規模なCDRデータセットを使用し、提案手法が71%、68%、72％の平均検出率を実現することを示した。

異種データ融合・都市状況把握・未来推定技術については、日本電信電話を中心として異種データ融合分析技術およびオンライン予測技術の研究開発を進めている。前者では、複数種類の異種データから、異種データに跨る特徴的な潜在パターンを自動抽出するための汎用技術を開発し、時空間実データへの適用実験により、提案技術の有効性を検証した。後者では、人流・交通流、大気中の化学物質濃度などの空間、時間に渡って変化する時空間データを対象としたオンライン予測のための汎用技術開発を行っている。

　また、東京大学を中心として人の流動を再現し、異常検出する技術の研究開発を進めており、災害時における短期的な人々の流動予測を行う手法の確立に向けて、災害行動モデルを用いた短時間のエージェントシミュレーションによる避難状況等の推定を行うことを目的に、これまで当機関が研究を進めてきた過去の人々の流動データを基礎としたデータ同化手法により、対象都市全域において推定・再現を行った。

　平時の人の行動パターンと異なり、災害時の人の行動は予測が困難である。一方、携帯電話の通信履歴等を使えば人の位置を把握することが可能だが、災害時には、データが断片的にしか得られない可能性がある。そのため、災害時の人の行動をモデル化して得られる推定値と、断片的な観測値を組み合わせて高精度な推定を得る手法が必要である。そこで、災害時の行動シミュレーションに基づくシナリオを100種類程度生成し、得られる観測データとの比較をして決定した最適パラメータを用いて次の時間の推定を行う。マルチエージェントシミュレーションを複数実行することにより多数のシナリオを生成する技術と、複数のシナリオと観測値を組み合わせて高精度な推定結果を出力するデータ同化の技術からなる（図 30）。

図 30　異種データ未来推定技術

2–4–3 知見・課題

これまでの取り組みを通じて、データそのもの、データの収集と流通、あるいは社会実装のそれぞれの観点で以下のような課題が明らかとなってきた。

　まず収集したデータそのものについて、それがあらかじめ予想できない不特定の第三者へ流通していくことを前提とすると、以下のような点が課題となる。

メタデータの充実

未知の第三者から入手したデータが何処で生成され、どれくらいの時間にわたり、また何を表すのか、といった素性を詳細に明らかにできる必要がある。

クオリティ

各値がどのようなセンサーで計測されたのか、センサーはキャリブレーションされていたのか、またセンサーの検出限界値はどの程度か、といった事項を明らかにすることによってデータそのもののクオリティを明示できる必要がある。

トレーサビリティ

上記と関連し、未知の第三者から入手したデータがどこで生成され、どのような加工を施され、どのような経路をたどってきたものなのか、といった過程を詳細に明らかにできる必要がある。

データの真贋性保証

未知の第三者から入手したデータが「本物」であり、一切の改竄を含まないことを証明する技術が必要である。

次にデータの収集と流通について、以下のような点が課題となる。

データ収集

IoT利用、人による参加型センシング、あるいはウェブページからの仮想センシングといった手法のどれを活用するにせよ、データソースの多様化・豊富化によって、より大規模なデータ収集を実現する必要がある。

データ流通

エッジ、フォグ、クラウドコンピューティングを有効に連携させ、各種処理を最適実行した上で、センサーデータの検索等の高度なオペレーションを実現する必要がある。またアプリケーションからの要求と流通データとの間で、更新頻度や量等のマッチング技術が必要である。

社会実装においては特に、図 31のような情報に関連する産業の分類に着目し、情報第二次産業に寄与するような取り組みを推進し、民間企業への積極的な技術移転や情報提供が必要である。すなわち、実空間から直接的に情報を獲得するセンシング技術は情報第一次産業と位置付けられ、第三者から情報を仕入れてそれを処理・加工し新たな情報を生産するのが情報第二次産業である。近年では機械学習技術の発達によってそのような産業の基礎が整いつつあることから、今後は、課金を伴った実空間情報の流れを創出し、実空間に関するデジタル情報を財として流通させるプラットフォームが必須となる。

図 31　都市情報産業の分類

2–5 地理空間情報アーカイブ

2–5–1 背景・目的

地理空間情報分野における公共データの利活用は、世界的に見るとオープンガバメント政策以前からも、欧米を中心に国土空間基盤データ（National Spatial Data Infrastructure: SDI）の整備と関連した取組として長年議論されてきた。他方、各国のオープンデータ政策を受け、2009年頃より米国および英国では政府のデータポータル上で地理空間情報がオープンライセンスとして積極的に整備されてきた。例えば、米国ではData.govと連携する地理空間情報に特化したプラットフォームとして、連邦地理データ委員会（Federal Geographic Data Committee: FGDC）がGeoplatformの構築に着手し、英国では英国陸地測量部（Ordnance Survey）、さらにEUではヨーロッパ連合空間情報基盤（INSPIRE）がそれぞれ地理空間情報のオープンデータ化に向けたデータや仕様の議論を踏まえ、その整備を本格化するようになってきた。特に近年、地理空間情報分野におけるオープンデータ関連で注目すべき点は、2013年6月に開催されたG8ロックアーンサミットにおける「オープンデータ憲章」である。その理由は、憲章の条文に地理空間データ（特に国レベルでのマップ）が高価値なデータセットとして明記されることに加え、地球観測や交通といった地理空間情報と関連の深い諸データも同様に重視されたことにある。

他方、地理空間情報など公共・インフラ的特色を持つオープンデータは、行政機関のインフラ維持管理に対する透明性を担保するツールであると同時に、オープンガバメントの基本項目である市民参加や協働といった、市民を介したデータ活用に向けたデータ整備と共有にも積極的に目を向ける必要がある。例えば、オープンデータの普及啓発を推進する世界的な非営利団体OpenKnowledgeによるOpen Data Index2015において、最も高いスコアを獲得した台湾では、Data.go.twを開設し、基盤地図情報のみならず不動産取引に関するデータや、市単位の行政区ごとの地理空間情報を数多く提供している。また、シンガポール政府が提供するData.gov.sgでは開発者向けの特設サイトが構築され、API単位でオープンデータが活用でき、タクシーの空き状況や交通混雑状況、PM2.5のセンサーデータといった動的な地理空間情報に特化したデータ提供を行っている（図 32）。

図 32　台湾およびシンガポールにおける地理空間情報のデータポータル

以上を背景に、本稿では主に国レベルでの取り組みとして、多種多様な主体の有する地理空間情報をプラットフォーム上からワンストップで提供するとともに、その活用を広く普及させるようなシステム構築および機能検証の取り組みとして「G空間プラットフォーム」をとりあげる。また、その開発成果を受けて2016年11月より運用が開始された「G空間情報センター」についても解説する。

2–5–2 取組と成果

2–5–2–1 G空間プラットフォームの開発

地理空間情報の利活用を促進するため、地理空間情報の流通を促進するため、日本政府では各種取り組みを進めている。本項では異分野データ利活用の特徴的な取り組みとしてのG空間プラットフォームについて述べる。

2–5–2–1–1 地理空間情報の流通の促進に向けた政策

2007年、日本政府は「地理空間情報基本法」を制定し、地理空間情報の活用の推進に関する施策を総合的かつ計画的に推進することを決定した。同法に基づく、第二期「地理空間情報活用推進基本計画」（2012年3月27日閣議決定、計画期間：2012～2016年度）において、「地理空間情報の共有と相互利用の推進のため、国や地方公共団体など、多様な主体によって整備された地理空間情報の相互利用が可能となる仕組みを構築し、我が国における地理空間情報の共有・提供を行う情報センターの構築を目指す。」とされた。

総務省では、G空間情報とICTの徹底的な利活用に関する方策等を検討する、総務大臣主宰の「G空間×ICT推進会議」「Ｇ空間×ＩＣＴ推進会議」報告書（2013年6月）において、「Ｇ空間情報の整備・更新、公開、流通の促進の観点から、官民が保有するＧ空間関連データの共有・提供等、Ｇ空間関連データを円滑に組み合わせて利活用できるＧ空間オープンデータ・プラットフォームの構築に取り組む。」と提言した。

国立研究開発法人情報通信研究機構は、2014年度及び2015年度、G空間プラットフォームの開発及びその検証作業を総務省より請け負った。（図 33）

図 33　 G空間プラットフォーム機能概要

2–5–2–1–2 G空間プラットフォームの開発において検討した課題とその課題の解決

地理空間情報の円滑な流通と利活用を期待するにあたり、G空間プラットフォームの開発事業において検討した技術的及び制度的な課題は、今後、地理空間情報以外の異分野データの連携を目指すにあたり、有用な知見となると考え、以下にまとめる。

技術的な課題

課題１　配布元が複数

国土地理院、国土交通省、各地方自治体、民間事業者など、地理空間情報の所有者は多岐にわたると同時に、多くの場合自ら持つ情報を自ら配布することになり、情報を検索し、入手するハードルが高い、情報の所在が不明といった課題があった。

G空間プラットフォームでは情報の所在を一元的に扱う一方、情報自体をプラットフォーム運用者に渡すかどうかは選択可能（情報へのリンクのみをプラットフォームに登録）とすることで、著作権等知的財産の取扱いに関する懸念に配慮しつつ、一元的に情報を検索、入手可能とした。

課題２　測地系の違い

地理空間情報は測地系を適切に扱う必要がある。測地系が異なる場合、同じ緯度経度であっても異なる場所を示すことがある。一方で、測地系が異なっても違和感なく情報同士は重ね合わせが可能であるため、複数の地理空間情報を重ね合わせる場合には特に注意が必要である。

G空間プラットフォームではメタデータとして測地系を指定する項目を加え、明示的に測地系を規定することとした。またプラットフォーム上で測地系の相互変換を可能としたことで、利便性の向上を行った。

課題３　異なるデータ形式

地理空間情報を表現するにあたり、ベクタ形式かラスタ形式かという根本的な違いに加え、デジタルデータだけでも、GeoJson、shp、xml、Geotiffなど複数あり、また緯度、経度、項目のようなCSVなどのテキスト形式もある。併せて、pngやjpegのような画像形式やpdf形式もある。さらには電子化されていない紙として保管されているものもある。

情報の流通を促進することを目的とするG空間プラットフォームとしては、特定のデータ形式にこだわることなく、多くのデータをプラットフォーム上で取り扱えることが望ましい。一方で元形式のまま配布しただけでは利活用は進まない。そのため、CSV形式のデータをGeoJson形式に変換する機能、画像やPDF形式のデータに対して、位置情報を付与する機能等の開発を行っている。

課題４　情報の信頼性

G空間プラットフォームを開発していく中で、情報の信頼性についての課題が明らかになった。ここでいう信頼性とは、単にその真偽だけではない。地図の場合、必ず縮尺が定められている。その縮尺の範囲内では正しい情報であるが、その縮尺を超えた領域での利用については保証されるものではない。また情報は作成された瞬間から古いものとなっていく。古い情報もその情報が必要な人にとっては正しく、価値がある情報であるが、現時点の情報を必要とする者にとっては、誤解を招くものとなる。加えて、情報を作成したものは情報の用途を想定した上で作成するが、その用途を超えた範囲での情報の利用は、保証し得ない。さらに自動運転やドローンのような最終的に人間が確認しない範囲での地理空間情報の利用は、今後の大きな課題となりうる。

信頼性が問題となりうるかについては、利用者ごとのケースバイケースとしか言えない。そこでG空間プラットフォームでは集合知を利用することとした。各データに対して利用者がコメントをすることが出来るように機能開発を行った。情報の利用者が利用した内容やその際の注意点をコメントすることで、利用の際に心得るべき点について情報を得ることが出来る。併せて、情報を利用した際の責任範囲についても、情報提供者は明記しておく必要がある。

制度的な課題

課題５　情報の保存

オープンデータ・プラットフォームを運用するにあたり、情報保有者が情報の提供に躊躇する理由の一つが、情報をどの場所に置くかである。プラットフォーム上に置く方がより利便性は高くなるものの、情報自体の制御権をプラットフォーム運用者にゆだねてしまうことに躊躇する情報提供者は多くない。またビッグデータかつリアルタイムデータの際にすべてのデータをプラットフォーム上にコピーするまたはデータの流通にプラットフォームを必ず介在させることは、プラットフォームの運用費用の面から現実的ではない。

G空間プラットフォームでは、情報自体を登録するだけでなく、情報へのリンクを登録することも可能とした。リアルタイムデータやビッグデータに関しては、リンク経由でアクセスすることで、プラットフォームに負荷をかけずに情報の流通を可能にしている。

課題６　個人情報の匿名化手法

例えば、NTTドコモのモバイル空間統計のように、個人情報を匿名化するにあたり、空間及び時間方向に統計化・離散化を行う匿名化手法がある。この場合、個々のプライバシーを保てる一方、観光客の周遊の分析には使いづらい、また、例えば土砂崩れが起きた際に、その場所に在圏者がいたとして、本当にその場所に人が埋まっていて、救助しに行くべきかという指標には使いづらい。一方でパイオニアのスマートループで取得するカープローブデータは、自宅周辺はマスクされているものの、それ以外の場所での空間、時間情報は秘匿化されておらず、実際に走行したデータとして利活用でき、また“線”データとして保存されているため周遊情報も得ることができる。

このように、利用者のプライバシー保護は最優先でなされるべきではある一方、秘匿化手法の違いにより、情報の利活用の可能性は大きく異なることは念頭に置かれるべきである。また今後はIoTの発展により、リアルタイムに極力近いタイミングでの情報流通が可能になることを鑑みると、現時点での秘匿化が十分ではなくなり、取得から公開までの時間に応じて秘匿化の手法を考慮する必要が出てくる。

2–5–2–2 G空間情報センター

　G空間情報センターは、前年度までに国の機関で継続的に検討されてきた運用に関する基本検討と、前節で解説したG空間プラットフォーム構築によるシステム面からの検討を受け、2016年度は国土交通省国土政策局「Ｇ空間情報センター運用による地理空間情報の円滑化及び利活用モデル構築事業」の一環として実施されることとなり、その事業者として（一社）社会基盤情報流通推進協議会（AIGID）が運用実証を行なうこととなり、2016年11月24日に正式公開となった。

G空間情報センターでは、様々な主体が様々な目的で整備している地理空間情報の有効活用や流通促進を図るため、G空間プラットフォームの構築においても重視された利用者が必要となる地理空間情報や関連する情報がワンストップで検索入手できる仕組みを有していることはもちろん、地理空間情報に関わる研究開発やデータキュレーションなど、イノベーション創出に向けた各種サービス・事業を展開することも計画されている。そのため、G空間情報センターがめざす社会的機能として、①G空間情報（データ・アプリケーション）の流通支援、②政府・自治体向け「情報信託銀行」、③G空間情報の研究開発、④災害対応情報ハブ、⑤G空間オープンソースハブ、からなる5つの基本項目を掲げてサービスが開始（あるいは計画）されている（図 34）。このうち、①については、国や県などで公開されているオープンデータ以外にも民間企業から提供されている有償コンテンツが広く取り扱われていることから（表 3）、G空間情報センターのプラットフォーム上でオンライン決済や購入相談を行なう機能も実装されていることが特徴で、G空間情報のデータ・マーケット・プレイスを目指すとするこれまでの検討が具体化されている。またG空間情報の最大の特徴である地図（空間）上での視覚化や重ね合わせについても、データプレビューやマップ機能といった諸機能を通じてGISソフトウェアを使わずともクラウド上で操作可能である。加えて、有償コンテンツの多くは、携帯電話位置情報等に基づくメッシュでの混雑度データや、カープローブ情報等による通行実績データといった時空間単位での動的データであり、これらを政府機関から提供される基盤的な主題図と合わせることで、多種多様なG空間情報のデータ特質を、専門家以外でも直感的に把握することができ重要な機能の一つと言える。

図 34　G空間情報センターのサービス内容
（出典：G空間情報センター紹介パンフレットより）

表 3　G空間情報センターの主な取り扱いデータ

図 35　G空間情報センター上でのデータの重ね合わせ（マップ機能）
（出典：G空間情報センターWebサイトより）

2–5–3 今後の課題と方針

地方自治体に散在している地域情報は、データ駆動型の地域政策立案の基礎資料としての価値を有している。これまでのG空間プラットフォーム及びその成果の基に成立したG空間情報センターにより、産官学民で蓄積されている地理空間情報と組み合わせることで、有効活用することが可能となった。加えて、現在、国レベルでも進められているオープンデータ2.0や、官民データ活用推進基本法をめぐる議論など、今後ますます地方自治体に散在する公共データの利用価値は高まると考えられるとともに、その多くに位置情報が付与されている地理空間情報であることから、これらの公的データの多くがよりオープンに流通されイノベーションを起こす起爆剤になることが期待されているところである。

他方で、平成28年４月に発生した熊本地震など大規模災害の頻発する我が国において、データ駆動型の地域政策を多様な主体が迅速に取り組むことが求められている。そのためには、ハザードマップのような静的な災害関連情報はもちろん、①空間や時間変化を有する動的なG空間情報を用いるために機械的に手軽に使えるようなデータの流通形式（G空間情報センターでも取り入れられているタイルマップサービスや各種APIなど）の確立、②流通を迅速に促すようなデータライセンス、特に公共データについては可能な限りオープンであること、③複雑で巨大なG空間情報を地域ごとに手軽に扱えるよう空間的に内挿化することやデータ分割する効率的な技術の確立、といったより高度な技術的課題の解決を行うとともに、実際の利活用時に問題となりうる制度的な課題の解決のためには、G空間情報センターが長けている地理空間情報の利活用に関する知見が有用であると考えられる。

2–6 地域に密着したデータ利活用の実践

2–6–1 地方自治体の現状と背景

　平成26年冬の豪雪で、山梨県では、立ち往生する車や孤立した集落が発生し、約一週間に及び住民生活がマヒした。また近年、温暖化現象によって引き起こされる、ゲリラ豪雨、豪雪と呼ばれる短期間に成長した積乱雲から発生する自然現象に対して、自治体としてどう備えるかを自治体の都市政策に生かし、都市計画課、防災課、危機管理課等の部署と情報共有を行い、住民や来街者に対して避難誘導を実施する必要がある。

　本研究では、山梨の盆地である甲府市周辺と、都心部での中野区と、特徴的な2つのモデルエリアで実証実験を行った。まず、甲府市は山間部特有の突発的なゲリラ豪雨が発生するので、この予測はかなり困難であり、高精度な情報収集と横断的な広域気象情報、さらには地域ごと状況を集約しデータ解析することが重要である。今回は甲府盆地内に約10ヶ所の気象センサーを配置して、Wi-SUNセンサーネットワークでデータ収集して、これを用いて降雨レーダーの精度向上を行った。その結果、積乱雲が発生しやすい場所や、その時の諸条件の相関性がわかってきた。また、山梨大が持っている甲府盆地の水理モデルを用いて、上流域でどの程度の降雨があると下流域での水位がどうなるかの近未来予測が可能であることもわかってきたので、これら処理系のリアルタイム化を図っている。

　また、中野区では駅周辺のセンサーネットワークと区に入ってくる都市河川のデータを用いてアラートを出す仕組み作り、それを住民にどう告知するかを、工学院大、東北大、宇都宮大、東京電機大、芝浦工大、早稲田大の６大学と中野区産業振興推進機構、中野区とで研究会を立ち上げ、災害発生時の避難誘導のあり方や、電気や食料の優先的な供給について検討中である。加えて中野サンモール商店街で測定した人の動線データを処理し、災害発生時に人をどのように誘導したらよいか、また平時には商店街の活性化のためにどのようなイベントを行えば効果があるか等について検討していく予定である。

2–6–2 取り組み

2–6–2–1 気象データの収集

　気象データについては、市町村単位の気象情報がすでに様々なメディアで提供されているが、立地条件や日あたり・風向などにより、区内でも場所によって気象状況は変わってくる。このため、特に、天候に左右されやすい屋外空間でかつ来訪者の多い場所などにおいて、ピンポイントな気象情報を提供することは有効なものであると考える。実際に、屋外テーマパークや野球場・サッカー場などにおいては、すでにメディア等でピンポイント天気予報が提供されている。

　中野駅北口再開発エリアにある中野四季の森公園は、区民をはじめとする来訪者の憩いの空間であるとともに、休日を中心にイベントが数多く開催されている場所でもあるため、この場所における気象情報をリアルタイムに提供することは、利用者の利便性・快適性の向上に資するものである。また、同公園は広域避難場所にも指定されているため、災害時の避難情報としても役立つものである。

計測項目については、今年度の実証実験では温度・湿度のみを計測したが、雨量や風速・風向などのニーズも高いことが予想される。また、熱中症や光化学スモッグ等の大気汚染情報などについても安全性の観点から検討すべき項目である。これらを踏まえ、計測項目についても引き続き検討を進めていく。

　なお、中野区では、「中野区防災気象情報」として、中野区のピンポイント天気予報、区内５か所での観測雨量、区内１０か所での河川水位及び区内５か所での河川ライブカメラ映像、区内の注意報・警報等の情報をインターネット上で公開している（図 36）。これらに加えて、防災科学研究所が開発した降雨レーダー（XバンドMPレーダー）ネットワークの情報を基に、それに中野区内で頻繁に氾濫する都市河川である神田川、善福寺川の水理モデルを作成した。現在は1時間当たり５０ｍｍの降雨までは耐えうるので、それ以上だった場合、どこが浸水するかをシミュレーションし、これらを防災計画に反映させていき、また住民にどうのように告知し、危険が迫ったときの避難誘導に関しても検討していく。

図 36　中野区防災気象情報サイト画面
中野区防災気象情報（http://dim2web09.wni.co.jp/nakanocity/pinpoint/index.html）

2–6–2–2 人流データの収集

　中野駅周辺は、中野四季の都市（まち）の開発により昼間人口が約２万人増加し、朝夕の通勤・通学者の多い時間帯を中心に混雑が見られる。災害時には、駅前を中心に滞留者や帰宅困難者が多数発生することが想定され、これらの対策が急務となっている。

2–6–2–2–1 商店街へのセンサー機器の設置

　ビーコン型での計測方式は図 37、図 38のように、人が携帯したスマートフォンが商店街を動くと、そのスマートフォンの動きを時系列的に記録して、その滞在時間や、商店街からの離脱率を計測するものである[10][11]。計測装置は図 38のように商店街支柱に固定して、LTEで集計してM2M基盤で解析処理を行う。

図 37　ビーコンでの人流解析

図 38　中野サンモール商店街に設置されたビーコン装置

2–6–2–2–2 計測結果

図 39に、ビーコンによる一日の計測結果を時間ごとに集計処理した結果を示す。　

図 39　ビーコン装置による解析結果

2–6–2–3 今後の展望

　ビーコン型の人流計測は、スマートフォンのWi-Fi機能かブルートゥース（BLE）を利用して、スマートフォンの位置をみて、それがどう動いたかを検出するものである。この方式はスマートフォンもしくはブルートゥース（BLE）がONになっていたら確実に計測が可能だが、スマートフォンを持っていて、しかもONになっている必要がある。しかし、近年パブリックフリーWi-Fiの普及が進み、中野でも2015年11月から中野Free Wi-Fiもスタートし、Wi-FiがONになっている確率は飛躍的に上がっていると思われる。この保有率に関しては今後実計測を行い、全体数を推定する。

なお、図 39では3/25の計測例だが、朝～17時まではブルーで表示している通過客が多く、17時～21時までは商店街にある程度の時間滞留している人数が多い傾向がわかる。土日の休日でもパターンが代わるので、今後継続的にデータを収集し、複数日の比較や天候との相関をみる予定である。

　さらに、ビーコンの実証実験を発展進化させて、Wi-Fiアクセスポイントの接続データを用いて、羽田、成田に降り立ったインバウンド観光客が日本の観光地をどう回遊しているのかを可視化し、地方自治体やDMO（観光協会、コンベンション協会等）の観光政策に反映させていくことを目的に、全国的なスキームを交通事業者やキャリア系Wi-Fi接続事業者、ケーブルテレビ事業者を広域に情報収集するプラットフォームを開発し、地方への送客や、ビジネスモデルを検討中である。

2–6–3 知見・課題

　本研究では、災害時及び平常時の両方で活用される地域情報の収集・提供を目指しており、特に地域経済活性化を目指すと、平常時における活用方策が重要となってくる。そこで、平常時における人の流れや混雑度などの人流データの活用例を以下に記す。

通勤・通学者や来訪者に混雑度情報を提供することにより、ピーク時間を避けたり、違うルートへの迂回を促したりすることを可能とし、安全性や快適性の向上を図る。
イベント等の来場者数や混雑状況の把握に役立てる。
来訪者の数や滞留状況等を把握することにより、経済活性化のためのマーケットデータとして商店街や企業などの経営戦略などに活用する。
人流の傾向や数を把握し、地域活性化やまちづくりに関する自治体の政策形成に役立てる。

これら平常時の活用も視野に入れ、計測方法や計測箇所について、引き続き実証に向けた検討・検証を進めていく。

　また、取集したリアルタイムなデータから、どの情報をどのように住民に出すか（時間ごと、日ごと、月ごとの集計処理）、管理画面や住民用画面をどうするか、その際の表示方法はどうするかなどを検討する必要がある。

　さらに、このWi-Fiアクセスポイント、BLEの接続情報を用いた人流解析は、個人情報保護法や、Wi-Fiアクセスポイント運営のガイドラインに沿った形で、Wi-Fi接続データの収集を行う必要があるので、この点を整理する必要がある。

前へ次へ

第2章 異分野データ連携のケーススタディ