データは使わなきゃ意味が無い--役所に眠っている“オープンデータ”で街をより良くしよう

Why open data is still too closed | Ben Wellington | TEDxNewYork

データアナリストのベン・ウェリントン(Ben Wellington)氏は、行政による市民への情報公開(オープンデータ)について分析。日々の暮らしに関する統計データをただの数値で終わらせないために、市民が情報を正しく利用する方法を語ります。

たくさんの統計データ

ベン・ウェリントン氏(以下、ベン):6000マイル(※1マイル約1.6キロメートル)の道路、600マイルの地下鉄線路、400マイルの自転車レーン、0.5マイルの路面電車道路。

これらの統計は、ニューヨークのインフラ情報です。ご覧の数値は市役所より発表されています。例えば、運輸省はおそらく皆さんに外国まで何マイルかかるのかを伝えるでしょう。MTA(Metropolitan Transportation Authority)は何マイルの地下鉄路線が街にあるのかを自慢するでしょう。ほとんどの行政機関は統計データを公開しています。こちらは今年のタクシー・リムジン委員会の公式報告です。

このデータから、例えば約13500台のタクシーが、ここニューヨークにあることが分かります。面白いでしょ? 皆さんはこれらの数値がどこから来たか、考えたことがありますか? まず市の行政機関の職員が「この数値は誰かが必要とするかもしれない。市民の皆さんが必要とするかもしれない」と考えます。そして未編集のデータを集計し、レポートとして報告します。

データは市民の疑問解決に活用される

ここに問題があります。彼らはどうやって市民の疑問を知るのでしょうか? 私たちは沢山の疑問を抱えています。大げさではなく、私たちは市に対する無限の質問がありますが、市ではこれらを処理することができません。対応策も講じられておりません。

私が思うに、政策担当者はそれに気づいていて、2012年にブルームバーグ(Michael Bloomberg)市長が法案を通しました。最も意欲的で包括的なオープンデータの為の法律です。多くの方法において、彼は正しかったと思います。直近の2年間では1000ものデータセットを私たちのオープンデータポータルに発表しました。素晴らしいです。

これ(タクシー・リムジンの統計データ)をただタクシーの台数を調べる為だけに利用はしないですよね。私たちにはさまざまな疑問があります。例えば「ニューヨークのラッシュアワーは、ずばり何時?」このデータはただの数字に過ぎません。

ニューヨークではGPSレコーダーが市街を巡回しており、データが蓄積されています。そこでデータを調べ、プロットを作成してみました。「1日のタクシーの平均速度」です。

ご覧の通り、深夜から午前5:18にかけて速度が上昇しています。そこを起点に速度は下がり続けて……午前8:35に最も遅くなり、平均時速11.5マイルになります。平均時速11.5マイルで市街を走り続け……日中ずっとですね。日中ずっとこの速度です。私に言わせると、ニューヨークにラッシュアワーはないですね。「ラッシュデー」です。

(会場笑)

これは交通のインフラ業者にとってとても興味深い内容だと思います。もしニューヨークで朝4:45にアラームをセットできるなら必要ありませんが。

(会場笑)

こちらはFOIL(Freedom of Information Law)リクエストの送信フォームです。

タクシー・リムジン委員会のWebサイトにあります。これまで知りたい情報をここからオーダーすると、市の職員から「ハードディスクをオフィスまで持ってきてください」と言われ、持って行って担当者に渡し、さらに5時間以上待つことでコピーしたデータが手に入りました。クリス・ウォン氏はこれらをオンライン化したいと考え、今ではオンラインで手に入るようになりました。

GPSレコーダーはとてもクールですよね。しかし以前はわざわざハードディスクを取りに行くしかありませんでした。たしかに、直接取りに行けば手に入るデータなので「一般公開されている」と言えますが、これではダメですよね。本当の意味での一般公開はされていません。

この地図は「ニューヨークの交差点危険地帯」です。

自転車事故のデータを基にしています。赤いエリアが危険地帯です。マンハッタンの南東に事故が集中していることが分かります。多くの自転車利用者が南東から橋を渡り北上しているからですね。他のエリアはどうでしょうか? ウィリアムズバーグ地区とクィーン地区のロールズ通りが赤くなっています。こういった実用的なデータこそ、私たちが必要としているデータです。

情報取得をスムーズにする専用プログラム

データは突然現れたりしません。ところでどれくらいの方がこのロゴを知っていますか?

手があがっているのが見えます。それではファイルをダウンロードしたことは? もっと手があがっていますね。データはPDFで保管されています。何百ページにも分かれているPDFファイルです。ニューヨーク市警察によって管理されています。

この何百というデータを手動でダウンロードするには、100時間から200時間をかけるか、ジョン・クラウス(John Klaus)氏になるしかありません。ジョン・クラウス氏は言いました。「手動でダウンロードなんかしていられない。プログラムを作ろう」と。

そして対NYPD専用プログラム、Band Aidが作られたのです。Band AidはNYPDのサイトを常に巡回していて、PDFダウンロードを自動で行い、無駄を省いた上でリスト化、ネットに公開しています。これで誰でも先ほどような地図を作れます。

数値だけでは知りえない情報

全ての事故がこのファイルに入っています。何ページのPDFファイルでしょうか。このファイルにアクセスできることは素晴らしいことですよね。しかし私たち市民に届けるにはPDFファイルのままでは十分ではありません。私たちが市役所職員になったつもりになれば、より良くできるんです。

彼らのような有志によってデータは公開されていますが、まだまだ大量のデータがPDFのまま「埋葬」されています。例えば、犯罪に関するデータはまだPDFのままです。それだけではありません。ニューヨーク市の予算もPDFのままでしか閲覧することができません。

そして予算に関わる議員も、PDFのままでしか閲覧できません。つまり議員たちは自分たちが投票する予算を分析することができないのです。私たちは市役所職員になったつもりになれば、より良くできるんです。全てのファイルが「隠されて」いるわけではありません。例えばこちらの地図です。

これは「ニューヨークの最も汚い下水図」です。この地図の作成にあたり、私は下水内の糞便性大腸菌値を利用しました。丸が大きいほどより水が汚いということです。大きい丸からいくつかのことを学べます。

1つ目、「下流で泳ぐな」です。2つ目、「コニーアイランド川が最も汚い」です。コニーアイランド川では5年に渡り94%のサンプルが採取されていますが、非常に高い値が示されています。泳ぐことが州法に触れるくらいです。

こういった事実は市からのレポートで発表されることはありません。nyc.com(ニューヨーク市公式ウェブサイト)のフロントページに掲載されるなんてこともありません。このデータを知ることは素晴らしいことですが、「ものすごい簡単」には手に入りません。まだ「オープンデータ」になってないからです。

データを暮らしに活用するために

環境保全課のポータルサイトに行ってみてください。

このリンク1つ1つがエクセルファイルのリンクになっています。そしてこれらのファイル、実は全て書き方が違うんです。ダウンロードした後、地図にするには全てのエクセルシートをいちいち編集し直さなければいけません。もう一度言わせてください。私たちは、市役所職員になったつもりになれば、より良くできるんです。物事を普通の状態にできるんです。

NYC Open Dataに行ってみてください。

クラウドのオープンデータポータルサイトです。ここには1108もの暮らしに関するデータがあります。どのフォーマットでもダウンロードできます。CSPでもPDFでも、エクセルでも。これは良いですよね。しかし一度ダウンロードしてみると分かりますが、問題はリンク先によって郵便番号も住所も書かれ方が全く違うんです。

あなたがもしこのウェブサイトの住所の書き方を、普通の状態にしたら。私たちは、市役所職員になったつもりになれば、より良くできるんです。私たちの住所の書かれ方をスタンダードにできるんです。もし私たちがもっと数学に強かったら。

データから得た情報が、問題解決につながった

これはニューヨークの給水栓の分布図です。

どの給水栓でも反映されているわけではありません。トップ250の「給水力」がある給水栓です、「駐車違反チケット」として。

(会場笑)

ここからいくつかのことが学べます。この地図は僕のお気に入りです。1つ目、「北東部には停めるな」。どこに停めてもいいですが、ここはダメです(笑)。2つ目、私は高額「違反チケット給水所」を2ヶ所見つけました。南東部にあります。1年に$58,000分もチケットを切っています(笑)。少し変に感じたので、考察してみました。

これは拡張した縁石です。

7歩くらいの駐車スペースがあります。給水栓の前ですが、「ここに停められる」と思って車が来るわけです。実際にキレイに線で区画されてますね。そして車を停めます。その後にNYPDが来てチケットを切るわけです(笑)。

これは私が発見した時だけではありません。Googleストリートビューにも同じ場所でチケットを切られている車が載っています(笑)。そこで私は市にこのことについてメールをしました。そして運輸省から返信が来ました。

「運輸省ではこの場所について一度も苦情を受けたことはありませんでしたが、駐車の区切りを書き直した上で適切な改善を施します」

私は「あぁ、典型的な政府からの返答だな」と思いました。しかし数週間後、驚くべきことが起きたんです。彼らは区切りを書き直しました。

オープンデータは政府のパートナーになる権限である

ここで将来のオープンデータが見えました。考えてみてください。この場所では5年間もチケットを切られ続けていたんです。ところがそれを市へ報告したら、たった数週間で問題が解決してしまいました。素晴らしいじゃないですか。

オープンデータは監視目的だと思われてきました。パートナーではないと思われていたのです。私たちは市民に、政府に対してより良いパートナーになれる権限を与えられるんです。そしてそれは難しいことではありません。何重にも包まれていたデータに少し変化を与えるだけでいいんです。

一般に公開しましょう。もしPDFを公開するなら、あなたが必要としている法案を通しましょう。基礎となるデータも付けて。オープンデータの基準をシェアしましょう。ここニューヨークから始めましょう。ニューヨークからオープンデータのスタンダート化を始めましょう。

ニューヨークは、オープンデータのリーダーです。これでも、疑いようなくリーダーです。私たちが始めれば、他もついてくるでしょう。州も、もしかしたら国家も。馬鹿げているかもしれませんが、他の国々もついてくるかもしれません。あなたが1つの問題を見つけ、多数の国のデータから地図を作ればいいんです。これはSFの話ではありません。もうそこまで来ています。

ところで、誰が力を持っていると思いますか? ジョン・クラウス氏だけではありません。クリス・ウォン氏だけではありません。ニューヨークには何百ものミートアップがあります。何千もの人々が、仕事終わりや週末に参加しています。彼らはオープンデータを見て、私たちの街をより良くしようとしているんです。

つい先週、citygram.nycというグループが、職場や家での暮らしの中で出てきた苦情について署名できるようにしました。これは技術者コミュニティだけの話ではありません。それは都市計画者の学校にもなり、ポリシーの代弁者にもなり、さまざまな人々のバックグランドになります。

そしてそれは小さい、ちょっとずつの変化なんです。私たちは市民の持っている、オープンデータの利用や街をより良くしたい、という情熱の扉を開けることができるんです。たとえそれが1つのデータでも、1つの駐車スペースからでもです。

Published at

TED(テッド)

TED(テッド)に関するログをまとめています。コミュニティをフォローすることで、TED(テッド)に関する新着ログが公開された際に、通知を受け取ることができます。

スピーカーをフォロー

関連タグ

人気ログ

人気スピーカー

人気コミュニティ

ピックアップ

編集部のオススメ

ログミーBizをフォローして最新情報をチェックしよう!

人気ログ

人気スピーカー

人気コミュニティ

ピックアップ

編集部のオススメ

そのイベント、ログしないなんて
もったいない!
苦労して企画や集客したイベント「その場限り」になっていませんか?