ログイン

会員登録

検索

ログイン

メニュー

検索

ログイン

メニュー

AWS Cloud Roadshow 2014 福岡

2014.11.06 - 2014.11.06

AWS上に「共創」環境を創る!（全2記事）

2015.01.29

メインカテゴリテクノロジー

クラウドですべてをオープンに！　九州大学教授が取り組む、教育とデータ共有の革命とは？

リンクをコピー

記事をブックマークブックマーク解除

画像・スライド一覧

Web上の学習方法として現在一般的なeラーニング。しかし九州先端科学技術研究所で副所長を務める九大教授の村上和彰氏は、権利フリーの情報から教え合う「オープンエデュケーション」という次世代の教育システムに期待を示します。そのシステムを支えるのが、近年着実に浸透しつつある「オープンデータ」という考え方。これらが躍進するためのキーとして、クラウド化の進展が不可欠なもののようです。

オープンエデュケーションとは？

村上和彰氏：今まで3番目のキーワード、オープンツールレポジトリについてお話ししました。。次の、4番目のキーワードは、オープンエデュケーションになります。エデュケーションというと会社、企業の方はあまり馴染みがないかなと思われるかもしれません。これまで小・中・高・大学で学んできてもうこれ以上は結構だ、という方も多いと思いますが、エデュケーションの頭にオープンが付いております。

この本『ウェブで学ぶ』、先ほどの本『How Google Works』に比べるとちょっとマイナーかもしれませんが、ご存じの方はいらっしゃいますか？　……さすがにちょっといないみたいですね。この中で、京都大学の飯吉（透）先生がオープンエデュケーションを明確に定義しています。

オープンエデュケーションとはなんでしょうか。「オープンテクノロジー」「オープンコンテンツ」「オープンナレッジ」それから「オープンプラクティクス」、この4つの掛け算で成り立つものです。こう言うとちょっと難しいんですけども、非常に立派なことをおっしゃっていまして、要は「一人ひとりの無限の可能性のための次世代の教育環境」というふうなことです。

これでもピンと来ないかもしれません。私なりにもう少し簡単に言いますと、先ほどご紹介したオープンイノベーション、みんなで創造する。これを教育に応用したものだと言い換えてもいいかと思います。

簡単に言うとこういうことになります。「誰でも無償で教材を提供し、誰でも学習できる」と。教える側と生徒側、誰でも自由に勉強できる。別に入学試験を受けてどこかの学校に入らなくても、教育を受けることができる。あるいは学校の先生でなくても、教育を施すことができる。

さらにもうひとつ重要なのが「生徒はお互いに学習しあう、教え合う」ということです。教材を提供し、学べる。さらに教え合うと。この3つが非常に重要です。さらに無償でというところがポイントです。タダで。これがオープンエデュケーションと呼ばれてます。

従来のeラーニングとの違い

代表例は、MOOC（ムーク）になるかと思います。これはMassive Open Online Courseの頭文字を取ってMOOCと言っています。オープンエデュケーションはあんまりいらっしゃいませんでしたけど、MOOCをご存じの方はどれくらいいますか。……ありがとうございます。10名弱ですかね。ということは、今日初めて聞かれたという方が大多数かと思います。

じゃあMOOCを実際受講された方はいらっしゃいますか。……残念ながらいないですね。じゃあこの質問は飛ばして。百聞は一見に如かずで、実際にご覧いただきたいと思います。

＜映像開始＞

講師：皆さんこんにちは。今週の講義では、MOOCについて取り上げたいと思います。まず1つめの講義では、MOOCの基礎的な内容について押さえたいと思います。学習目標はこちらの2つです。ひとつがMOOC誕生の経緯について説明できるということ。もうひとつが、MOOCのタイプを2つに分けて、その違いを説明できるということです。MOOCには大きく分けて……。

＜映像終了＞

これはJMOOC、ジャパンムークという団体が、100大学を目標にして各大学にひとつのMOOCのコースを提供してもらう、という活動をしているところ（そのひとつの動画）です。MOOCのプラットフォームとしてNTTドコモグループが運営しているものがありまして、このラック上にMOOCが提供されています。

これは講義が4週間か5週間で終わって、今は見ることができませんけども、新たなタイトルがいっぱい出ております。このMOOC、eラーニングと何が違うんですかとお思いの方もいるかもしれません。

このビデオを見て勉強するんですけども、重要なのは1週間単位で講義が進行していくんです。このビデオタイトルが見れるのは、まあ5週間は見れるんですけども、後半のほうは3週目とか4週目にならないと見れない。1週間のあいだにいろいろな課題とか小テストがありますので、それを出さないといけない。最終的に5週間なら5週間すべてのコースを見終わって課題をパスすると、修了書がもらえる。

ですから、今までの見っ放しのeラーニングとか、あるいは他の学生さんと同期していないようなeラーニングとは違って、1週間単位で進行していきます。その間、学生同士がディスカッションボードでもってQ＆Aとかいろいろ教え合う。それがMOOCの特徴です。

gacco、あるいはJMOOCで検索していただくとすぐたどりつくことができますので、関心のある方はぜひご覧いただきたいと思います。

これのポイントは先ほど申し上げましたけれども、誰でも無料で受講することができるということと、この講義は日本国内で7,000人くらい受講したと聞いていますが、その7000人がいろいろとディスカッションをしながらお互いに教え合っているというのが可能になったということです。

教材ビデオを安価に作成できるクラウドサービスも

誰でも無償で学習できる、さらに教え合うということが実現できているんですが、実は「教材を提供し」というのがそんなに簡単ではない。先ほどのビデオを撮るのに大体500万円くらいの費用がかかっているらしいです。ですから「何か僕教えたいな」とか「定年を迎えて、これまで勉強したことを後輩に伝えたいな」と思っても、なかなか簡単にはああいうビデオ、かっこいいビデオを作るというのはできないわけです。

私どものLab.Cloudと呼んでいるクラウドサービス、クラウドイノベーションでは、「みんなのお手軽MOOC」という機能、サービスを提供しています。これは、誰でも先ほどのようなビデオを安価に作って提供することができる（ものです）。

先ほどのJMOOCも1大学1先生しかまずは出せませんので、誰でも好きな人が出せるというわけではありません。みんなのお手軽MOOCというのはLab.Cloudのサービスなんですけども、これも百聞は一見に如かずで、まずは見ていただきたいと思います。

＜映像開始＞

合成音声：データの収集から蓄積までの流れを見ていきましょう。従来は構造化データをおもに扱っていました。このデータには表データや基盤系システムなどがあります。このような構造化データは関係データベースにより管理されていました。関係データベースを管理するソフトウェアを……。

＜映像了＞

これはいったいなんだとお思いかもしれませんけども（笑）、これは音声合成ソフトでもってそのスライドでしゃべりたいテキストを文章として入力すると、ソフトで読み上げる。まあこれは当たり前です。

あと、中で動いてるのはアバターです。だいたい20種類くらいあって、自分の好きなアバターを選ぶとそのときのセリフの内容に応じて自動的に振る舞ってくれる。この振る舞いについては、私ども製作者のほうはほとんど指示することなく自動的に動いている。

ですから、これはパワポを作ってそのパワポで何をしゃべるかをテキストとして起こせば、あとはスタジオディレクターになった気分で自分の講義を作ることができます。これは北九州にあるBONDというベンチャー企業さんが、スマートアバタークリエイターというツールを使って、先ほどのLab.Cloud上でAWSのインスタンスで実際にこれを作っています。

これはだいたいどのくらいでできるんですかと。先ほどの実際にカメラで撮ったやつは5週間分で500万円くらいと言いました。だいたいビデオの1分単位に直すと数万円くらいの金額になります。（みんなのお手軽MOOCだと）これは我々のLab.Cloudで実際に使えるんですけども、だいたいビデオの1分単位1000円でできちゃう。10分のビデオだったら1万円。ツールとかインスタンスの使用料全部込みで、だいたいこのくらいの金銭感覚で作れます。

これだったら、大学の講義が15週間あるんですけども、15週間分をこのやり方で作ろうと思うと、だいたい70万円くらいあれば半年分の講義ができちゃう。15週間分はかなり量が多いですが、皆さんが自分の教えたいことをビデオにするなら、1分1000円程度で簡単にできちゃう。

ですから教える側にとってもクラウドは非常に重要で、そこでMOOCというサービスを使っているわけですが、その上で教材を提供すると。そのための仕掛けも非常に重要で、これが我々のLab.Cloudのイノベーションということになります。

これも、AWSだったからこそできたものです。ひとつには、基本的にオンプレミス（社内運用）とまったく変わらない環境を提供してもらわないと、ああいう画像を扱うようなツールというのは上手く動きません。

バッチ処理で動くようなツールだったらあんまりオンプレミスもクラウドも関係ないかもしれませんが、特に画像を扱うようなものだと、オンプレミスとクラウドで若干……例えば画像出力のライブラリに使えないものがあったりすると、とたんに破綻してしまったりするので。そういった問題がAWSの上ではなかった。これもAWSだからこそ、容易にああいうツールがインストールできて、しかも簡単にビデオを作成することができた。

オープンデータが可能にすること

5番目のキーワード「オープンデータ」です。ビッグデータは皆さんよくご存知かもしれませんが、オープンデータはあんまり馴染みがないかと思います。ご存知の方。……ありがとうございます。パラパラですかね。十数名かな。オープンデータは単にデータがオープンになってる……後でどういう意味かご紹介しますけども、その利活用が非常に重要です。

ビッグデータも利活用が重要ですが、オープンデータも利活用が重要。利活用の段階でいくつかありますが、実は福岡市がオープンデータサイトを、10月の6日だったかな？　1ヶ月前にオープンしました。ご存知の方いらっしゃいます？　……ありがとうございます。

オープンデータというのは、誰でも無償で二次利用が可能なオープンライセンスですね。著作権でガチガチに固められて二次利用ができない、「見ることができてもあなた自身が他のサービスで使ったりアプリケーションで使うことはダメですよ」と禁止されていると、全然利活用が進まない。

オープンデータは「そういうことやってもいいですよ」というオープンライセンス。クリエイティブ・コモンズというオープンライセンスの考え方がありますけど、基本的にそういうタイプのオープンライセンスです。

これは福岡市のオープンデータサイトになってます。結構きれいなサイトです。ここに「データカタログ」というのがあるんですけども、ここで福岡市が提供しているオープンデータを見ることができます。かなりの数がありますけども、データセットとしては94個あります。

全部は表示できませんけど、例えばAEDに関する情報であったり、防災、国勢調査とかいろいろな福岡市が持っている行政データを、こういうふうにオープンにしている。これはオープンデータですので、皆さんがダウンロードして二次利用することはOKとなっています。こうなってくると、いろんなサービス、ビジネスで使えるなという方がたくさんいらっしゃるのかなと思います。

自由度を規定する5つのランク

オープンデータに関しては、実はいくつかランクがあります。ここのCSVは、ご承知かと思いますがComma-Separated Valueですから、エクセルのオープンフォーマット版です。これはエクセルですね。こういう形で提供されてます。

これらは、オープンデータのランクでいうと中ほどになります。オープンデータには5段階のランクがございます。一番左が「Open License」。少なくとも、二次利用はOKにしないといけない。次は「Machine Readable(機械可読)」ということで、先ほどのエクセルなんかはここになります。

さらに、CSVというのは「Open Format」。これは別にエクセルというツールでなくても、CSVの場合は扱うことができます。

四つ星になると「URI」。Unique Resource Identificationという意味で、すべてのWeb上のリソース・データ、あるいはデータの属性にユニーク（個別）なIDが付いている。

我々がWebを使うときにはURLを入力することがあるかと思います。昔はグーグルみたいな検索ページがございませんでしたので、URLを一生懸命入れてたわけですけど、そのURLというのはサイトに付けられている、まあロケーションに付けられているユニークなIDなんです。ここでは、Web上のすべてのものにユニークなIDを付けている。それをURIと言っています。

そのURIを付けて、さらにURIを用いてお互いをリンクしている。LD＝「Linked Data」ですね。この5つがそろっているものを5つ星と言っています。残念ながら、今の福岡市のオープンデータサイトはまだここ（3つ星）のレベルですね。

今日運用を開始しました我々のBODIC.orgは、この5つ星のオープンデータを提供しています。オープンデータ5つ星だと何が嬉しいかというと、データがお互いにリンクしてますから、あるデータからリンク先のデータを引っ張ってくることができます。

さらに、ある標準フォーマットのRDFと呼ばれているもので記述されてますので……これはResource Description Frameworkの略なんですけども、SPARQLという検索言語を使ってあたかもリレーショナルデータベースでデータを検索するのと同じように、Web上でデータを検索することができます。ですから、Web全体がひとつの大きなデータベース（といえる）。

今は検索でもって自然言語で書かれたものを引っ張ってくることができますけども、もっときちんとRDFというフォーマットで定義されたデータを、リレーショナルデータベースと同じ感覚で検索することができる。これが5つ星のうまみです。こうなってくると、いろんなアプリケーションからオープンデータを使ったサービスを構築することができる。

BODIC.orgはオープンデータだけではなく、ビッグデータについても提供する構成になっています。我々はデータファームという言葉を使っています。ビッグデータについてはご承知だと思いますので飛ばします。

パブリックな情報を置ける「データファーム」

7番目のキーワードは今使った「データファーム」という言葉で、これも造語なんですが、例えばクラウドのデータセンターのところには「サーバーファーム」という言葉を使っています。サーバーが農地のキャベツのようにいっぱい並んでいるのをサーバーファームというんですが、同じようにひとつのサイトにいろんな種類のデータが集まってる。それを我々はデータファームと呼んでいます。

（スライドのように）こんな感じです。キャベツの代わりにデータが入っていると思ってもらったら結構です。

このデータファームは、誰でも自由にデータを収集し、蓄積し、分析し、さらに活用できる場と言い換えることができます。例えば、社内でいろんな業務データをビッグデータ的に利活用しようと思っても、社内のデータサーバーに入れてデータウェアハウスを導入し、分析ツールでもっていろいろ解析する。

それを先ほどのアマゾンさんのお話でいくと、AWS上でそのままやっちゃいましょうよと、Amazon Redshiftを使ったりとかそういうお話だったと思いますけども、それはあくまでもプライベートで使ってるわけですね。プライベートなデータの置き場としてAWSを使っている。

ここはそうじゃないです。パブリックなデータの置き場として、どうぞお使いくださいということです。ですから、わざわざAWSさんと契約しなくても、BODIC.org上に皆さんがお持ちのデータを蓄えて解析することができると。

もうひとつ重要なポイントがあります。誰でもデータを交換することができる、あるいは提供することができる。自分の持っているデータを無償で公開する、これはオープンデータになるんですけども、有償でほしい人に売るということも可能です。こういう「提供の場」を提供しているのも、ひとつの大きなポイントだと思います。

データの目的に応じて用意された2つのプラットフォーム

先ほどのデータファームは、データの種類あるいはどういう用途で使うかによって、実際のつくりは異なってきます。今、2つのデータファームプラットフォームを用意してます。「TeaScoop」と「TeaPot」。我々の開発コード名をそのまま付けています。

これはアマゾンさんのいろいろなプラットフォームであったり、コンポーネントを組み合わせて、あるタイプのデータをある目的で使うためにはこういうふうなクラウドデザインがいいよね、というものをプラットフォームとして用意しています。

その上で、ビッグデータだったらTeaScoopというプラットフォーム上で独自のデータファームを構築していく。あるいはオープンデータなら、実際に福岡市の公共施設に関するオープンデータファームをTeaPot上で公開しております。こういったものも作ることができる。

これがデータファームプラットフォームの構成図です。Amazon DynamoDBやPostgreSQLとか、異なるデータベースを目的に応じて使っております。細かく見るのは後でお話ししますけども、こういうデータファームのコンプレックス（集合体）、シネコン（シネマコンプレックス）と同じですね。データファームを集めている。これもAWSじゃないとできなかったと我々は認識してます。

ひとつは先ほどもお話ししましたけど、いろんなタイプのプラットフォーム、アマゾンがいうところのプラットフォーム（データベース・データウェアハウスなど）が使えると。ですからイチから開発しなくても、ほとんどアマゾンAWS上のコンポーネント・プラットフォームを組み合わせることによって、先ほどのTeaScoopやTeaPotというものを作る（ことができる）。

詳しくお見せしますと、これがTeaPot。オープンデータプラットフォームのほうになります。例えば福岡市のオープンデータサイトから生データ、CSVとかエクセルのデータを取ってきて、それをクリーニングしてRDF化してさらにはリンクドオープンデータ化して、こういったデータベースに入れる。で、ここに書いてあるようなものを使って検索する。

お話ししましたSPARQLというもので、Web上での検索言語になります。SPARQL Endpointというものとして、ここではApacheのFusekiというものを使っていますが、コンポーネントをほとんどゼロから開発することなく集めてきて、わずか2ヶ月くらいでできちゃいましたという感じです。

ビッグデータ用のプラットフォームとしては、このTeaScoopです。ビッグデータもいろんなタイプがありますけど、時系列のセンサーデータは刻一刻とセンサーから集めてきたデータを蓄える。ここではAmazon KinesisやDynamoDB、S3といった、やはりAWS上のプラットフォームを使って構築しております。これは3ヶ月くらいで作りました。一人です。一人の人間が3ヶ月。先ほど（TeaPot）も一人の人間が2ヶ月くらいで作っちゃいましたというものです。

これもいろんなデータ、ここではセンサーデータですけども、異なるデータタイプあるいは異なる目的、分析目的であったり、あるいは先ほどの、これは分析というよりもSPARQLで検索するためのインターフェースです。最終的にはマッシュアップアプリケーションに、検索した結果を使ってサービスを提供する。そういう目的で作られてます。

この辺はデータのタイプ、それからアプリケーションの掛け算でいろんなプラットフォームが必要になってくるかと思います。今はとりあえずこの2つだけです。

今後、民間企業さんでいろんなクラウドプラットフォーム、データプラットフォームを開発・提供されているところがございますので、そういったところもこのBODIC.orgにプラットフォームをご提供いただいて、データを収集しているオーナーは自分の用途・目的に応じて好きなプラットフォームを選んで使うことができると。そういった世界を作っていこうとしております。

詳しく知りたい方は「BODIC.org」で検索してください。本日（2014年11月6日）オープンしたばかりです。

イノベーションを促す3つのクラウドサービス

最後になりますけども、今日お話ししたかったのはスマートクリエイティブ……まだ日本国内それぞれの職場にはそうそう多くはいないんですけども、やはりビジネスの世界で競争、国際競争に勝っていく。特にITの世界というのはものすごく動きが激しい。しかも、プロダクトの価値をいかに高めるかというところが非常に重要であると。安さだけではない。やはりプロダクトの価値なわけです。

いかにして専門知識を活用して、ビジネスセンスを活かしながらプロダクトを作り出していくか。そういうスマートクリエイティブな人たちの環境をバーチャルに提供する。あるいは大学、教育機関でそういうところを教育していく。実際にそういうデータ分析をやっていく。

そのために我々は、3つのクラウドイノベーション、クラウドサービスを提供していますということをお話ししました。wCloud、Lab.Cloud、BODIC.orgというのがその3つのサービス、イノベーションです。

しかも重要なのは、すべてパブリックです。どなたでも先ほどの3つのクラウドサービスをお使いになることができます。すいません、オープンじゃないんです。オープンは「無料」という意味が付きますが、必ずしもすべてが無料ではありません。

例えば先ほどのMOOCは、見るほうは無料です。出すほうも無料ですけど、実際に教材を作る場合には、かかった時間だけの使用料をお支払いいただくと。ですから一部はフリー、オープンなんですけど、一部は課金ということです。ただ重要なのは、パブリックということでどなたでもお使いいただくことができる。

最初のwCloudを去年（2013年）の12月24日にオープンして、約1年近くが経っております。その間に、ユーザーの数が全部合わせてやっと1000人を超えるくらいなんですが、徐々に増えております。ぜひ皆さんにお使いいただいて、スマートクリエイティブな仕事を皆さんの職場でやっていただきたいと考えております。以上で私の講演を終わります。ぜひご活用いただければと思います。どうもありがとうございました。

続きを読むには会員登録
（無料）が必要です。

会員登録していただくと、すべての記事が制限なく閲覧でき、
著者フォローや記事の保存機能など、便利な機能がご利用いただけます。

無料会員登録

会員の方はこちら