「教師データ作成を効率化するプロダクト開発」と「教師データ作成代行事業」を行っている

恋塚大氏(以下、恋塚):みなさん、はじめまして。FastLabelの恋塚です。私からは、「事業スケールを支える技術」というタイトルで発表いたします。

私たちは、AIを活用して教師データ作成を効率化するAIデータプラットフォームを提供しています。

教師データをご存じの方はいらっしゃいますか? けっこういますね。ありがとうございます。教師データとは、「AIに学習させるためのデータ」のことです。

これだけではピンとこない方もいると思うので、トマト検出のAIを例に、教師データ作成の現場をお見せしたいと思います。これは実際に弊社のプロダクトを使って、教師データを作っているシーンです。このように一つひとつ手動で、ここがトマトですよとデータを作っていかなければならないので、非常にめんどくさい作業になっています。

私たちはこのプロダクトの提供だけでなく、教師データ作成代行事業も行っています。この代行事業に関連して、このような経営課題がありました。「教師データ作成代行で、デリバリーチームの1人当たりの売上を上げる」というものです。

弊社は代行を通じて、プロダクトを改善して、それにより代行の効率化・高品質化を図るという好循環による成長戦略を描いています。そのため、起点となる「代行サービスをスケールさせること」が、非常に重要な経営課題でした。アプローチ方法として2つが考えられましたが、オペレーションの改善では限界があります。そこで技術による解決、すなわちAIによる教師データ作成の自動化に注力することにしました。

エンタープライズ企業向けの教師データにおける2つの課題

私たちのターゲットはエンタープライズ企業です。このような企業は、教師データの要件が各社固有で複雑という特徴があります。そのため、一般公開された汎用AIでは、教師データの作成の自動化ができません。例えば、よくある犬の分類はできても、A社固有のネジの分類はできないといった具合です。

では、エンタープライズ向け汎用AIを作って、自動化すればいいのでは? となるのですが、これも難しいです。例えば、配管の腐食の場合、たとえ同じ腐食具合であっても、A社では緊急レベルが「2」、B社では「4」といったように各社基準が異なり、汎用化ができません。

それならば、案件ごとにエンジニアが専用のAIを作って、自動化すればいいんじゃないか? となるのですが、これにも問題があります。まずコストが見合わず、スケールも困難です。また、エンジニアの人材不足という観点からも、あまりいい方法とは言えませんでした。このように、AIによる自動化というアプローチには、さまざまな課題がありました。

ノーコード活用して非エンジニアでも教師データを作成できる仕組みを構築した

では、どうすればいいでしょうか? 1つだけ方法がありました。みなさんがご存じの方法です。そうです、ノーコードです。具体的な解決策はこちらです。非エンジニアであるデリバリーチームでも案件ごとにAIを作成し、教師データ作成を自動化できる仕組みを構築することです。

これにより、これまでは案件ごとにエンジニアが必要だったBeforeの状態から、Afterのようにデリバリー担当1人で自由にAIを作成し、教師データ作成を自動化することが可能になり、複数案件を回せるようになりました。

プロダクト開発のポイントは「UI/UX」と「技術選定」

ポイントはこちらの2つです。まず、UI/UXですが、今まではエンジニアが複雑な設定ファイルやスクリプトを準備する必要がありましたが、Afterのように課題解決を目的に、機能を極限まで削減したことにより、なんとワンクリックでAIを作成して、自動化ができるようにしています。

技術は「SageMaker」を採用しています。理由は3つあります。まず、今回の課題解決の要件を満たすこと。2つ目は、低コストで爆速開発ができること。3つ目は、SageMakerはコンテナで動くのですが、AIを搭載するコンテナ部分はAI人材に、Webへの組み込みはWeb系営人材に任せるといった、人材活用が可能であったこと、この3点です。実際に非常にシンプルなアーキテクチャで構築できました。そのため、構想から3週間でリリースに至りました。

デリバリーチーム1人当たりの売上が2.2倍となった

結果です。KPIとして、AI作成数はリリース後、半年で350に達しています。これは毎日2つずつAIが作られている計算になります。教師データの作成数も2.4倍に伸びました。経営課題であるデリバリーチーム1人当たりの売上は、2.2倍と倍増したので、経営に貢献できたと思っています。

私たちは現在、画像領域に注力しているのですが、これを動画や3Dといった領域に拡張し、さらなる事業スケールを推し進めたいと思っています。ご清聴ありがとうございました。

(会場拍手)

SageMakerを使うことでいろいろな人材が活用できた

司会者:ありがとうございました。それではここで質疑応答に入らせていただきます。審査員のみなさま、恋塚さんへの質問がありましたら、挙手をお願いいたします。

司会者:それでは藤本さんからお願いいたします。

藤本真樹氏(以下、藤本):最初なので、僭越ながら質問をさせていただきます。2つおうかがいしたくて。1個はMLのデータを作るために、MLを使おうというメタな感じ、おもしろいなと思いつつ、そこのところで具体的にどんなことをしたか、もう1歩具体的に教えてもらえるとうれしいです。

あと今、ざっくりチームはどんな感じで、恋塚さんはどんなポジションで、どんなことをしてるか、したかみたいなところをもうちょっとだけ教えてもらえるとうれしいです。

恋塚:1点目は、MLのためのMLを作るために、さらにほかに何をやったかというところですか?

藤本:そうですね。具体的に、SageMakerを使ったとありましたが、そのあたり。コードを使ったとか、その他諸々、もうちょっと具体的なお話があったらおもしろいなと思いました。

恋塚:そうですね。何をやったかでいうと、SageMakerを採用する際に、もちろん自分たちでGPUを用意して、それに回して、それに載っけてやると言ってもよかったのですが、SageMakerを使うことによって、かなり人材を流用できるというか、活用できるところがあったというところが、一番力を入れた点です。

組織のかたちでに合わせてやったところが一番力を入れた点なので、そこをちょっと混ぜてお話しすると、当時は、AIエンジニアが1名、開発Web系が3名でした。なので、かなり人数が少ない状態で、ガンガン機能を開発していく必要がありました。

この少ない人数で、どういうふうにスケールさせていくプロダクトが作れるか、という点を考える役割を僕が持っていて、汎用性よりも、1つの技術選定によって、いろいろな人材が活用できるといったところでSageMakerを選びました。

最初はSageMakerを使った基盤構築を僕がやり、それ以降は他のメンバーのWebエンジニアとAIエンジニアが2人1組、二人三脚で作っていくような構成を取っています。

藤本:はい、ありがとうございます。

ビジネス側と開発側から課題を挙げて経営層に提言をしていった

司会者:お願いいたします。

山本正喜氏(以下、山本):じゃあ私から。プレゼン、ありがとうございます。こちら、要は社内向けの、デリバリーチーム向けのシステムということですよね。

恋塚:そうですね。公開もしています。

山本:公開もしている?

恋塚:はい。

山本:わかりました。ありがとうございます。こちら、デリバリーチームの効率化をしようという課題が、ビジネスサイドやデリバリーチーム側から挙がってきたのか、それとも自分たちで起案していったのか、経営の会議の中で、SageMakerを使って、こういうプロセスで改善したいんだという意思決定のプロセスに、どう関われたかを教えてもらえますか。

恋塚:はい。弊社はデリバリーチームに必ず、エンジニア1人が参画する体制を取っていて、実際にデリバリーするというプロセスを通してやっている時に、このままだと結局、労働集約から抜けられないよねという話を常日頃からしてました。

なんとかして自動化して改善をしていかなきゃいけないよねという話は出ていて、その課題感を経営層に申請していく中で、それはやるべきだねという話になりました。

「これをぜひやるべきだ。申請してそれをやっていこう」というよりも、一緒にやる中で必要だということを、ビジネス側と開発側のどちらからも経営層にやっていくべきだよねという話をして、自然な流れでやっていった感じです。

山本:ありがとうございます。

教師データ作成のツールを事業化について考えていること

司会者:もう1つ、お願いいたします。

竹内真氏(以下、竹内):公開されてるということなので、教師データ作成のサービスとして、事業として未来があるかもしれないと思っているのかなと思います。

教師データ作成のツールとしての事業化を考えていく時に、今は基本的には社内のプロトタイプだと思うのですが、どういう課題があって、それをどう低コストで解決して、サービスにしていけたらいいなとか、考えていることがあったら教えてください。

恋塚:教師データ作成というところでいうと、PMFは達成しているかなと思っています。ただ、この先の事業として、教師データ作成だけで進めていくのは、やはり難しいところもあります。私たちの理念の「AI革命のインフラになる」に通ずるところがあるのですが、このAI開発、そもそもこのプラットフォーム上だけでできるようにしていこうという考え方で開発を進めています。

実際にAIは、今ウォーターフォールで開発されていて、それをアジャイルにしていくことによって、低コストで精度の高いAIまで作れるのではないかというのが思想としてあります。先ほどお話しした、自動で教師データを作るというのも、その一環で、すごく精度の高い教師データの作成を自動化できるということは、すなわち、AIはもうプロダクション環境で動かせる状況だと思っています。

なので、例えば100枚のデータを使って、AIをノーコードで作成した時に、今は8割の精度だったとしても、自動で教師データを作って、手動で少しだけ修正するというのを繰り返していくうちに、あっという間に500枚とか1,000枚とかになっていく。

それを実際に学習させたら、精度が99%なったというのもあるので、それをさらに使いやすい状態、分析がやりやすい状態などを通して、AI開発全体を事業として行っていくというのを考えています。

竹内:ありがとうございます。

司会者:時間になりました。ありがとうございました。ここまでは恋塚さんでした。どうぞ拍手でお送りください。

(会場拍手)