2024.10.01
自社の社内情報を未来の“ゴミ”にしないための備え 「情報量が多すぎる」時代がもたらす課題とは?
機械学習・データコース プライバシー(全1記事)
提供:LINE株式会社
リンクをコピー
記事をブックマーク
髙橋 翼氏:プライバシーの職種は、先ほど説明のあったML Privacyチームというところのリサーチサイエンティストとリサーチエンジニアのポジションになります。
現状だと、Machine Learning Solution室という、菊地(菊地悠氏)がマネージしている室の中に1つのチームとして存在しています。他のMLの方々とは専門性とかロールが違うので選考の入り口も分かれているので、お気をつけください。
あともう1個注意点としては、プライバシーという職種ですが、あくまでデータサイエンスを前提とするプライバシーの話が主眼です。いわゆる暗号とかの専門をやりたい人にはちょっと合わないかもしれません。暗号や秘密計算を道具として使って、時にはデータサイエンスしたいみたいなモチベーションの人には、すごく合っているんじゃないのかなと思います。
まず自己紹介です。もうすぐ4年ですかね。4年くらい前にLINEに入って、リサーチサイエンティストをしています。また、プライバシーテックに関するR&Dチームのマネージャーをしています。これもテックパースにありますが、AIに対するストレステストみたいなのを開発しています。
前職はNECで、NECにいる間に社会人ドクターや海外留学を経験しました。これまでの代表的な研究成果として、プライバシー保護に関しては、VLDBやSIGMODに採択された論文、その他一般のデータマイニングに関してはWWW(現The Web Conference)に採択された論文があります。
ML Privacyチームでは、リサーチサイエンティスト、リサーチエンジニアという職がありますが、リサーチサイエンティストの人も、研究のための研究をするというよりは、事業の延長線上にある課題を先んじて解決することに興味を持ってもらえる方が合ってるのかなと思っています。基礎的な研究にも取り組みますが、あくまで最終的に事業につながるようなテーマであることが前提です。
リサーチエンジニアは、リサーチサイエンティストとマシンラーニングエンジニアなどの間をつなぐようなポジションです。この後の座談会で我々のチームからは長谷川(長谷川聡氏)が登壇しますけれども、長谷川はリサーチエンジニアのポジションとして活躍しています。
リサーチエンジニアの人は研究もある程度わかった上で、最先端の研究成果を世の中に届けるための開発に従事したい方に向いてるポジションなのかなと思います。
我々のチームが今研究開発しているトピックとしては、プライバシーテックのうち、Differential Privacyに注力しています。Federated Learningについても他のMLのチームと一緒に開発に携わっています。
最近はTEEや秘密計算などの技術を使ったセキュアなデータサイエンスの実現にも興味を持っています。現在取り組んでいるDifferential PrivacyやFederated Learningとこれらの組み合わせによってより安全でよりプライバシーに配慮したデータサイエンス、機械学習をLINEのプラットフォーム上で実現することを目指しています。
先ほど菊地の発表の中にもあったFederated Learningに関して、Federated Learningの基盤の中で、クライアントからモデルの更新情報を送信する時にDifferential Privacyを適用することにより、より厳密により強固にプライバシーを保護するための開発や設計を担当しています。
さらにもっとよくしていくために、独自のDifferential Privacyに関連する研究成果があります。それによると、より小さいノイズを入れることでプライバシー保護を達成する技術があります。より小さいノイズで強いプライバシーを達成できる。そういったことを実現し得ます。
Differential Privacyに関する研究では、より小さいノイズでプライバシー保護を達成する技術の実現を目指しています。関連する論文を国際会議やarXivで公開しています。実際に開発の現場で発見した課題に対して研究に取り組み、論文を出すこともあります。
研究の成果を一部紹介していきたいと思います。データ合成という技術に興味を持っていて、いくつか論文を発表しています。データ合成に関する成果は、ICDEやICLRという難関国際会議に論文が採択されています。
GANやVAEのようなデータ合成の技術が昨今流行っていると思いますが、Differential Privacyを前提とすると、うまく学習できない問題がありました。
この問題に対して、我々の提案手法ではこれまでの手法と比べてうまく学習できるようになりました。これができるとどういう良いことがあるかと言うと、セキュアにデータを分析したい、共有したい時に、プライバシー保護されたモデルを共有することで、プライバシーに配慮したかたちでデータサイエンスを気軽に実現できることが1つのメリットなのかなと思っています。
(スライドを示して)これまでのPublication Recordを挙げていますが、この青字で書いてあるところはトップカンファレンスに相当するもので、あまり大きいチームではありませんが、機械学習の分野であったり、データベースの分野で顕著な成果を上げることができていると感じています。これに関してはプレスリリースなども出しています。
我々のチームに興味持っている方に望ましいスキルとしては、我々が取り組んでいるセキュリティ×機械学習みたいな取り組みは、いろいろな技術の組み合わせによって実現しているので、コンピュータサイエンス全般に精通していることがまず望ましいかなと思います。
あと我々の領域はすごく特殊なので、統計とか暗号とか機械学習とか、いくつかの広い複数の分野に関して興味を持ってもらえる方も重要かなと思います。
先ほども言いましたが、リサーチサイエンティストは研究のための研究ではなくて、LINEの事業やエンジニアの抱える課題をきちんと深く理解することに前向きに取り組むことができて、会社にとって価値のある、将来性のある研究テーマを提案できる人がいいのかなと思っています。
リサーチエンジニアは、研究者と開発者両方の気持ちを理解できて、ちゃんとリサーチサイエンティストの研究の成果を事業に届けることができる、現場の課題をリサーチサイエンティストに提供できる、そういう橋渡しができる人が向いていると思います。
私からの説明は以上になります。ありがとうございました。
LINE株式会社
関連タグ:
2024.10.29
5〜10万円の低単価案件の受注をやめたら労働生産性が劇的に向上 相見積もり案件には提案書を出さないことで見えた“意外な効果”
2024.10.24
パワポ資料の「手戻り」が多すぎる問題の解消法 資料作成のプロが語る、修正の無限ループから抜け出す4つのコツ
2024.10.28
スキル重視の採用を続けた結果、早期離職が増え社員が1人に… 下半期の退職者ゼロを達成した「関係の質」向上の取り組み
2024.10.22
気づかぬうちに評価を下げる「ダメな口癖」3選 デキる人はやっている、上司の指摘に対する上手な返し方
2024.10.24
リスクを取らない人が多い日本は、むしろ稼ぐチャンス? 日本のGDP4位転落の今、個人に必要なマインドとは
2024.10.23
「初任給40万円時代」が、比較的早いうちにやってくる? これから淘汰される会社・生き残る会社の分かれ目
2024.10.23
「どうしてもあなたから買いたい」と言われる営業になるには 『無敗営業』著者が教える、納得感を高める商談の進め方
2024.10.28
“力を抜くこと”がリーダーにとって重要な理由 「人間の達人」タモリさんから学んだ自然体の大切さ
2024.10.29
「テスラの何がすごいのか」がわからない学生たち 起業率2年連続日本一の大学で「Appleのフレームワーク」を教えるわけ
2024.10.30
職場にいる「困った部下」への対処法 上司・部下間で生まれる“常識のズレ”を解消するには