2024.12.19
システムの穴を運用でカバーしようとしてミス多発… バグが大量発生、決算が合わない状態から業務効率化を実現するまで
機械学習・データコース プライバシー(全1記事)
提供:LINE株式会社
リンクをコピー
記事をブックマーク
髙橋 翼氏:プライバシーの職種は、先ほど説明のあったML Privacyチームというところのリサーチサイエンティストとリサーチエンジニアのポジションになります。
現状だと、Machine Learning Solution室という、菊地(菊地悠氏)がマネージしている室の中に1つのチームとして存在しています。他のMLの方々とは専門性とかロールが違うので選考の入り口も分かれているので、お気をつけください。
あともう1個注意点としては、プライバシーという職種ですが、あくまでデータサイエンスを前提とするプライバシーの話が主眼です。いわゆる暗号とかの専門をやりたい人にはちょっと合わないかもしれません。暗号や秘密計算を道具として使って、時にはデータサイエンスしたいみたいなモチベーションの人には、すごく合っているんじゃないのかなと思います。
まず自己紹介です。もうすぐ4年ですかね。4年くらい前にLINEに入って、リサーチサイエンティストをしています。また、プライバシーテックに関するR&Dチームのマネージャーをしています。これもテックパースにありますが、AIに対するストレステストみたいなのを開発しています。
前職はNECで、NECにいる間に社会人ドクターや海外留学を経験しました。これまでの代表的な研究成果として、プライバシー保護に関しては、VLDBやSIGMODに採択された論文、その他一般のデータマイニングに関してはWWW(現The Web Conference)に採択された論文があります。
ML Privacyチームでは、リサーチサイエンティスト、リサーチエンジニアという職がありますが、リサーチサイエンティストの人も、研究のための研究をするというよりは、事業の延長線上にある課題を先んじて解決することに興味を持ってもらえる方が合ってるのかなと思っています。基礎的な研究にも取り組みますが、あくまで最終的に事業につながるようなテーマであることが前提です。
リサーチエンジニアは、リサーチサイエンティストとマシンラーニングエンジニアなどの間をつなぐようなポジションです。この後の座談会で我々のチームからは長谷川(長谷川聡氏)が登壇しますけれども、長谷川はリサーチエンジニアのポジションとして活躍しています。
リサーチエンジニアの人は研究もある程度わかった上で、最先端の研究成果を世の中に届けるための開発に従事したい方に向いてるポジションなのかなと思います。
我々のチームが今研究開発しているトピックとしては、プライバシーテックのうち、Differential Privacyに注力しています。Federated Learningについても他のMLのチームと一緒に開発に携わっています。
最近はTEEや秘密計算などの技術を使ったセキュアなデータサイエンスの実現にも興味を持っています。現在取り組んでいるDifferential PrivacyやFederated Learningとこれらの組み合わせによってより安全でよりプライバシーに配慮したデータサイエンス、機械学習をLINEのプラットフォーム上で実現することを目指しています。
先ほど菊地の発表の中にもあったFederated Learningに関して、Federated Learningの基盤の中で、クライアントからモデルの更新情報を送信する時にDifferential Privacyを適用することにより、より厳密により強固にプライバシーを保護するための開発や設計を担当しています。
さらにもっとよくしていくために、独自のDifferential Privacyに関連する研究成果があります。それによると、より小さいノイズを入れることでプライバシー保護を達成する技術があります。より小さいノイズで強いプライバシーを達成できる。そういったことを実現し得ます。
Differential Privacyに関する研究では、より小さいノイズでプライバシー保護を達成する技術の実現を目指しています。関連する論文を国際会議やarXivで公開しています。実際に開発の現場で発見した課題に対して研究に取り組み、論文を出すこともあります。
研究の成果を一部紹介していきたいと思います。データ合成という技術に興味を持っていて、いくつか論文を発表しています。データ合成に関する成果は、ICDEやICLRという難関国際会議に論文が採択されています。
GANやVAEのようなデータ合成の技術が昨今流行っていると思いますが、Differential Privacyを前提とすると、うまく学習できない問題がありました。
この問題に対して、我々の提案手法ではこれまでの手法と比べてうまく学習できるようになりました。これができるとどういう良いことがあるかと言うと、セキュアにデータを分析したい、共有したい時に、プライバシー保護されたモデルを共有することで、プライバシーに配慮したかたちでデータサイエンスを気軽に実現できることが1つのメリットなのかなと思っています。
(スライドを示して)これまでのPublication Recordを挙げていますが、この青字で書いてあるところはトップカンファレンスに相当するもので、あまり大きいチームではありませんが、機械学習の分野であったり、データベースの分野で顕著な成果を上げることができていると感じています。これに関してはプレスリリースなども出しています。
我々のチームに興味持っている方に望ましいスキルとしては、我々が取り組んでいるセキュリティ×機械学習みたいな取り組みは、いろいろな技術の組み合わせによって実現しているので、コンピュータサイエンス全般に精通していることがまず望ましいかなと思います。
あと我々の領域はすごく特殊なので、統計とか暗号とか機械学習とか、いくつかの広い複数の分野に関して興味を持ってもらえる方も重要かなと思います。
先ほども言いましたが、リサーチサイエンティストは研究のための研究ではなくて、LINEの事業やエンジニアの抱える課題をきちんと深く理解することに前向きに取り組むことができて、会社にとって価値のある、将来性のある研究テーマを提案できる人がいいのかなと思っています。
リサーチエンジニアは、研究者と開発者両方の気持ちを理解できて、ちゃんとリサーチサイエンティストの研究の成果を事業に届けることができる、現場の課題をリサーチサイエンティストに提供できる、そういう橋渡しができる人が向いていると思います。
私からの説明は以上になります。ありがとうございました。
LINE株式会社
関連タグ:
2024.12.20
日本の約10倍がん患者が殺到し、病院はキャパオーバー ジャパンハートが描く医療の未来と、カンボジアに新病院を作る理由
2024.12.19
12万通りの「資格の組み合わせ」の中で厳選された60の項目 532の資格を持つ林雄次氏の新刊『資格のかけ算』の見所
2024.12.16
32歳で成績最下位から1年でトップ営業になれた理由 売るテクニックよりも大事な「あり方」
2023.03.21
民間宇宙開発で高まる「飛行機とロケットの衝突」の危機...どうやって回避する?
PR | 2024.12.20
モンスター化したExcelが、ある日突然崩壊 昭和のガス工事会社を生まれ変わらせた、起死回生のノーコード活用術
2024.12.12
会議で発言しやすくなる「心理的安全性」を高めるには ファシリテーションがうまい人の3つの条件
2024.12.18
「社長以外みんな儲かる給与設計」にした理由 経営者たちが語る、優秀な人材集め・会社を発展させるためのヒント
2024.12.17
面接で「後輩を指導できなさそう」と思われる人の伝え方 歳を重ねるほど重視される経験の「ノウハウ化」
2024.12.13
ファシリテーターは「しゃべらないほうがいい」理由 入山章栄氏が語る、心理的安全性の高い場を作るポイント
2024.12.10
メールのラリー回数でわかる「評価されない人」の特徴 職場での評価を下げる行動5選
Climbers Startup JAPAN EXPO 2024 - 秋 -
2024.11.20 - 2024.11.21
『主体的なキャリア形成』を考える~資格のかけ算について〜
2024.12.07 - 2024.12.07
Startup CTO of the year 2024
2024.11.19 - 2024.11.19
社員の力を引き出す経営戦略〜ひとり一人が自ら成長する組織づくり〜
2024.11.20 - 2024.11.20
「確率思考」で未来を見通す 事業を成功に導く意思決定 ~エビデンス・ベースド・マーケティング思考の調査分析で事業に有効な予測手法とは~
2024.11.05 - 2024.11.05