2024.12.19
システムの穴を運用でカバーしようとしてミス多発… バグが大量発生、決算が合わない状態から業務効率化を実現するまで
Verdaプラットフォーム開発Iチーム(全1記事)
提供:LINE株式会社
リンクをコピー
記事をブックマーク
Wang Xiang氏:私からは、Verdaプラットフォーム開発Iチームについてお話しいたします。
まずは自己紹介をさせてください。私は、Verdaプラットフォーム開発Iチームのソフトウェアエンジニアです。前職は、コンパイラエンジニアとしてカナダのハードウェアカンパニーのR&D部署に勤めていました。今やっていることと以前やっていたことは少し違いますが、2022年4月にソフトウェアエンジニアとしてLINEに入社しました。まだLINEでの経験は6ヶ月と浅いですが、みなさんにはこの会社でどういうことを学べるのかをお話できればと思います。
Verdaプラットフォーム開発Iチームは、現在7人のメンバーで構成されています。英語が主な共通言語になっていますが、本当にいろいろな国の人がいます。
チームの拠点は東京ですが、日本・韓国・ベトナムにメンバーが点在しているので国境を越えて連携しています。職場環境は非常にポジティブです。透明性があって、多くのコミュニケーションを尊重しています。ワークライフバランスもきちんと保たれていますし、協力的で開放的だと思います。メンバーのみんなはフレンドリーです。
私がこのチームに所属した当時、本当にいろいろな国の方がいましたが、温かく受け入れてもらえました。チームでは、プロフェッショナルであること、責任分担、ポジティブ、健康であること、信用を重要視しています。
Verdaプラットフォーム開発Iチームについてお話しします。私たちはソフトウェアテクニックまたはメソッドを使って、アプリケーションとインフラストラクチャをなるべくシームレスに接続できるようなプラットフォームを構築、運用しています。OpenStackを使い、QAチームなどとも密に連携しています。
ご存じだと思いますが、OpenStackとはオープンソースのクラウドコンピューティングを構築するソフトウェアプロジェクトです。私たちのプライベートクラウドプラットフォームであるVerdaも、OpenStack上に開発されているので、OpenStackに基づきVerdaのプラットフォームをデザインしたり開発したりしています。
大規模なOpenStackクラスタを複数実行しているので、それに関する運用の問題を解決していく必要があります。もちろん他のソフトウェアのコンポーネントであるLibvirt、Kubernetesなどのチームとも連携しなければなりません。VM、PM、ベアメタルサーバーの管理もしていかなければなりません。
課題と今後のプランについて、2つのポイントに触れたいと思います。まずは安定性です。Verdaのプラットフォームはかなり成熟したステージに来ていますが、やはりパーフェクトとは言い難い状況なので、たまに故障あるいは障害が発生します。その度に、ユーザーがハードウェアエラーや、ヒューマンエラーを定期的にレポーティングしてくれるわけです。私たちは、この故障や障害をとにかく少なくしていきたいと思っています。
2つ目に拡張性について。先ほど市原さん(市原裕史氏)からも話があったとおり、7,600のハイパーバイザー、そして4万5,000のベアメタルサーバーがあります。
これからはその数がもっと増える可能性があり、異なった地域で大規模なOpenStackクラスタをサポートしていかなければなりません。もっとハイパーバイザー、ベアメタルサーバーをサポートしていかなければならないわけです。このためにはいろいろなメカニズムを設計して、それをしっかりと導入していく必要があります。
実際に何をやっているのかをお見せしたいと思います。新しいドライバーをRPC Communication向けに導入するというプロジェクトです。RabbitMQなのですが、これはOpenStack上のRPC Communicationのインプリメンテーションになります。
OpenStackはRabbitMQのリプレイスをしたいわけではありませんが、Verdaのプラットフォームは大規模なOpenStackクラスタをサポートしなければならず、RabbitMQを使ったメンテナンスはすごいコストになってしまいます。RabbitMQのドライバーのメカニズムはかなり複雑で難解なので、スケールアップした環境ではサポートが難しくなってしまいます。
Verdaプラットフォーム開発Iチームは、RabbitMQのクラスタ+OpenStackのクラスタの管理をするのですが、特に障害が起こった時に両方管理するのは難しくなります。こういった問題を解決するために、私たちのチームは新しいRPC CommunicationドライバーをOpenStackに導入したらいいのではないかと考えました。
残念ながら詳細はみなさんに共有できませんが、うまくいったらコミュニティにも展開したいと思っているので、オープンソースプロジェクトからプロジェクトを借りてきて使うだけでなく、オープンソースに貢献していると言えると思います。
ソフトウェアスタックですが、いくつかこのようなものを使っています。もちろんメインフォーカスはPythonであるOpenStackです。Pythonでコードを書いています。プラスでOpenAPI、Swagger、Consul、RabbitMQを使うこともあります。Redis、他のDocker、Kubernetesなどのインフラを使うこともあります。
すべてを使えなければならないと言っているわけではありません。もしこういうコンポーネントをご存じであれば、チームに参画してもらう時におそらく仕事が楽になるのではないかなと思います。ということで、私からは以上です。ご清聴どうもありがとうございました。
LINE株式会社
関連タグ:
2024.12.20
日本の約10倍がん患者が殺到し、病院はキャパオーバー ジャパンハートが描く医療の未来と、カンボジアに新病院を作る理由
2024.12.19
12万通りの「資格の組み合わせ」の中で厳選された60の項目 532の資格を持つ林雄次氏の新刊『資格のかけ算』の見所
2024.12.16
32歳で成績最下位から1年でトップ営業になれた理由 売るテクニックよりも大事な「あり方」
2023.03.21
民間宇宙開発で高まる「飛行機とロケットの衝突」の危機...どうやって回避する?
PR | 2024.12.20
モンスター化したExcelが、ある日突然崩壊 昭和のガス工事会社を生まれ変わらせた、起死回生のノーコード活用術
2024.12.12
会議で発言しやすくなる「心理的安全性」を高めるには ファシリテーションがうまい人の3つの条件
2024.12.18
「社長以外みんな儲かる給与設計」にした理由 経営者たちが語る、優秀な人材集め・会社を発展させるためのヒント
2024.12.17
面接で「後輩を指導できなさそう」と思われる人の伝え方 歳を重ねるほど重視される経験の「ノウハウ化」
2024.12.13
ファシリテーターは「しゃべらないほうがいい」理由 入山章栄氏が語る、心理的安全性の高い場を作るポイント
2024.12.10
メールのラリー回数でわかる「評価されない人」の特徴 職場での評価を下げる行動5選
Climbers Startup JAPAN EXPO 2024 - 秋 -
2024.11.20 - 2024.11.21
『主体的なキャリア形成』を考える~資格のかけ算について〜
2024.12.07 - 2024.12.07
Startup CTO of the year 2024
2024.11.19 - 2024.11.19
社員の力を引き出す経営戦略〜ひとり一人が自ら成長する組織づくり〜
2024.11.20 - 2024.11.20
「確率思考」で未来を見通す 事業を成功に導く意思決定 ~エビデンス・ベースド・マーケティング思考の調査分析で事業に有効な予測手法とは~
2024.11.05 - 2024.11.05