ログイン

会員登録

検索

ログイン

メニュー

検索

ログイン

メニュー

【オンライン開催】LINE クラウドプラットフォームエンジニア採用説明会

2022.09.29 - 2022.09.29

Verda Reliability Engineeringチームについて（全1記事）

1記事目

2022.11.09

Brand Topics

Verda全体の効率化やインフラの管理をとおして価値を提供する　開発者をサポートするLINEのVREチーム

リンクをコピー

記事をブックマークブックマーク解除

画像・スライド一覧

LINEの大規模なインフラを支えるクラウドプラットフォームエンジニアが所属しているチームの役割、仕事内容、ふだんの働き方、現在の課題について取り組みの事例を交えてお話しする「LINE クラウドプラットフォームエンジニア採用説明会」。ここで登壇したのはVerda Reliability Engineeringチームの山田氏。チームの役割と、最近の事例について紹介しました。

VREチームの2つの役割

山田英樹氏：VRE（Verda Reliability Engineering）チームの山田です。VREチームはVerdaの中でSREの役割を担っているチームです。これから詳細について説明していきます。

（スライドを示して）先ほど市原さんの説明からもありましたが、こちらはLINEのPrivate CloudであるVerdaが抱えているサーバーとか、インスタンスの規模です。この数のインスタンスとか物理サーバーに対して、Reliabilityの責任を負っています。

具体的なロールは何かですが、こういったReliabilityを改善する活動を通じて、LINEのサービスを開発する人たち、我々はVerdaユーザーと呼んでいますが、アプリケーションデベロッパーと、今回この説明会に参加している、Verdaのサービス自体を開発している他のチームの開発者の両方の助けになることを目指しています。

VREチームでは大きく2つの役割を持っています。1つ目はPlatform-wide solutionということで、Verda全体を対象として運用の効率化とか、運用の自動化に取り組んでいるチームです。

2つ目がInfra resource management。こちらはVerdaを構成している物理インフラです。実際のサーバー全般の構築とか調達、管理・運用。そういったところを担っています。

Platform-wide solutionの役割

まずは1つ目のPlatform-wide solutionについて詳しく説明をしていきます。具体的な役割としては、Verdaのプラットフォームに対するモニタリングや、Observabilityを標準化したり仕組みを実装したりしています。それと、日々発生する運用の自動化を行うためのツール、枠組みのようなところです。

Verda全体で使えるような枠組みを開発したり、あるいはUXを高めるための企画を行ったりしています。VREチームは具体的にユーザーに提供するプロダクトを持っているわけではありませんが、こういったところを通じて価値を提供するということです。

このPlatform-wide solutionの具体的なプロジェクトで、最近どんなものがあったのかを紹介します。プロジェクトの例として、1つ目はメトリクスのストレージです。

みなさんPrometheus（というものを）を聞いたことがあるかと思います。サーバーのメトリクスですね。CPU使用率とか、メモリの使用量とか、ディスクの使用量とか、ネットワークのトラフィック量とか。そういったメトリクスのデータを統一的に保管して、統一的なダッシュボードで表示をするための仕組みの開発・設計だったり、各チームとの調整を行って、この仕組みにどんどんマイグレーションしていくような取り組みを行っていました。

その中でアラートも扱っていて、メトリクスに異常があった時にアラートを発報して、そのアラーティングのサービスからオンコールのメンバーに電話をかけて障害対応をしてもらうとか、そういった仕組みを取り扱っています。

2つ目はメトリクスと並んで重要なログです。アプリケーションのログを1ヶ所に一気に保存するような仕組みの統一を目指して、いろいろ動いていました。HDFS（Hadoop Distributed File System）とElasticsearchの基盤が社内にありますが、この基盤に対して保存するためのキャパシティの設計とか、いろいろな効率化とか、「統一的にログを検索する時にどうやったらいいか」という手順を作ったり検証をしたり、そういったことです。

あとはユーザー向けのドキュメントサイト。今までwikiにいろいろ書かれていましたが、なかなか統一的なものがなかったものを統一化したりとか。先ほど言った、オペレーションを自動化するためにChatOps的な仕組みを作ったり、そのSlack botを開発したりしています。

Infra resource managementの役割

もう1つのInfra resource managementの役割について説明すると、物理インフラを扱っているということです。一番大きいのはハイパーバイザーです。7,600台あるハイパーバイザーを管理するというところで、スペックを標準化したり。

あとは「VMをどれくらい作れるか」というキャパシティとか、VMが隣のVMに悪影響を及ぼしていないか・負荷をかけていないかみたいなモニタリングをしたり、その仕組み自体を開発したりしています。

2つ目としては、LINEの社内で使われているサーバーOSです。統一的にCentOSとRocky Linuxを使っていますが、このOSイメージをVerdaに組み込むためのいろいろなスクリプトを開発したり。あとは、OSレイヤーで何か問題が起こった時にはトラブルシューティングをしたり、「こういった機能を入れてほしい」というユーザーから要望があれば、それをコンサルティングして対応したりしています。

あとは、Verda自身も社内システムの1つですが、LINE社内には他にもいろいろシステムがあります。そことの連携でいろいろなシステム間連携があるわけですが、それがうまく動いていないとか、向こうのシステムの仕様変更があってそこを変えなきゃいけないとか、そういったところに対応して、しっかり連携を継続できるような取り組みを行っています。

Infra resource managementのプロジェクト例としては、先ほど市原さんから説明もあった、Multi-AZというものがありました。これまでのVerdaはリージョンは複数あったものの、東京リージョンの中で複数のAZ、データセンターがあるという状況はありませんでした。これが導入されたことによって、サーバーの在庫管理とか、調達を効率的に行う、計画的に行うことの複雑度が急に増しています。

また、複数データセンターを使うのもVerdaユーザーにとっては初めてなので、いろいろトラブルがあったりしました。そのトラブルシューティング、原因を追求したり、原因がわかったら「じゃあこのデータセンターは使えないから別のデータセンターを使いましょう」などのコンサルティングをしたりしていました。

2つ目が、ハイパーバイザーのライフサイクルの確立です。実はVerdaは立ち上がってから5年ぐらいで、一番古いハイパーバイザーの保守がちょうど切れる期間になってきていて、どんどん廃棄して入れ替えなきゃいけない時期に来ています。

そのフローが確立していない状況なので、この標準的なフローを確立して継続的に実行していくような仕組みを作ることが重要な役割となっています。

VREチームが求める人材像

VREチームが求める人材像ですが、プロダクトを持っているわけではないのでバリバリ開発するわけではないのですが、やはり自動化とか、効率化をして少ない人数で大量のサーバーを扱うためには、プログラミングが必須です。

そのため、基礎的なプログラミング能力は求めています。基本的には問題解決をするチームなので、トラブルシューティングが好きとか得意であるとか、組織的な課題をリードして解決に導ける人を募集しています。

2つのポジションがありますが、どちらでも我々のチームに行きますので、どちらも応募をお待ちしています。よろしくお願いします。

VREチームからの説明は以上です。

Verda Reliability Engineeringチームでは一緒に働くメンバーを募集しています。 Verda Platformに対するSRE活動を担当いただく業務です。・ Site Reliability Engineer（SRE） / Platform-wide solution / Private Cloud Platform Site Reliability Engineer（SRE） / Platform-wide solution / Private Cloud Platform| 求人詳細 | LINE株式会社・ Site Reliability Engineer（SRE） / Infra resource management / Private Cloud Platform Site Reliability Engineer（SRE） / Infra resource management / Private Cloud Platform| 求人詳細 | LINE株式会社

続きを読むには会員登録
（無料）が必要です。

会員登録していただくと、すべての記事が制限なく閲覧でき、
著者フォローや記事の保存機能など、便利な機能がご利用いただけます。

無料会員登録

会員の方はこちら

LINE株式会社

この記事のスピーカー

山田英樹
LINE株式会社 Verda Reliability Engineeringチームマネージャー

同じログの記事

1
Verda全体の効率化やインフラの管理をとおして価値を提供する　開発者をサポートするLINEのVREチーム

コミュニティ情報

LINE Developer Meetup

記事数: 208

Brand Topics

2024.12.24

ビジネスが急速に変化する現代は「OODAサイクル」と親和性が高い　流通卸売業界を取り巻く5つの課題と打開策

2024.12.23

大量の問い合わせにデスクはお手上げ、現場はブチギレ……　崩壊したチームを立て直した、kintoneによる業務改善の道のり

2024.12.23

「職人気質のめんどくさいおじさんたち」を味方に　全社を挙げての業務改善プロジェクトの成功のカギ

2024.12.20

モンスター化したExcelが、ある日突然崩壊　昭和のガス工事会社を生まれ変わらせた、起死回生のノーコード活用術

2024.12.20

1日あたり約79件もの脆弱性が見つかっている　ハッカー視点から見る、狙われやすい企業・狙われにくい企業の違い

2024.12.19

慣れ親しんだやり方にこだわり新システムを拒む社員　社内の抵抗勢力を手っ取り早く説得する秘策　

2024.12.19

74歳の事務員がたった1人で請求業務を担当……　作業時間を105時間→10時間まで削減させた、介護DX成功の舞台裏

2024.12.18

データ分析のPDCAサイクルは「ABCD」に変わっていく　AIを活用した、これからの経営・業務スタイルの展望

2024.12.18

一人前になったタイミングで離職、業務が属人化……　経理・財務担当者向け、組織改革を阻む“壁”を突破するポイント

2024.12.16

相次ぐ有名企業のランサムウェア被害…日本の課題とは？　生成AIを活用したセキュリティ脅威への解決策

Brand Topics

2024.12.24

ビジネスが急速に変化する現代は「OODAサイクル」と親和性が高い　流通卸売業界を取り巻く5つの課題と打開策

2024.12.23

大量の問い合わせにデスクはお手上げ、現場はブチギレ……　崩壊したチームを立て直した、kintoneによる業務改善の道のり

2024.12.23

「職人気質のめんどくさいおじさんたち」を味方に　全社を挙げての業務改善プロジェクトの成功のカギ

2024.12.20

モンスター化したExcelが、ある日突然崩壊　昭和のガス工事会社を生まれ変わらせた、起死回生のノーコード活用術

2024.12.20

1日あたり約79件もの脆弱性が見つかっている　ハッカー視点から見る、狙われやすい企業・狙われにくい企業の違い

2024.12.19

慣れ親しんだやり方にこだわり新システムを拒む社員　社内の抵抗勢力を手っ取り早く説得する秘策　

2024.12.19

74歳の事務員がたった1人で請求業務を担当……　作業時間を105時間→10時間まで削減させた、介護DX成功の舞台裏

2024.12.18

データ分析のPDCAサイクルは「ABCD」に変わっていく　AIを活用した、これからの経営・業務スタイルの展望

2024.12.18

一人前になったタイミングで離職、業務が属人化……　経理・財務担当者向け、組織改革を阻む“壁”を突破するポイント

2024.12.16

相次ぐ有名企業のランサムウェア被害…日本の課題とは？　生成AIを活用したセキュリティ脅威への解決策

制作会社の約7,000台の端末のセキュリティを守るには　博報堂プロダクツのゼロトラスト導入事例

ログミーBusinessに
記事掲載しませんか？

イベント・インタビュー・対談 etc.

“編集しない編集”で、
スピーカーの「意図をそのまま」お届け！

資料請求・お問い合わせ

ログミーBusinessとは

Verda全体の効率化やインフラの管理をとおして価値を提供する　開発者をサポートするLINEのVREチーム

VREチームの2つの役割

Platform-wide solutionの役割

Infra resource managementの役割

VREチームが求める人材像

この記事のスピーカー

同じログの記事

コミュニティ情報

Brand Topics

Brand Topics

人気の記事

新着イベント

ログミーBusinessに
記事掲載しませんか？

Verda全体の効率化やインフラの管理をとおして価値を提供する 開発者をサポートするLINEのVREチーム

VREチームの2つの役割

Platform-wide solutionの役割

Infra resource managementの役割

VREチームが求める人材像

この記事のスピーカー

同じログの記事

コミュニティ情報

Brand Topics

Brand Topics

人気の記事

新着イベント

ログミーBusinessに記事掲載しませんか？

Verda全体の効率化やインフラの管理をとおして価値を提供する　開発者をサポートするLINEのVREチーム

ログミーBusinessに
記事掲載しませんか？