ネットワークの業務課題をソフトウェアの力で解決するNetwork Reliability Engineer

酒井亨氏:それでは、「LINE Network Operation Frontline」と題して、ネットワークオペレーションチーム、そして募集中のポジションであるNetwork Reliability Engineerについて紹介いたします。

スピーカーを務める酒井と申します。経歴ですが、新卒入社のSIerでネットワーク機器を扱うエンジニアとしてキャリアをスタートしました。次に転職したユーザー企業でネットワークエンジニアもやりつつ、簡単なサーバーインフラの構築や、スクリプトの開発など、一通りやってきました。

そこからLINEに入社して、3ヶ月ぐらいは前職と同じような働き方をしていましたが、ネットワークのシステム開発の重要性の高まりを受けて、ネットワークの業務課題をソフトウェアの力で解決するNetwork Reliability Engineerとして活動しています。

チームを構成する3つのパートとミッション

次に、私たちが所属するネットワークオペレーションチームについて簡単に紹介します。ネットワークオペレーションチームは、「LINEのあらゆるネットワークの維持・運用」がミッションです。それらの品質を維持しつつ効率的に処理をするために、標準化を推進しています。

私たちのチームでは、3つのパートが1チームとなってDevOpsを実現しています。

「運用パート」は、定型業務や障害対応などの運用のコア業務を担当しています。実際の業務は、NOCと呼ばれる業務委託のメンバーで行われます。運用パートは、定型化できない複雑で難しい作業を担当したり、業務を標準化したりするのが主な役割です。

次に、「仕組化パート」は、日々の運用の課題や運用データの収集・分析を行って、今どのような改善を行うべきか判断を下すチームの舵取り役です。

最後に「開発パート」は、仕組化・運用パートから常にフィードバックを受けながらシステム開発をしています。

開発パートの担当業務と技術スタック

ここからは、今回の募集ポジションである開発パートの紹介をします。

開発パートは、LINEのネットワーク室の中で、組織的にシステム開発を行う主力で、現在社員2名、協力会社4名の計6名のチームです。ネットワーク室の内外から相談を受けて、システム設計、インフラ構築、リリース後の運用まで一手に担います。

具体的な仕様がメンバーから要望として上がってくることもあれば、「困ったことがあるんだよね」とふわっとした目的ベースから実現可能なやり方を一緒に考えることもあります。

図は、現在開発パートで扱っている技術スタックやツールを示したものです。幅広いスキルセットが必要なようにも見えますが、すべてに精通している必要はありません。開発・インフラ・ネットワークのいずれかに強みがあって、そのほかの領域に興味があれば、十分活躍してもらえると考えています。さまざまなバックグラウンド、得意分野を持つみなさんをメンバーに迎えたいと考えています。

プロジェクト紹介1 作業”半”自動化システム

具体的なイメージを深めてもらいたいと思い、開発プロジェクトの一部を紹介します。LINEのネットワークは、現在1万ノードの機器が稼働しており、日々拡大を続けています。ここ数年はさらに加速して、2025年までにはネットワーク機器が倍増するとの予測が立っています。

中でも、機器のSFP障害は群を抜いて、今後さらに増える見通しです。交換作業は、オペレーターが判断することがとにかく多く、このツールは、障害発生から交換までの作業を半自動化したものです。

まず、監視ツールやネットワーク機器にログインして、状況がどうなっているかを確認します。そのあとの判断は、壊れたネットワーク機器のOSに応じた手順選択、実行、交換の手配など、多岐にわたります。

このワークフローハブと呼んでいるツールは、1枚のブラウザーから、判断に必要な情報を表示し、作業の実行を可能にします。

手順の選択や機器へのコマンド実行など、リスクのある作業が機械化され、品質の向上や効率の向上につながりました。さらに、オペレーターに対しては予想したコマンドだけを実行させるというガバナンスを利かせる意味もあります。

プロジェクト紹介2 次期ネットワーク監視基盤構築

続いて、次期ネットワーク監視基盤構築プロジェクトについて紹介します。既存の監視基盤は自動化との相性が悪く、人間が通知を受け取ってからアクションを選択しなければならないという制約があります。

また、既存の監視基盤はグループ内の別会社が開発しており、融通が利かないためにスピード感も合わなくなってきているという不満も抱えていました。

ネットワーク監視基盤は、さまざまなワークフローの起点になります。ここがコントローラブルではないのは、自動化を進める上で大きな足枷です。そこで私たちは、ほかのシステムとの連動を前提とした自動化を進めるべく、次期監視基盤を内製しています。

Network Reliability Engineerポジションのやりがい・魅力

次に、募集ポジションの紹介をいたします。Network Reliability Engineerは記載のとおり、ネットワークインフラにSite Reliability Engineeringの手法を適用します。

ネットワークは重要なインフラなので、あまり手を入れないのが一般的だと思いますが、私たちは常に改善をし続けるという誓いを込めて、このポジション名にしました。あまり聞き慣れないポジション名だと思いますが、私たちはこれを実現できる環境にあると確信しています。

まず、国内の人口が減少する中で、インフラ規模が成長し続ける環境というのはそれだけで貴重ですが、その中でも日本有数規模のネットワーク組織での改善経験は、ほかでは得難いものだと考えています。

また、全社的にチャレンジを推奨する環境があります。そう考える理由は2つあります。これは私自身、中途入社として強く感じていることですが、新しい提案でも、フラットに前向きに議論できる空気感があります。これはすばらしい文化だと思います。

もう1つは、チーム内外問わず、エンジニアの技術力がとにかく高く、変化に柔軟に対応できること。これらが大きな要因だと考えています。

続いて、プロジェクトに集中できる環境について。NRE(Network Reliability Engineer)ポジションでは、システム開発やシステムの運用改善を専任として、本来やるべき改善に集中できる環境が整っています。組織もフラットで、承認に必要以上のコストがかかりません。

また、前のスライドで紹介したとおり、幅広い技術スタックに触れられるので、NREとしての能力を磨くには打ってつけの環境だと考えています。

最後に、ネットワーク運用業務の自動化は事例がまだまだ少ないので、これをやっておけばよいといった正解がなく、自ら作り上げていけるワクワクがあると思います。

ネットワーク運用・開発・インフラ管理のいずれかに強みを持つ人材を募集中

このポジションで求める人材として、ネットワーク運用・開発・インフラ管理のいずれか1つにでも腕に覚えがある方で、今後スキルの幅を広げていきたいと考えている方にぜひ応募してもらいたいです。

例えば、ネットワーク運用業務を長年やってきて、自作のツールを業務に取り入れている方。また、ネットワークとは関係ない一般的なアプリケーション開発をやってきて、ネットワークの基本的な知識をお持ちの方。またはインフラの運用をやってきた方。

もしくは、モダンなインフラ運用管理の深い知識と経験があって、その他、スクリプト程度でもプログラミングの経験をお持ちの方。これらにピンと来た方は、Network Reliability Engineerポジションの採用情報の「応募するボタン」を今すぐ押してください。

以上が、ネットワークオペレーションチームと、NREポジションの紹介でした。気になることがある方は、このあとのQAで質問してもらってもいいですし、カジュアル面談を申し込んでもらえば、ここだけの話もできると思います。ご清聴ありがとうございました。ご応募をお待ちしています。