2024.12.19
システムの穴を運用でカバーしようとしてミス多発… バグが大量発生、決算が合わない状態から業務効率化を実現するまで
ネットワークオペレーションチームの紹介(全1記事)
提供:LINE株式会社
リンクをコピー
記事をブックマーク
酒井亨氏:それでは、「LINE Network Operation Frontline」と題して、ネットワークオペレーションチーム、そして募集中のポジションであるNetwork Reliability Engineerについて紹介いたします。
スピーカーを務める酒井と申します。経歴ですが、新卒入社のSIerでネットワーク機器を扱うエンジニアとしてキャリアをスタートしました。次に転職したユーザー企業でネットワークエンジニアもやりつつ、簡単なサーバーインフラの構築や、スクリプトの開発など、一通りやってきました。
そこからLINEに入社して、3ヶ月ぐらいは前職と同じような働き方をしていましたが、ネットワークのシステム開発の重要性の高まりを受けて、ネットワークの業務課題をソフトウェアの力で解決するNetwork Reliability Engineerとして活動しています。
次に、私たちが所属するネットワークオペレーションチームについて簡単に紹介します。ネットワークオペレーションチームは、「LINEのあらゆるネットワークの維持・運用」がミッションです。それらの品質を維持しつつ効率的に処理をするために、標準化を推進しています。
私たちのチームでは、3つのパートが1チームとなってDevOpsを実現しています。
「運用パート」は、定型業務や障害対応などの運用のコア業務を担当しています。実際の業務は、NOCと呼ばれる業務委託のメンバーで行われます。運用パートは、定型化できない複雑で難しい作業を担当したり、業務を標準化したりするのが主な役割です。
次に、「仕組化パート」は、日々の運用の課題や運用データの収集・分析を行って、今どのような改善を行うべきか判断を下すチームの舵取り役です。
最後に「開発パート」は、仕組化・運用パートから常にフィードバックを受けながらシステム開発をしています。
ここからは、今回の募集ポジションである開発パートの紹介をします。
開発パートは、LINEのネットワーク室の中で、組織的にシステム開発を行う主力で、現在社員2名、協力会社4名の計6名のチームです。ネットワーク室の内外から相談を受けて、システム設計、インフラ構築、リリース後の運用まで一手に担います。
具体的な仕様がメンバーから要望として上がってくることもあれば、「困ったことがあるんだよね」とふわっとした目的ベースから実現可能なやり方を一緒に考えることもあります。
図は、現在開発パートで扱っている技術スタックやツールを示したものです。幅広いスキルセットが必要なようにも見えますが、すべてに精通している必要はありません。開発・インフラ・ネットワークのいずれかに強みがあって、そのほかの領域に興味があれば、十分活躍してもらえると考えています。さまざまなバックグラウンド、得意分野を持つみなさんをメンバーに迎えたいと考えています。
具体的なイメージを深めてもらいたいと思い、開発プロジェクトの一部を紹介します。LINEのネットワークは、現在1万ノードの機器が稼働しており、日々拡大を続けています。ここ数年はさらに加速して、2025年までにはネットワーク機器が倍増するとの予測が立っています。
中でも、機器のSFP障害は群を抜いて、今後さらに増える見通しです。交換作業は、オペレーターが判断することがとにかく多く、このツールは、障害発生から交換までの作業を半自動化したものです。
まず、監視ツールやネットワーク機器にログインして、状況がどうなっているかを確認します。そのあとの判断は、壊れたネットワーク機器のOSに応じた手順選択、実行、交換の手配など、多岐にわたります。
このワークフローハブと呼んでいるツールは、1枚のブラウザーから、判断に必要な情報を表示し、作業の実行を可能にします。
手順の選択や機器へのコマンド実行など、リスクのある作業が機械化され、品質の向上や効率の向上につながりました。さらに、オペレーターに対しては予想したコマンドだけを実行させるというガバナンスを利かせる意味もあります。
続いて、次期ネットワーク監視基盤構築プロジェクトについて紹介します。既存の監視基盤は自動化との相性が悪く、人間が通知を受け取ってからアクションを選択しなければならないという制約があります。
また、既存の監視基盤はグループ内の別会社が開発しており、融通が利かないためにスピード感も合わなくなってきているという不満も抱えていました。
ネットワーク監視基盤は、さまざまなワークフローの起点になります。ここがコントローラブルではないのは、自動化を進める上で大きな足枷です。そこで私たちは、ほかのシステムとの連動を前提とした自動化を進めるべく、次期監視基盤を内製しています。
次に、募集ポジションの紹介をいたします。Network Reliability Engineerは記載のとおり、ネットワークインフラにSite Reliability Engineeringの手法を適用します。
ネットワークは重要なインフラなので、あまり手を入れないのが一般的だと思いますが、私たちは常に改善をし続けるという誓いを込めて、このポジション名にしました。あまり聞き慣れないポジション名だと思いますが、私たちはこれを実現できる環境にあると確信しています。
まず、国内の人口が減少する中で、インフラ規模が成長し続ける環境というのはそれだけで貴重ですが、その中でも日本有数規模のネットワーク組織での改善経験は、ほかでは得難いものだと考えています。
また、全社的にチャレンジを推奨する環境があります。そう考える理由は2つあります。これは私自身、中途入社として強く感じていることですが、新しい提案でも、フラットに前向きに議論できる空気感があります。これはすばらしい文化だと思います。
もう1つは、チーム内外問わず、エンジニアの技術力がとにかく高く、変化に柔軟に対応できること。これらが大きな要因だと考えています。
続いて、プロジェクトに集中できる環境について。NRE(Network Reliability Engineer)ポジションでは、システム開発やシステムの運用改善を専任として、本来やるべき改善に集中できる環境が整っています。組織もフラットで、承認に必要以上のコストがかかりません。
また、前のスライドで紹介したとおり、幅広い技術スタックに触れられるので、NREとしての能力を磨くには打ってつけの環境だと考えています。
最後に、ネットワーク運用業務の自動化は事例がまだまだ少ないので、これをやっておけばよいといった正解がなく、自ら作り上げていけるワクワクがあると思います。
このポジションで求める人材として、ネットワーク運用・開発・インフラ管理のいずれか1つにでも腕に覚えがある方で、今後スキルの幅を広げていきたいと考えている方にぜひ応募してもらいたいです。
例えば、ネットワーク運用業務を長年やってきて、自作のツールを業務に取り入れている方。また、ネットワークとは関係ない一般的なアプリケーション開発をやってきて、ネットワークの基本的な知識をお持ちの方。またはインフラの運用をやってきた方。
もしくは、モダンなインフラ運用管理の深い知識と経験があって、その他、スクリプト程度でもプログラミングの経験をお持ちの方。これらにピンと来た方は、Network Reliability Engineerポジションの採用情報の「応募するボタン」を今すぐ押してください。
以上が、ネットワークオペレーションチームと、NREポジションの紹介でした。気になることがある方は、このあとのQAで質問してもらってもいいですし、カジュアル面談を申し込んでもらえば、ここだけの話もできると思います。ご清聴ありがとうございました。ご応募をお待ちしています。
LINE株式会社
関連タグ:
2024.12.20
日本の約10倍がん患者が殺到し、病院はキャパオーバー ジャパンハートが描く医療の未来と、カンボジアに新病院を作る理由
2024.12.19
12万通りの「資格の組み合わせ」の中で厳選された60の項目 532の資格を持つ林雄次氏の新刊『資格のかけ算』の見所
2024.12.16
32歳で成績最下位から1年でトップ営業になれた理由 売るテクニックよりも大事な「あり方」
2023.03.21
民間宇宙開発で高まる「飛行機とロケットの衝突」の危機...どうやって回避する?
PR | 2024.12.20
モンスター化したExcelが、ある日突然崩壊 昭和のガス工事会社を生まれ変わらせた、起死回生のノーコード活用術
2024.12.12
会議で発言しやすくなる「心理的安全性」を高めるには ファシリテーションがうまい人の3つの条件
2024.12.18
「社長以外みんな儲かる給与設計」にした理由 経営者たちが語る、優秀な人材集め・会社を発展させるためのヒント
2024.12.17
面接で「後輩を指導できなさそう」と思われる人の伝え方 歳を重ねるほど重視される経験の「ノウハウ化」
2024.12.13
ファシリテーターは「しゃべらないほうがいい」理由 入山章栄氏が語る、心理的安全性の高い場を作るポイント
2024.12.10
メールのラリー回数でわかる「評価されない人」の特徴 職場での評価を下げる行動5選
Climbers Startup JAPAN EXPO 2024 - 秋 -
2024.11.20 - 2024.11.21
『主体的なキャリア形成』を考える~資格のかけ算について〜
2024.12.07 - 2024.12.07
Startup CTO of the year 2024
2024.11.19 - 2024.11.19
社員の力を引き出す経営戦略〜ひとり一人が自ら成長する組織づくり〜
2024.11.20 - 2024.11.20
「確率思考」で未来を見通す 事業を成功に導く意思決定 ~エビデンス・ベースド・マーケティング思考の調査分析で事業に有効な予測手法とは~
2024.11.05 - 2024.11.05