2024.12.19
システムの穴を運用でカバーしようとしてミス多発… バグが大量発生、決算が合わない状態から業務効率化を実現するまで
インフラエンジニア/仕事内容(全1記事)
提供:LINE株式会社
リンクをコピー
記事をブックマーク
カーンフィロズ氏:カーンと申します。私からはインフラエンジニアの仕事の内容についてお話をします。
現在ITサービスセンターに所属していまして、システム室長兼システムソリューションチームのマネージャとして勤務しています。2016年にLINEに入社し、現在5年目となります。
LINEのすべてのサービスのインフラを担当しているシステム室の中で、主にハードウェアとOSとシステムインテグレーションの部分を担当しています。現在システム室には、約21名が在籍しています。
インフラの規模感について簡単に説明します。昨日の時点のデータになりますが、PMとVMを合わせて約116,000のホストになっています。Regionで言いますと、主要なリージョンは東京となっていまして、あとは大きくシンガポールと韓国にも一部のサーバーが配置されています。
物理的なサーバーの台数で言うと、48,000台となりますが、予備サーバーも含めますとだいたい5万台を超過しています。VMで言うと、68,000台とあります。この中でPrivate Cloud Verdaの仮想基盤が約63,000台となっていまして、残りの5,000台ぐらいはVMWareが基盤となっています。
今回、本日の話の中心はFinTechがメインとなりますけど、FinTechの仮想基盤がVMWareでして、主に5,000台の60パーセントを占めています。あとはOSの部分となりますが、LINEのサーバーOSは主に80パーセント以上がCentOSとなっています。一部WindowsとVMWareのOSもありますが、基本的にRedHat系のCentOSとなっています。
簡単にシステム室のミッションについてお話しします。1つ目がPrivate Cloudの部分で、そこのBaremetalの標準化や円滑に提供することが我々のミッションとなります。あとは、よりコストを最適化したハードウェアの提供、スペックの標準化。直近ではラックでサーバーを設置するところから、OSのインストール、Private Cloudの自動化・標準化までをやっています。
そしてシステムの開発です。現在主に注力しているのは運用の自動化や大規模な監視システムを我々のほうでも開発しています。一部親会社や他社へアウトソーシングしているソリューションもありますが、今は極力自社で開発を進めています。
あとは4つ目になりますが、システムインテグレーションとソリューションアーキテクトというミッションがありまして、主に新機能のサービスの立ち上げの際、最適なインフラの提供の支援またはFinTechのような特殊なサービスの場合は、ソリューションアーキテクトの支援をしています。また、定期的に総合的なインフラ全体のコスト最適化とインフラ使用率の向上を図っています。
チーム構成について簡単に説明します。システム室では現在3つのチームがあります。1つ目はシステムエンジニアのチームで、先ほども話したOSとハードウェアがメインの役割となっています。システムデベロップメントチームが先ほどの開発の部分を担うチームになっていて、主にインフラの低使用率の管理システムや監視システムの開発をしています。
システムソリューションチームが今回の中心のチームで、今一番求めている人材としてはFinTech用のインフラ環境の構築と運用のポジションです。役割としてはFinTechがメインとなりますが、それ以外でいうと、新規サービスのインフラのコンサルティングも一応チームの役割としては入っています。
日常業務とプロジェクトの進行について簡単に説明します。システム室では、大きく2つのパターンで仕事をしています。1つ目は日常業務で、チケットベースのタスク。2つ目はプロジェクトベースのタスクになります。チケットベースのタスクで言いますと、サーバーの購買、構築、設定変更と撤去がメインとなります。
また他部署との問い合わせ対応だったり、サーバーのハードウェアのインシデントの管理、あとは定期的なSSL証明書の購買、設定、管理です。これらの作業をすべてチケットベースで行っています。
プロジェクトベースの業務としては、短期プロジェクトや長期プロジェクト、定期的に繰り返し行っていくプロジェクトがあります。業務の運びとしては、チームだけで完結しているプロジェクトもあれば、チームを跨ってのプロジェクト、他部署、他の組織と連携しているプロジェクトも存在します。
入社された場合は、担当業務のイメージとして、これはソリューションチームメインでのお話しになりますが、2つのパターンがあります。1つ目がプロジェクトマネジメント。これは主に、FinTechサービスにおけるインフラ部門の取りまとめ。領域としてはサーバーとOSと、ネットワーク知識が必要になると思うのですが、ネットワークチームとデータベースチームと連携してプロジェクトを進めます。
当然、その中でのissue管理であったりインフラ運用の改善を取りまとめることになります。技術的な領域で言いますと、LinuxとWindowsとvSphere、エンタープライズストレージです。あとはもちろん、日常運用に関わるツールの開発やプロセスの改善を取りまとめます。
一部でPrivate Cloudも使用していまして、こちらはその経験があれば歓迎なのですが、AWSとGCPのPublic Cloudソリューションのところにも携わってもらいます。あとは当然、障害対応と運用の自動化やプロセス化。基本的に求めているのは、これはスキルセットによると思うんですが、割合的なところで言うと半々ぐらいになるかなと思っています。
入社後の関わる業務内容とサービスです。これはバーチャルな組織になりますが、FinTechカンパニーがありまして、(スライド参照)今画面に出ているようなさまざまな法人としての会社が存在します。この中で、主にLINE Financialのところの担当として関わっていくことになります。
その中で新たにLINEでは銀行を開業予定なので、そちらのインフラの担当となります。簡単にいうと、レイヤーとしてはプロジェクトマネジメント的な部分が全体としてありまして、先ほど説明したようにOSの部分であったり仮想化の部分と、あとはハードウェアになります。これらの3つのレイヤーのシステムをアーキテクトすることや、インシデント管理やトラブルシューティングがメインの担当になります。
最後は最近の事例の紹介です。FinTechサービスではLINE証券、これは昨年リリースされているサービスの構築で、今年でいうとFundとFXの構築を行っていました。あとは定期的に行っている低使用率のサーバー可視化と回収の仕組みを構築しています。
LINEが急に成長してきて、サーバーが約5万台を超えていて、けっこう眠っていたり使用率が低いサーバーもあるので、そこは自発的に自動化システムによって検知して、サーバーの利用者に回収してもらったり、物理サーバーから仮想化サーバーに移行してもらったり、そういった活動も行っています。
あとは運用のプロセスの自動化ですね。例えばディスクが壊れました、メモリが壊れましたなどのインシデントが起きたときに、今までは、業務委託のデータセンターに常駐している方よりチケットを寄与して対応してもらって、SEが確認していたという層があったんです。
これを自動化しまして、Botが検知してチケットを生成し、その後データセンターのスタッフが物理的な作業を行ったあとに、またBotによってそのステータスを確認して、問題なくステータスを確認でき次第、チケットがクローズされるような仕組みになっています。これによって、人が手を動かしてやっていた80パーセントの作業が自動化されました。
あとは4番目の、サーバーの最新機器の徹底的な検証ですね。大量の物理サーバーを購買することになるので、ここはできるだけ標準化していまして、そこの機器検証を行っています。その次のGPUについては、直近でGPUの需要が増えているため、さまざまなGPUの検証をできるだけ標準化しようとしており、その提供をしています。またGPUの使用率のモニタリング環境も構築していました。
あと最後は、昨年のなんですが、シンガポールデータセンターの構築も行っていました。
求める人物像は、LINEで楽しめる人で、これはあくまでも個人的な意見になると思いますが、だいたい積極的で好奇心のある方。やろうと思えば何でもできる環境なので、楽しめるかなと思います。あとは技術力やサービスの観点で生かそうと考えられる方ですね。お客様のニーズを第一で考える方です。
あとは得意な技術領域が1つでもある方ですね。周りから頼られるようになります。技術の領域で人によって得意な部分が何かしら1つはあると思うので、そこが1つでもあればいいなと思います。あとはこれが一番重要かなと思うんですけど、どんなことでも最後までやり遂げる気持ちが強い方が、非常にLINEで楽しめるかなと思います。
難しい課題が多いので、新しい挑戦が多く、サーバーで言うと非常に台数も多いですし、いかにそこを標準化することであったり、LINEの新しいサービスを立ち上げる際に、そこのノウハウもけっこう必要とされるので、チャレンジが多いところがあります。やはりそこで、最後までやり遂げる方が一番求める人物でもあるかなと。新しい経験ができるので楽しめますしね。
普通の課題で当たり前なことではあると思うのですが、マルチタスクがけっこう多くて、複数のプロジェクトに同時に参加することになるので、そこが得意な方ですね。最後は、問題や課題解決が好きな方。問題というのが常にどこの職場でもあると思うのですが、自発的に問題を検知して、解決を図っていくことが好きな方は非常に歓迎されると思います。
これで、私の発表は以上となります。
LINE株式会社
2024.12.20
日本の約10倍がん患者が殺到し、病院はキャパオーバー ジャパンハートが描く医療の未来と、カンボジアに新病院を作る理由
2024.12.19
12万通りの「資格の組み合わせ」の中で厳選された60の項目 532の資格を持つ林雄次氏の新刊『資格のかけ算』の見所
2024.12.16
32歳で成績最下位から1年でトップ営業になれた理由 売るテクニックよりも大事な「あり方」
2023.03.21
民間宇宙開発で高まる「飛行機とロケットの衝突」の危機...どうやって回避する?
PR | 2024.12.20
モンスター化したExcelが、ある日突然崩壊 昭和のガス工事会社を生まれ変わらせた、起死回生のノーコード活用術
2024.12.12
会議で発言しやすくなる「心理的安全性」を高めるには ファシリテーションがうまい人の3つの条件
2024.12.18
「社長以外みんな儲かる給与設計」にした理由 経営者たちが語る、優秀な人材集め・会社を発展させるためのヒント
2024.12.17
面接で「後輩を指導できなさそう」と思われる人の伝え方 歳を重ねるほど重視される経験の「ノウハウ化」
2024.12.13
ファシリテーターは「しゃべらないほうがいい」理由 入山章栄氏が語る、心理的安全性の高い場を作るポイント
2024.12.10
メールのラリー回数でわかる「評価されない人」の特徴 職場での評価を下げる行動5選
Climbers Startup JAPAN EXPO 2024 - 秋 -
2024.11.20 - 2024.11.21
『主体的なキャリア形成』を考える~資格のかけ算について〜
2024.12.07 - 2024.12.07
Startup CTO of the year 2024
2024.11.19 - 2024.11.19
社員の力を引き出す経営戦略〜ひとり一人が自ら成長する組織づくり〜
2024.11.20 - 2024.11.20
「確率思考」で未来を見通す 事業を成功に導く意思決定 ~エビデンス・ベースド・マーケティング思考の調査分析で事業に有効な予測手法とは~
2024.11.05 - 2024.11.05