2024.12.19
システムの穴を運用でカバーしようとしてミス多発… バグが大量発生、決算が合わない状態から業務効率化を実現するまで
システムエンジニアリングチームについて(全1記事)
提供:LINE株式会社
リンクをコピー
記事をブックマーク
木村智洋氏(以下、木村):システムエンジニアリングチームです。エンジニアリングチームの主に大きな2つの仕事として、OSとハードウェアがあります。
まず、OSですが、主にCentOSを使っています。OSをインストールした状態でそれぞれのサービスの人に渡せるように標準化しています。
たくさんサーバーがあるので、そのあたりでいろいろな悩みがありますが、サーバーに対して、どうやってOSをインストールしていくのかを考えています。
なので、例えば、OSのインストーラーを開発したり、先ほどカーン(カーンフィロズ氏)からも話がありましたが、ZTP(Zero Touch Provisioning)の環境を作ったり、ツールを開発しています。
ハードウェアのところは、主にx86のサーバーを使っています。その標準化、評価、検証、ほかにもOSのインストーラーとあわせて導入の検証をやっています。
ファームウェアもずっと同じものを使うわけではなく、新しいものが出てきたタイミングでどんどん検証をしています。最近だとGPUもたくさんあるので、NVMeもあります。また、ネットワークのNICですね。サーバーのNICのパーツの評価もしています。
また、ネットワーク室がデータセンター全体の管理をしているのですが、サーバールームの中のラックをどうやって使っていくのかというところも、システム室とエンジニアリングチームで考えて管理をしています。
ほかにも、日々運用している中で、OSのトラブルだったり物理サーバーの故障だったり、ファームウェアの故障だったり、あまり起こってほしくないですが、ハードウェア的なロット不良もあるので、そのあたりのトラブルシューティングをしています。
また、OSでいうと、セキュリティ的なパッチもエンジニアリングチームがやっています。それから、デベロップメントチームもいますが、僕たちも運用ツールを一部開発しています。
利用技術について。会社全体で使うOSを標準化しているので、当然Linuxの深い知識が必要です。カーネルのソースコードを書く必要はありませんが、カーネルがどういうものなのかとかを知っておく必要があります。また、OSインストーラーも扱っているので、Linuxのブートシーケンスなどの知識も必要です。
また、「Sys Admin」の知識も必要です。「Sys Admin」と言うと、思い浮かべる意味がみなさんそれぞれで変わると思いますが、簡単に言うと、etc配下のファイルをどういうふうにしましょうかというところの知識も必要になります。
ほかには、ハードウェアの検証もしているので、ハードウェアの知識や、性能評価もしているのでベンチマークの知識も必要です。
それから、インストーラーやZero Touch Provisioningのツールも開発していたり、OSのパッチ当てとかで、全部手動でログインしてコマンド打つことはなく、ある程度自動化をしているので、プログラミング言語としては、スクリプティング言語があればいいかなと思います。
(スライドを示して)このあたり、PythonやPerlと書いていますが、特に言語を指定はしていません。ただ、プログラミングは一応必須になっています。
担当業務のイメージを図に表すとこのような感じです。下から、ラック管理をしています。あとは、そこに搭載されるハードウェアの標準化。Virtualizationのところはスキップして、さらにその上の、インストールされるOSの標準化をやっています。
開発としては、OSのインストーラーを開発していたり、先ほどSIM(System Infra Manager)というポジションもありましたが、一部大規模案件のサーバーのデプロイメントもやっています。
また、日々の故障もあるので、そこのトラブルシューティングをしたり、再発防止策を考えたりなど、業務の効率化をやっています。ここまでが、エンジニアリングチームの紹介でした。
(スライドを示して)これがシステム室全体の最近の仕事の例です。ソリューションチームは、Fintech系のインフラの構築をやりました。
2番目の低使用率サーバーの可視化について。ソリューションチームとデベロップメントチームの仕事です。使っていないサーバーをなるべく簡単に回収したり、使用している人たちに対して「うまく使えていないですよ」とお知らせするツールを作って回収もやりました。
また、運用プロセスの自動化ですが、デベロップメントチームと、エンジニアリングチームとしてやっています。ハードウェアの故障を自動で検知して、復旧したら自動でチケットをクローズするツールを作りました。
サーバーの最新機器の検証や、GPUは、エンジニアリングチームで検証と構築を行いました。
システム室として求める人物像についてお話しします。これはけっこうLINE全体にも言えることですが、積極的で、好奇心旺盛な人を求めています。
なにかチケットが与えられたり、上の人から仕事を与えられてやっている人たちは、あまりLINEには馴染みません。自分で問題点を見つけて、どんどん新しい仕事を見つけていける人を求めています。また、セルフマネジメントの点がちょっと大きいので、そのあたりも積極性が必要です。
技術職ではあるので、技術職として技術力は必要ですが、会社のためにその技術力を使ってなにか仕事を作れる人が必要となっています。
ほかには、なにか1つ得意な領域があれば、すごくいいと思います。当然、マルチにできる人もいますが、すごく得意な分野があるとよいと思います。
LINEもどんどん成長しているので、難しい課題はありますが、それをやり遂げられる、途中で折れないという気持ちも必要だとは思います。
それから、マルチタスクもちょっと多いので、1つの課題に集中してやるというより、複数の課題を並行してやることが多いと思います。また、問題や課題解決が好きな人が、求める人物像です。
以上がシステム室の紹介となります。
LINE株式会社
関連タグ:
2024.12.20
日本の約10倍がん患者が殺到し、病院はキャパオーバー ジャパンハートが描く医療の未来と、カンボジアに新病院を作る理由
2024.12.19
12万通りの「資格の組み合わせ」の中で厳選された60の項目 532の資格を持つ林雄次氏の新刊『資格のかけ算』の見所
2024.12.16
32歳で成績最下位から1年でトップ営業になれた理由 売るテクニックよりも大事な「あり方」
2023.03.21
民間宇宙開発で高まる「飛行機とロケットの衝突」の危機...どうやって回避する?
PR | 2024.12.20
モンスター化したExcelが、ある日突然崩壊 昭和のガス工事会社を生まれ変わらせた、起死回生のノーコード活用術
2024.12.12
会議で発言しやすくなる「心理的安全性」を高めるには ファシリテーションがうまい人の3つの条件
2024.12.18
「社長以外みんな儲かる給与設計」にした理由 経営者たちが語る、優秀な人材集め・会社を発展させるためのヒント
2024.12.17
面接で「後輩を指導できなさそう」と思われる人の伝え方 歳を重ねるほど重視される経験の「ノウハウ化」
2024.12.13
ファシリテーターは「しゃべらないほうがいい」理由 入山章栄氏が語る、心理的安全性の高い場を作るポイント
2024.12.10
メールのラリー回数でわかる「評価されない人」の特徴 職場での評価を下げる行動5選
Climbers Startup JAPAN EXPO 2024 - 秋 -
2024.11.20 - 2024.11.21
『主体的なキャリア形成』を考える~資格のかけ算について〜
2024.12.07 - 2024.12.07
Startup CTO of the year 2024
2024.11.19 - 2024.11.19
社員の力を引き出す経営戦略〜ひとり一人が自ら成長する組織づくり〜
2024.11.20 - 2024.11.20
「確率思考」で未来を見通す 事業を成功に導く意思決定 ~エビデンス・ベースド・マーケティング思考の調査分析で事業に有効な予測手法とは~
2024.11.05 - 2024.11.05