2024.12.19
システムの穴を運用でカバーしようとしてミス多発… バグが大量発生、決算が合わない状態から業務効率化を実現するまで
AWSコスト分析サービスを利用したコスト最適化(全1記事)
リンクをコピー
記事をブックマーク
ジョンフンモ氏(以下、ジョン):ディップでコスト最適化を実施した結果を発表します。インフラソリューション部システム基盤課のジョンフンモと申します。
本日のアジェンダです。まず自己紹介ですね。ジョンフンモと申します。出身は韓国で、2019年に日本に来ました。2022年6月にディップに入社して、現在は全プロダクトに対して横断的にAWSのコスト最適化を行っています。
次に背景をお話しします。AWS環境における複数のアカウントにディップのさまざまなサービスが構築されており、全アカウントのコスト分析・最適化が必要でした。特に使用率が多い「EC2」「RDS」「ElastiCache」をターゲットとして、全アカウントのコスト分析・最適化を定期的にする必要がありました。
利用したAWSの最適化サービスを軽く紹介しようと思います。
まず、「Trusted Advisor」です。これは、パフォーマンスとセキュリティを最適化するためのサービスです。どのくらいの金額を削減できるかを表示してくれます。詳しい内容は割愛します。
次は、「Compute Optimizer」です。最適なAWSコンピューティングリソースを推奨してくれるサービスです。いろいろなサービスに対応していますが、最近「Fargate」での「ECS」サービスが新機能として追加されました。Trusted Advisorよりもコンピューティングリソースの分析に特化したサービスで、良いです。
Compute Optimizerの詳細ですが、使用中のサーバーを「CloudWatch」サービスでモニタリングし、そのモニタリングデータをCompute Optimizerから分析して、最適なタイプを推奨してくれます。
推奨タイプを確認して、各システムの特徴を考慮しつつタイプ変更を行います。推奨オプションによって、差額やリスクを確認したり、変更後のメトリクスの比較をしたりすることが可能です。
次のステップで、定期的に分析・最適化を実施するために、コスト分析のレポートを構成しました。(スライドの)真ん中にある、各「Lambda」に行って、コスト分析に必要なメトリクスを収集します。
Compute Optimizerで対応していないリソースであるRDS、ElastiCacheは、「CloudWatchメトリクス」と「CloudWatch Logs」の情報を取得します。
「EventBridge」から、毎月1日、各Lambdaを実施する「Step Functions」を実行します。各Lambdaで収集された内容についてはS3にアップロードされます。
(スライドを示して)このコストレポートに対する結果がこちらです。収集されたメトリクスを基に、タイプ変更対象を選定します。例えばある方針を決めたとして、スケールダウンする場合を予想します。スペックが半分になるとして、最大値30パーセント、もしくは40パーセント以下のリソースを選定できます。
6月から段階的に最適化を行いましたが、変更した対象のデータを蓄積するために、1ヶ月間はEC2関連ではなく、ほかのリソースの最適化を行いました。
その結果、年間料金の約10パーセントのコスト削減ができました。定期的なコスト分析・最適化を実施したので、10月以降は過剰なプロビジョニングのリソースがどんどん少なくなり、全体的に安定している状況になりました。
そのため、コンピューティングリソースに対しては「Savings Plans」を購入し、RDS、ElastiCacheについては、「リザーブドインスタンス」を購入しようと考えています。
ちょっと早いですが、私の発表は以上です。ご清聴ありがとうございました。
司会者:ジョンさん、発表ありがとうございました。それでは、質疑パートに移りたいと思います。「Slido」に質問が来ているので読み上げていきます。
「Compute Optimizerで推奨されたインスタンスタイプに変更することによる問題はなかったでしょうか?(推奨はT系インスタンスだったが、ワークロードのコンピュート性能的にR系に変更する必要があったなど)」、そこの推奨と実際の差異みたいなものがあったかどうかというところですかね?
ジョン:基本的にCompute Optimizerからは、オプションとして3つの選択肢を出してくれるのでそこから選択しますが、例えば「8分の1にダウンしてください」みたいな推奨も出ているので、基本的には先ほどお話ししたとおり、段階的にスケールダウンすることをお勧めしています。
再度R系にタイプを変更することに対しては、基本的には使用量ごとにオプションが出しているし、そのタイプ変更によるリスクも、ある程度Compute Optimizerで判断して出してくれるので、その部分を注意して変更すれば、大きな問題はないかと思います。
司会者:ありがとうございます。続いて「コスト削減を進めるに当たって、全体的に苦労した点は何ですか?」
ジョン:どこから手をつければ良いか? というところが一番難しかったと思いますが、使用量が一番高いものから手をつけて、その部分に対して柔軟に対応している感じです。
司会者:なるほど、ありがとうございます。
関連タグ:
2024.12.20
日本の約10倍がん患者が殺到し、病院はキャパオーバー ジャパンハートが描く医療の未来と、カンボジアに新病院を作る理由
2024.12.19
12万通りの「資格の組み合わせ」の中で厳選された60の項目 532の資格を持つ林雄次氏の新刊『資格のかけ算』の見所
2024.12.16
32歳で成績最下位から1年でトップ営業になれた理由 売るテクニックよりも大事な「あり方」
2023.03.21
民間宇宙開発で高まる「飛行機とロケットの衝突」の危機...どうやって回避する?
PR | 2024.12.20
モンスター化したExcelが、ある日突然崩壊 昭和のガス工事会社を生まれ変わらせた、起死回生のノーコード活用術
2024.12.12
会議で発言しやすくなる「心理的安全性」を高めるには ファシリテーションがうまい人の3つの条件
2024.12.18
「社長以外みんな儲かる給与設計」にした理由 経営者たちが語る、優秀な人材集め・会社を発展させるためのヒント
2024.12.17
面接で「後輩を指導できなさそう」と思われる人の伝え方 歳を重ねるほど重視される経験の「ノウハウ化」
2024.12.13
ファシリテーターは「しゃべらないほうがいい」理由 入山章栄氏が語る、心理的安全性の高い場を作るポイント
2024.12.10
メールのラリー回数でわかる「評価されない人」の特徴 職場での評価を下げる行動5選
Climbers Startup JAPAN EXPO 2024 - 秋 -
2024.11.20 - 2024.11.21
『主体的なキャリア形成』を考える~資格のかけ算について〜
2024.12.07 - 2024.12.07
Startup CTO of the year 2024
2024.11.19 - 2024.11.19
社員の力を引き出す経営戦略〜ひとり一人が自ら成長する組織づくり〜
2024.11.20 - 2024.11.20
「確率思考」で未来を見通す 事業を成功に導く意思決定 ~エビデンス・ベースド・マーケティング思考の調査分析で事業に有効な予測手法とは~
2024.11.05 - 2024.11.05