キャパシティ計画
定義
キャパシティ計画とは、予測される需要を満たすために必要なリソース(サーバー・帯域・ストレージ)を事前に確保するプロセス。
単純に「現在の使用量 + α」ではなく、以下を考慮する:
- 成長率(トラフィックの増加傾向)
- ピーク需要(通常時の何倍になるか)
- 冗長性のためのバッファ(N+2など)
- 地理的分散(複数リージョンへの分配)
なぜ重要か
キャパシティが不足すると:
- 飽和(Saturation)がゴールデンシグナルで検知される
- レイテンシが上昇し、最終的にサービス停止
過剰でも問題:コストの無駄。
単一障害点(SPOF) を作らないこと。最小単位のインスタンス数は「N+2」(1台停止 + 1台メンテナンス)が基本。
適用場面
- 年次のリソース予算策定
- 大規模イベント(セール、ローンチ)前の事前スケールアップ
- 新機能追加前の負荷予測
- オートスケーリングのしきい値設定
オートスケーリングの落とし穴
| 問題 | 対策 |
|---|---|
| スケールアップが遅くてトラフィックピークに間に合わない | プロアクティブなスケールアップ(スケジュールベース) |
| スケールダウンが速すぎて再スパイク時に失敗 | スケールダウンは慎重に(長い待機時間) |
| 最小インスタンス数が1 | 最低2台以上(1台故障時に0にならないように) |
関連概念
- ゴールデンシグナル — 飽和度はキャパシティの逼迫を示す
- SLO / SLI / SLA — キャパシティはSLO達成の前提条件
出典
Google SRE Workbook(Betsy Beyer他)第11章「Being On-Call」および第12章「Handling Overload」