バーンレート
定義
バーンレート = エラーバジェットの消費速度の倍率。
- バーンレート 1 = SLO期間ちょうどにバジェットを使い切るペース(正常)
- バーンレート 2 = バジェットを2倍の速度で消費(SLO期間の半分で枯渇)
- バーンレート 14.4 = 1時間でバジェットの1/20を消費(重大障害レベル)
バーンレート = エラー率 ÷ エラーバジェット
例:SLO 99.9%(バジェット0.1%)のとき
現在のエラー率が1% → バーンレート = 1% / 0.1% = 10
なぜ重要か
バーンレートを見ることで:
- 即座の深刻さがわかる(エラー率だけでは文脈がない)
- このまま続いたら何時間でバジェットが枯渇するかが計算できる
- アラートの優先度を客観的に設定できる
適用場面
- SLOベースのアラート設計をするとき
- インシデント対応中に「どのくらい深刻か」を定量化するとき
- ポストモーテムで「なぜ気付くのが遅れたか」を分析するとき
バーンレートとアラート優先度の目安
| バーンレート | バジェット枯渇まで | 対応レベル |
|---|---|---|
| 14.4 | 1時間 | ページング(即時対応) |
| 6 | 2.5日 | ページング(即時対応) |
| 3 | 5日 | チケット(翌営業日) |
| 1 | 30日 | なし or 週次確認 |
関連概念
- エラーバジェット — バーンレートの対象
- SLO / SLI / SLA — バーンレート計算の基準
- 多ウィンドウ多バーンレートアラート — バーンレートを使ったアラート実装パターン
出典
Google SRE Workbook(Betsy Beyer他)第5章「Alerting on SLOs」