SLOはPM・開発・SREの3者が同意して決める
ルール
SLOの初期設定、および変更時には、以下の3者全員の同意を必須とする:
| ステークホルダー | 視点 | 確認事項 |
|---|---|---|
| PM(プロダクトマネージャー) | ユーザー満足度・ビジネス要件 | このSLOはユーザーの期待を反映しているか |
| 開発チーム | 実装可能性・コスト | このSLOを達成するために何が必要か |
| SRE / 運用チーム | 実行可能性・監視能力 | このSLOを計測・維持できるか |
理由
一方的に決められたSLOは守られない:
- PMが独断で99.99%を設定 → 開発・SREが現実的でないと感じ形骸化
- SREが保守的に設定 → PMが「厳しすぎる」と無視
- 開発が現状ベースで設定 → ユーザーの期待と乖離
3者合意により:
- エラーバジェットを共同所有できる(全員が同じ基準で議論)
- SLO違反時の対応方針を事前合意できる
- 「信頼性 vs 速度」の議論をデータベースにできる
実践
SLO設定ワークショップを開催し:
- ユーザーにとっての「幸福の条件」を言語化
- 過去6〜12ヶ月のSLIデータを確認
- 3者で数値をドラフト → 見直し → 合意
- エラーバジェットポリシー(何をトリガーに何をするか)も同時に合意
四半期ごとにレビューし、実態と乖離していれば調整する。
例外
新規サービスはデータが少ないため、最初のSLOは仮のもの(暫定SLO)として設定し、3ヶ月後に見直しを行う。
出典
Google SRE Workbook(Betsy Beyer他)第2章「Implementing SLOs」