オブザーバビリティ（Observability）

定義

システムの外部出力（ログ・トレース・メトリクス）だけを見て、内部状態を推測・診断できる度合い。

「モニタリング（既知の失敗を検知）」と異なり、オブザーバビリティは未知の問題を探索・診断できる能力を指す。

モノリシックなシステムでは「どこで壊れたか」がスタックトレース1つで分かる。分散システムでは、リクエストが複数のサービスをまたいで処理されるため：

→ サービス間のリクエストの流れを一本の糸として追跡できなければ、診断が不可能になる。

AIエージェントは以下の特性により、可観測性の難易度が通常のAPIより高い：

→ どのステップで・なぜ・どんな判断をして・どこで失敗したかを追跡するトレースが必須。

Google SREの定義では、監視すべき4つのゴールデンシグナルとして以下を挙げる：

ツール	対象	強み
OpenTelemetry	あらゆる分散システム	汎用計装標準。ログ・トレース・メトリクスすべてをカバー
Langfuse	LLM / AIエージェント特化	プロンプト・補完・トークンコスト・評価スコアを可視化

AIエージェントシステムでは両者を層ごとに使い分けるのが現実的：

OpenTelemetryはLangfuseへのエクスポートにも対応しているため、計装は統一しつつ用途別に転送することも可能。