本文へスキップ
執筆
2026年5月 1 分で読めます

継ぎ目こそがシステム

信頼性がサービス内部で失われることは稀で、境界で失われます。だから設計の労力はそこに注ぐべきです。

Distributed SystemsReliability

これまで書いたポストモーテムは、最終的にどれも境界を指していました。負荷を増幅させたリトライ、合成できないタイムアウト、静かに順序を入れ替えるキュー。各サービス内部のコードは正しく、システムはサービスの隙間で壊れていました。

私たちは設計の労力の大半を「箱」に費やし、「矢印」にはほとんど割きません。けれど面白い障害は矢印に潜みます。部分障害、バックプレッシャー、クロックスキュー、サンダリングハード。

有用な規律があります。アーキテクチャ図の矢印ごとに、それが「遅いとき」「落ちたとき」「嘘をつくとき」に何が起きるかを書き出すこと。三つに答えられないなら、それが次の設計課題です。

コメント

コメントを読み込み中…