2026年5月 1 分で読めます
継ぎ目こそがシステム
信頼性がサービス内部で失われることは稀で、境界で失われます。だから設計の労力はそこに注ぐべきです。
Distributed SystemsReliability
これまで書いたポストモーテムは、最終的にどれも境界を指していました。負荷を増幅させたリトライ、合成できないタイムアウト、静かに順序を入れ替えるキュー。各サービス内部のコードは正しく、システムはサービスの隙間で壊れていました。
私たちは設計の労力の大半を「箱」に費やし、「矢印」にはほとんど割きません。けれど面白い障害は矢印に潜みます。部分障害、バックプレッシャー、クロックスキュー、サンダリングハード。
有用な規律があります。アーキテクチャ図の矢印ごとに、それが「遅いとき」「落ちたとき」「嘘をつくとき」に何が起きるかを書き出すこと。三つに答えられないなら、それが次の設計課題です。
コメント
コメントを読み込み中…