システムはなぜダウンするのか

システムはなぜダウンするのか

システムはなぜダウンするのか

第1章 システムが止まった・・・
1.1 停止 = ダウンは誤解
1.2 ダウンは原因から4種類に分けられる

第2章 きちんとテストしたはずなのに・・・
2.1 突然に目を覚ます20世紀のバグ
2.2 忘れたころにやってくる「日付問題」
2.3 データベースのデッドロックが連発

第3章 アプリケーションだけではない・・・
3.1 停止を検地できない
3.2 組み合わせを変えたら動かない
3.3 メモリーをつかんだまま解放しない

第4章 アクセス殺到に耐え切れず・・・
4.1 ハードウェアの性能を活かしきれない
4.2 メモリー、CPUが足りない
4.3 通信データの増加がダウンをまねく
4.4 データベースが満杯に
4.5 夜が明けてもバッチ処理が終らない

第5章 気付かなかったは許されない・・・
5.1 つい見逃すパラメータ変更
5.2 システム環境の変更ミス
5.3 バッチ・ファイルの適用忘れ
5.4 カレンダーの設定ミス

第6章 その「うっかり」が致命傷・・・
6.1 運用コマンドを間違える
6.2 データの移行・入力ミス
6.3 待機系への切り替えに失敗
6.4 混乱が「2次災害」を生み被害拡大

第7章 まさか、こんなことが起こるとは・・・
7.1 サーバーが壊れた
7.2 通信ネットワークが不通に
7.3 コンピュータ、電気なければただの箱
7.4 震災でデータセンターが破壊・焼失

第8章 障害対応は時間との闘い・・・
8.1 原因究明よりも復旧を優先

すんばらしくわかりやすい。
ただ、システムダウンについて概観をつかむのにはむいているけれど、具体的な対策法(どういう技術を使うとか)についは書かれていない。

この本で、システムダウンの全体像を掴んでから、技術書に行くのが良いのかもしれない。