【スゴ本】知らないと現場が燃え尽きる。システム障害対応で本当に優先すべき5つのこと

「システム障害」でネット検索しても、ありきたりなことしか出てこない。問題はそこではない。部分的にしか見えない流動的な状況において、錯綜する情報を元に、何を優先しどう対応していけば良いか、分からないことにある。『システム障害対応の教科書』は、まさにそんな状況での基本的な動作と現場のマネジメントをまとめたものだ。この記事では、本書をベースに、私の経験を交えた5つの勘所を解説する。

【12/17(火)オンライン開催!】障害対応の属人化から脱却。全員を巻き込む仕組みづくりの方法

本イベントは「インシデント対応の仕組み化」をテーマにインシデント対応の「仕組み化」を徹底解剖します。属人化による負担軽減、対応スピードの向上、再発防止の徹底など、仕組み化の成功事例・失敗事例から、明日から使える実践的なノウハウをお伺いします。

障害対応を属人化させない。「全員インシデントコマンダー」体制を根付かせた、山本五十六の格言【NewsPicks SRE 安藤裕紀】

NewsPicksのSRE安藤氏は、障害対応の属人化解消へ向け全員が動ける組織作りを進めた。「山本五十六」の言葉を指針に、どのようにメンバーを育成したのか。インシデントコマンダーとして自走できるチーム構築の具体的なプロセスを聞く。

W杯全64試合無料生中継で「落ちない」を実現。「小さく壊れる」ために行った負荷・障害・セキュリティ対策とは?【ABEMA DEVELOPER CONFERENCE 2023#3】

日本代表の躍進に日本中が沸いたFIFA ワールドカップ。ABEMAは全64試合の無料生中継を行い、同社史上最大の同時接続数を記録した。本記事では、ABEMAのエンジニアチームはW杯生中継においてどのように負荷・障害・セキュリティ対策を行なったのかを紹介する。

  • 1