以下の内容はhttps://namonakimichi.hatenablog.com/entry/2025/07/12/202041より取得しました。


SRE NEXT 2025に一瞬だけ参加した

昨年参加したかったのですが、感染症にかかってしまい参加できなかったのでそのリベンジで参加しました。 ただ今年もタイミングがあまりよくなく、じっくりと参加できなかったので本当に簡単な感想だけ。

イベントページ

SRE NEXT 2025 https://sre-next.dev/2025/

トーク

時間的に間に合ったのが最後のキーノートだけでした。

システム障害対応のツマミになる話

【改訂新版】システム障害対応の教科書 | 技術評論社 この本の話のスピンオフみたいな感じでした。そういえば新版は買っていなかったので、帰り際に買いました。

  • 障害対応の難しさ
    • ある日突然、障害対応者になる難しさがある
      • 平日はリーダーやサブリーダーなど、体制が組まれているが休日に一人で見なければいけないこともある
      • 構えてなくてもいきなりやってくることがある
    • その対応自身も暗黙知が多く、形式化されていない課題がある
      • 起こってみて初めて知ることもある
      • 場所が分からない、何を見ればいいのか分からない
    • 障害の定義・範囲もチームや企業によって概念が異なる
      • インシデント管理までなのか?
      • トリアージなどの概念と当てはめたときともまたずれるが…?
  • 暗黙知形式知に変えていく必要性
    • 対応できる人を増やす
    • 何を傷害として扱うかなどの定義決め
    • 障害対応時の組織体制の構築
      • インシデントコマンダー
      • それ以外の作業者・ユーザー担当・etc...
    • インシデントコマンダーが直接対応せずに、作業者を学習・成長させる環境づくり
  • オブザーバビリティ
    • 外から見た時の監視の重要性
    • ツールの選定・活用
    • ダッシュボードの興味関心
      • 関係者の視点によって必要な情報が異なる
      • 何を見ればいいのか? が割れてしまうのはこの点が影響している
      • 関係者ごとに必要な情報の整理が必要

体系的な学びをしておき、どのような対応をしていくのかという広い視点で物事を考えていきたいと思いました。 紹介のあった本は早めに読んでおきたい。

ブース

適当にいくつか見ましたが、AIの活用をインフラにも、というところも増えつつあるような印象を受けました。 サービス組み込みについてもそうですが、Terraformなどのコードによるインフラ構成管理も各社取り組んでいるので、そこは活用余地がありそうだなと思いました。 興味深かったのが可用性のAIの活用についてで、このあたりってどうやってそもそも生かすんだろうな?というのが全くイメージがつかなかったので、調べて見たいと思いました。

各種ブースで構成とか、アンケートの内容とか見ていて学びが多かったです。

あと NOC ブースとか書籍ブースとか、モニタリングの体験会とかあったようなのですが、行く時間がなかったので断念しました。 行きたかった…!

まとめ

来年はゆっくり参加したいです。 2026年もこの時期に開催されることをクロージングで発表されていたので、来根は少なくとも土曜はじっくりと参加できるようにしたいです。




以上の内容はhttps://namonakimichi.hatenablog.com/entry/2025/07/12/202041より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14