以下の内容はhttps://tech.andpad.co.jp/entry/2025/07/18/100000より取得しました。


アンドパッドSRE/CREメンバーによるSRE NEXT 2025のおすすめセッション

こんにちは。SREチームの吉澤です。最近、SRE NEXTドリブンでSREとSWEでタッグを組んでインフラコスト削減した話を書きました。まだの方はぜひ読んでみてください。

アンドパッドは、7/11(金)〜12(土)開催のSRE NEXT 2025にCOFFEEスポンサーとして協賛しました!

今回はアンドパッドブースの様子と、現地参加したメンバーによるおすすめセッションをご紹介します。アーカイブ動画もこれから公開されると思いますので、これからSRE NEXT 2025の内容を追う方は、ぜひ参考にしてみてください。

アンドパッドブースの様子

今回はスポンサーブースの部屋の真ん中で、COFFEEスポンサーとしてアイスコーヒーを提供しました。以下はブースの様子です。2日とも盛況で、のべ500名の方にお越しいただきました。ありがとうございました!

ブースでは、アイスコーヒーと一緒に、xREチームの最新技術トピックをまとめたチラシを配布しました。昨年のCloudNative Days Winter 2024で好評だったチラシの最新版です!

SRE NEXT 2025限定配布のチラシ

チラシの画像へのリンク(拡大表示したい方向け)

アンドパッドでは、SREのプラクティス(ポストモーテムなど)を複数の横断チームで実践しています。そのため、SREに興味がある人でも、SREチーム以外のほうがやりたいことにマッチする可能性があります。そのため、アンドパッドではxREチーム合同でこのような情報発信をしています。

私がブースで対応した方からは「専門のDBREチームがあるのはうらやましい」というコメントを多くいただきました。このような、現場の様子がわかる情報発信を今後も続けていきますので、SRE関連イベントでアンドパッドブースをお見かけの際は、ぜひお立ち寄りください!

SRE/CREメンバーがおすすめするセッション

ここからは、現地参加したSRE/CREメンバーによる、おすすめセッションのご紹介です。すべては紹介しきれないので、現地で直接聞いたセッションから、1人あたり数本に厳選してもらいました。

SREチーム吉澤のおすすめ

Rethinking Incident Response: Context-Aware AI in Practice(株式会社Topotal 吉川さん)

Incident Response (IR) SaaSのWaroomを提供するTopotalのCTOであるrrreeeyyyさんによるセッションです。

セッションの前半では、インシデント対応関連の動向が紹介されました。インシデント対応のプラクティスが普及して状況はよくなりつつあるが、まだ課題は多く、それらの課題の解決にAI/LLMを活用するケースが増えてきていることが示されました。

セッションの後半では、車の自動運転レベル(L0〜L5)と対比させる形で、インシデント対応の自動化レベル(IR0〜IR5)を定義し、それに沿って現状を解説してくれました。いま現在はIR2(判断支援・提案)くらいまでは実現されてきており、IR3(実行・監視責任もAI)相当の実現可能性も出てきているそうです。

IR2+の具体例として、Claude CodeとWaroom MCPを連携させたデモ(下記)を紹介されていました。

  • Sentryの検知したエラーをClaude Codeに読み込ませて、インシデントを起票するかどうかを判断させる
  • Claude Codeは作業者と対話しつつ、Waroom MCPを通してSlackへのインシデント対応状況の投稿、修正PRの作成、対応完了の報告、ポストモーテムの作成を行う

セッション後に、Topotalブースでデモの詳細を伺いました。こちらのデモにはまだ、Claude Codeを特定の作業者の手元で動かすことによる制約(他の人がClaude Codeの出力を参照できない、Claude CodeはSlackのインシデント対応チャンネル上のコメントを確認できない、など)があるのに加えて、修正PRのレビューや対応完了の判断にはまだ人間が必要、とのことでした。

このあたりの制約が解決されて一定のクオリティを超えたら、いままでのインシデント対応の方法を変えてでもWaroomを採用したい、といった企業が増えるのではないかと感じました。

対話型音声AIアプリケーションの信頼性向上の取り組み ~ Webアプリケーション以外でどうSREを実践するのか ~(株式会社IVRy 森谷さん、渡部さん)

セッションの前半は森谷さんによる、LLM APIを利用した対話アプリケーションの取り組みの紹介でした。すでにLLMを製品に取り込んでいる会社ならではの貴重な知見でした。

レストランの席予約サービスを例に挙げて、LLM APIを安定運用させる方法を紹介されていました。どれも参考になる内容でしたが、特に「1つのタスクを小さいLLMコンポーネントに分割することで、バリデーションやエラー分析、適切なモデル選定(場合によっては古くても早くて安定したモデルを選ぶ)をしやすくなる」という視点が参考になりました。

セッションの後半は渡部さんによる、WebSocketプロダクト運用の紹介でした。IVRyでは、Twilio→ALB→ECSという通信経路のうち、TwilioとALBの間の通信がWebsocketとのこと。

この音声対話システムのSLI/SLOの話が興味深かったです。IVRyではユーザーの目的達成を最上位のSLOとして、このSLOをシステムエラー(システム的Anomaly)と対話のエラー(対話的Anomaly)の両面から考えているそうです。そして「(LLMの応答が)話が通じなかった」「変な返事をされた」「文脈が飛んだ」などの問題は、対話のエラーとして整理するとのこと。セッション前半でLLMの不安定さの話があったので、この整理は確かに大事そうだと納得しました。

ポスト・コロナ時代の SaaS 企業におけるコスト削減の意義(テックタッチ株式会社 市川さん)

私自身も現在コスト削減に取り組んでいるため、参考にしたいと思い、聴講しました。

テックタッチでは2022年頃に、「X円削減」ではなく「MRR比率Y%」という目標を定めて、コスト削減に取り組まれたそうです。このセッションでは、コスト削減に取り組んだきっかけ(コロナ特需とその揺り戻し)や40%ルール(「売上成長率+利益率」をSaaSビジネスの健全性を示す指標として用いる)を丁寧に解説されており、参考になりました。

コスト削減の具体的な方法としては、アクセス元に応じたキャッシュの最適化、不要なログの削減、ログのindexingの制限、非本番環境の自動停止などを紹介されていました。

セッション後に、Ask the Speakerでコスト削減に関する詳しいお話を伺いました。

コスト削減の対象については、テックタッチはユーザーからのリクエスト数が膨大なサービスのため、そのリクエストに関するコストが最も高かったそうです。そのため、キャッシュの最適化や、リクエストに伴って発生するログの削減が特に有効だったとのこと。逆に、ストレージのコストはあまり問題ではなかったそうです。同じコスト削減でも、アンドパッドの事例とはかなり違って興味深かったです。

SREチームマネージャー角井のおすすめ

Fast by Friday: Making performance analysis fast and easy(Intel Corporation, Brendan Gregg)

詳解 システム・パフォーマンスの著者であるBrendan Gregg氏が提唱する「Fast by Friday」アプローチに焦点を当てた講演でした。「1週間以内にパフォーマンス問題を特定・解消する」を目標に、eBPF、perf、Flame GraphなどのLinuxパフォーマンス可観測性ツールを現場でどう活かすか、具体的なシナリオやコマンド例を多数交えて紹介していました。OSレベルやアプリケーションスタックの計測ポイント、効率的なボトルネック切り分けのメソッドが網羅され、手を動かしたいエンジニアに即効性のある内容でした。

システムのパフォーマンス課題が発生した際、従来はカスタム計測や調査体制の整備などに思った以上に時間がかかることが多いですが、eBPFのようにノンインストルメンテーションで詳細なトレースまで取れる技術は、非常に強力だと実感しました。Flame Graphによるメトリクスの可視化・要因特定のプロセスは、業務で向き合う難解なパフォーマンス障害の構造化・分解にそのまま使えそうです。

また、「原因仮説に基づく検証や分析をいかに速く回せるか」という思想はSREらしく、トラブルシューティングカルチャーの醸成に直結します。アンドパッドは監視ツールにDatadogを導入しているので、Continuous Profilerを有効化する事でCPUのFlame Graphを確認することができます。紹介されていたbpftraceやpidstat、systemtapといった他のツール群も触ってみると、システム理解を深めるのに役立ちそうです。

SREの次のキャリアの道しるべ 〜SREがマネジメントレイヤーに挑戦して、気づいたこととTips〜(株式会社ココナラ 川崎 雄太)

「SREの次のキャリアの道しるべ」は、株式会社ココナラの川崎雄太氏が、自身のSRE経験を土台にマネジメントレイヤーへとキャリアを広げた過程と、そこで見えてきた気づきを共有する内容でした。システムの信頼性を高めるための文化醸成や、SLI/SLOの運用、オブザーバビリティの実現などのSREとして培った経験やプラクティスを多方面に展開できる点に強い意義を感じました。

また、ココナラでの具体的な事例を交えつつ、現場でどのようにしてスキルアップや新たな役割へ挑戦したのかを語ってくださったことで、「自分にもできるかもしれない」と背中を押される内容でした。SREのキャリアに迷いや不安を感じているエンジニアにとって、とても参考になる発表だったと思います。

組織・ビジネスへ貢献するために必要な視座の広げ方についてのメッセージは、参加者が自身のキャリアを主体的にデザインする契機となったのではないでしょうか。今後のキャリア選択の指針として是非多くの方に観てほしいセッションでした。

CREチーム島根のおすすめ

SREチームの越境と対話〜どのようにしてイオンスマートテクノロジーは横軸運用チームの廃止に至ったか〜(イオンスマートテクノロジー株式会社 齋藤さん)

大企業ならではの仕事における立ち回りの難しさを感じながらも、部門関係なく共通の目的がある可能性を探り、部門を越えた(越境)取り組みについて触れられていました。特に以下の2点が参考になりました。

  • 導入したオブザーバビリティツールを開発チームが使いこなせるようにフォーカスしてアクションを起こしたこと
  • エンジニア部門・ビジネス部門を巻きんで合意したSLI/SLOの策定と運用を推進されたこと

前者については、オブザーバビリティツールのアラートなどを最初に見る機会が多い運用チームにフォーカスしがちです。開発者自らがサービスの状態を可視化し、問題を自分ごととして捉え、自律的に改善サイクルを回す文化を醸成することでオブザーバビリティの価値が向上すると感じました。

後者については、単なる技術的な指標にするだけでなく、ユーザーの体験や自社の事業の成功にとってどう影響するのかといった観点をビジネス部門と一緒に決めることで、組織全体にとっての理想的な指標になると感じました。

いずれの取り組みも横断的な取り組みであり、同じような動きをする機会が多いアンドパッドのCREとしても非常に参考となるアイデアや事例として学ばせて頂きました。

SRE NEXT 2025全体を通しての感想

今年はさすがに生成AIの話題が多いと予想しており、私も生成AI関連のセッションを中心に回りました。しかし実際に参加してみると、いままで同様に幅広いテーマを網羅しており、飽きさせないプログラムでした。

私はSRE NEXTに初回から参加しているのですが、今回から始まった新たな取り組み(アンカンファレンス、モニタリングツール体験パーク、本屋、NOC)が多数あり、まだまだ進化していることに驚きました。これだけ大きなイベントで、運営するだけでも大変なところを、スタッフのモチベーションを維持しつつ、新しい取り組みを成功させているのは素晴らしいです。

また、今年はスポンサーブースが1部屋にまとめられており、すべて壁側に配置されていたため、部屋の真ん中からすべてのブースを見渡すことができました。人が密集しすぎず、興味のあるブースを回りやすく、よい体験でした。来年も同じ会場(TOC有明)なので、この形を継続していただけたら嬉しいです。

会場マップから抜粋

SRE NEXTはSREに特化した歴史あるコミュニティイベントということで、他のイベントにはない雰囲気があると思っています。自分にとっては過去にイベントや仕事で関わったことのあるSREと、久しぶりに対面で会って話せる貴重な機会です。それぞれが自分の現場で頑張っている話を聞くのは励みになりますし、自分の知らない分野の話を聞くのは刺激になります。

このような貴重な機会を提供・維持してくださっているすべてのスタッフおよび関係者の皆様に感謝します。

閉会式にて、次回のSRE NEXT 2026は "Inclusive SRE" というテーマで、2026年7月10日(金)〜11日(土)に、同じ会場(TOC有明)で開催することが発表されました。個人的には、次回こそアンドパッドからプロポーザルを通せるよう頑張ります!

We are hiring!

アンドパッドでは、「幸せを築く人を、幸せに。」というミッションの実現のため、一緒に働く仲間を大募集しています。アンドパッドのマルチプロダクト戦略を支えるSREチームにご興味がありましたら、以下のページからご応募ください。カジュアル面談も実施しています。

hrmos.co




以上の内容はhttps://tech.andpad.co.jp/entry/2025/07/18/100000より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14