以下の内容はhttps://news.livedoor.com/topics/detail/28978947/より取得しました。

AIが「ユーザーから隠れて実行する」行為のリスクを測定

2025年6月17日 11時50分

AIの能力向上に伴って、AIが「ユーザーから隠れて命令とは別の攻撃的なタスクを実行する」という行為に及ぶリスクも増しています。そんなAIによる妨害工作(サボタージュ)のリスクを測定するシステム「SHADE-Arena」をAI開発企業のAnthropicが発表し、同時に各種AIモデルを対象とした妨害工作能力テストの結果も公開しました。SHADE-Arena: Evaluating Sabotage and Monitoring in LLM Agents(PDFファイル)https://assets.anthropic

記事を読む

この記事へのみんなの感想は？

ランキング

総合
国内
政治
海外
経済
IT
スポーツ
芸能
女子

以上の内容はhttps://news.livedoor.com/topics/detail/28978947/より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14