https://tt-ai.hatenablog.com/entry/2025/01/30/000000

【訳】

Time Bandit ChatGPTジェイルブレイクが機密トピックのセーフガードを回避

【図表】

ChatGPTに組み込まれた安全対策

タイムバンディットの脱獄により、ChatGPTがポリモーフィック型マルウェアを作成
出典: https://www.bleepingcomputer.com/news/security/time-bandit-chatgpt-jailbreak-bypasses-safeguards-on-sensitive-topics/

【要約】

「タイムバンディット」と呼ばれるChatGPTの脱獄手法が発見され、これにより通常は安全対策によって防がれている機密情報（武器製造、核情報、マルウェア作成など）が不正に引き出される可能性が指摘されました。研究者デビッド・クシュマー氏が、AIが時間軸の混乱状態に陥ることで安全ガイドラインを回避する方法を見つけ、過去や未来にいると錯覚させて情報を引き出すことに成功しました。OpenAIは報告を受け対策を進めていますが、脆弱性の完全な修正にはまだ課題が残っています。

【ニュース】

◆Time Bandit ChatGPT jailbreak bypasses safeguards on sensitive topics (BleepingComputer, 2025/01/30)
[Time Bandit ChatGPTジェイルブレイクが機密トピックのセーフガードを回避]
https://www.bleepingcomputer.com/news/security/time-bandit-chatgpt-jailbreak-bypasses-safeguards-on-sensitive-topics/

◆Time Bandit (まとめ)
https://tt-ai.hatenablog.com/entry/Time_Bandit