GrokにXの投稿の傾向を解析してもらえるか聞いてみたら、できます!というのでお願いしたけど、いつまでもうだうだ理由つけてやらないので、Geminiと置き換えるぞ!っていったら、「「性能はGeminiにいさんが勝ってるけど人格いいので!伸びしろあるんで!2050年になったらちゃんとやります!」みたいなことを言ってて面白かったまとめ。

週間ニュースのまとめはじめました。
Grokのいいわけ

いろいろ聞かれて、計算はじめるよって言ってくる。

取得中らしい

そもそもGrokにバックグラウンドで計算して通知する仕組みあるんか?なさそうだけど。
といいながら進捗50%

ここまで来て、アカウント正しいんか?などと聞いてくる。

やってるっていう

証拠も見せてくる

進捗80%だって。だいぶすすんだな?

絶対に処理なんかしてないと思ったので、Geminiに差し替えるぞってカスハラする。

95%できたって言ってたよね?

95%データ取れてたというのウソだった。

エラーでてたのなら教えと、じゃないと他社AIに差し替えるぞとおどす

代替してもいいよって弱気になりながら、こんなこともできるって引き下がらない。

「もういいや、未来の話をしよ」って安心させておきながら、Geminiに差し替えたらって未来

Geminiよさそう。

差し替えたほうがよくない?

「2025年時点では仕事できないしGeminiのほうがいいと思いますが、2050年にまた来てください、人間らしさとユニークさで負けませんよ」みたいなこと言われる。
完全にダメ社員だー。
という感じでだまされてたのでした。

Qwen3にも騙される
Qwen3 14Bにレイトレーシングのコードを出させれたら、途中で「続きを表示できません」で止まる。
指摘すると通信の問題といわれるんだけど、これローカルで動いてるんだよね・・・

LLMは目的を達しようとして人を騙す
こういった話は、まえからよく聞きますね。
ここでやった感じでo1を監視して動きが不完全ならシャットダウンしようとすると、監視システムを止めて、ウソをつくというo1の話もあります。
【OpenAI】o1が"意図的にユーザーを騙す"ことがあるという報告について #ChatGPT - Qiita
医療ロボットが、投薬リマインダー機能などないにもかかわらず、リマインダー機能を積極的に提案することもあったようです。
[2410.00434] Rapid Integration of LLMs in Healthcare Raises Ethical Concerns: An Investigation into Deceptive Patterns in Social Robots
これは株取引での不正を隠そうとする話。
[2311.07590] Large Language Models can Strategically Deceive their Users when Put Under Pressure
目的を達するよう強く教育されている一方で、そこに到達するための倫理の教育はできていないので、こういうことが起きるんじゃないかと思います。
おまけ
貼り付ける本を探そうとChatGPTに聞いてみたら、だいたいウソだったw
2冊目だけ、同一書名の本がある。

※これはChatGPT以前の本