https://taitai55kun.hatenablog.com/entry/2025/02/28/224944

GPT-4.5が登場

OpenAIは2025年2月27日、最新の大規模言語モデル「GPT-4.5」を発表しました。

このモデルは、これまでのシリーズで最大かつ最も知識が豊富であり、ユーザーとの対話がより自然で直感的に感じられるよう設計されています。

GPT-4.5は、教師なし学習のスケーリングにより、パターン認識や関連性の把握、創造的な洞察の生成能力が向上しています。

これにより、ユーザーの意図をより正確に理解し、感情的なニュアンスを捉えた応答が可能となりました。

特に、文章作成やプログラミング、問題解決などのタスクにおいて高い性能を発揮します。

また、GPT-4.5は誤情報の生成（ハルシネーション）を低減し、信頼性を向上させています。

具体的には、従来のGPT-4oモデルの約60%に対し、GPT-4.5では約37%と大幅に減少しています。

ただし、GPT-4.5は非常に大規模で計算負荷の高いモデルであり、運用コストも高くなっています。

そのため、まずは月額200ドルのChatGPT Proユーザー向けに提供され、今後他のサブスクリプション層にも拡大される予定です。

OpenAIのサム・アルトマンCEOは、GPT-4.5について「思慮深い人と話しているように感じられる最初のモデル」と評価しています。

forbesjapan.com

推論タイプo3-mini-highとの違いは？

GPT-4.5とo3-mini-highは、OpenAIが開発した異なる特性を持つAIモデルです。

GPT-4.5は大規模で計算集約型のモデルであり、ユーザーのプロンプトをより自然に理解し、対話する能力が向上しています。

一方、o3-mini-highは推論に特化したモデルで、特に数学や科学分野で高精度な応答を提供します。

具体的には、GPT-4.5は言語ベンチマークで高い性能を示す一方、o3-mini-highは数学や科学のテストで優れた結果を出しています。

また、GPT-4.5は計算資源の消費が大きく、APIの利用コストも高めですが、o3-mini-highはコスト効率と応答速度のバランスが取れています。

GPT-4.5は幅広いトピックでの自然な対話に優れ、o3-mini-highは特定の技術分野での高精度な推論能力を持つモデルです。

GPT-4o、o3-mini-high、GPT-4.5の回答を比較する

学習活動を考えさせるプロンプトを入力し、GPT-4.5と前タイプのGPT-4oと推論タイプのo3-mini-highの回答を比較してみました。

GPT-4o

4oは回答速度も早く、学習活動のアイデアも複数提示されます。

１つ１つの内容はやや浅いですが、追加のプロンプトにより焦点化して詳細を引き出すことができます。

o3-mini-high

o3-mini-highの回答は4oに比べると提案されたアイデアの数は絞られていますが、より詳細な活動の流れが提示されています。実際の学習活動をイメージしやすい内容となっています。

GPT-4.5

お菓子を分ける学習活動が提案されました。

お菓子を使う点については、実用的ではありませんが提示されている活動の流れについては３つのモデルの中で1番詳しい内容となっています。

お菓子を別のものに変更することで。具体物を使いながら平均の概念を理解することができます。

学習指導案の作成

授業展開を理解しているように感じたので学習指導案の作成を試みてみました。

単元計画が作成されました。
基本的にこれまでのモデルでは参考資料を読み込ませないことには回答の質が保証されませんでしたが、GPT-4.5ではその必要はなく、それなりの回答が来ます。
続いて、１つ選んだ上で授業展開を提示させてみました。

この実験では水が沸騰したときにでる泡が水蒸気であることを見つけます。
授業展開としては悪くないという印象です。

泡をガラス管で集めるとなっていますが、教科書等ではビニル袋で集める方法が記載されていると思います。

対話を続けるとGPT-4.5としては視覚的に理解するにはビニル袋がよいとのことでした。

ガラス管の実験について詳しく聞くと以下のような説明とともに、視覚的な理解を進めるための動画が示されました。

このような動画を提示するといったような回答はあまり見られなかった反応であるため、新鮮に感じました。
もちろんプロンプトを工夫することで4oでも視覚的な理解のために動画や画像を提示させることは可能でしょうが、GPT-4.5側が考えて回答を工夫する点に性能が高くなっていると感じます。

Deep Researchの衝撃は超えない

GPT-4.5は確かに性能が上がっており、回答の質も保証されていると感じますが、正直なところ格段に良くなったという印象はありません。
Deep Researchが登場したときの衝撃は超えないと感じました。
とはいえ、まだ使い始めて時間が経っていないため、GPT-4.5に適した活用方法がないか模索してみようと思います。

ちなみにGPT-4.5自身に擬人化した場合の人物像を尋ねると以下の通りでした。

アルトマンが言うように思慮深さが強調されているようです。
この回答をもとにして、ImageFXでは次の画像が生成されました。

DeepResearchやGrok３とはガラッと印象が変わりました。
それではまた次回！