以下の内容はhttps://devops-blog.virtualtech.jp/entry/20260309/1773016136より取得しました。


GPT-5.4をさわってみる

GPT-5.4 がリリースされたようです。

openai.com

無料版ではGPT-5.3 Instantが利用可能で、ChatGPTを使った場合、推論が必要ない場合はGPT-5.3 Instantが、推論が必要な場合はGPT-5.4 Thinkingが使われるようです。 私のアカウントではまだロールアウトされておらず、GPT-5.2 Thinkingが使われていました。

冒頭部分を機械翻訳すると、

GPT-5.4は、推論、コーディング、およびエージェント型ワークフローにおける最近の進歩の最も優れた成果を、単一のフロンティアモデルにまとめたものとしています。業界をリードするGPT-5.3-Codexのコーディング機能を取り入れながら、ツール、ソフトウェア環境、およびスプレッドシート、プレゼンテーション、ドキュメントを含むプロフェッショナルなタスクを横断して、モデルの仕組みを改善します。

コード生成に特化されたGPT-5.3-Codexを取り込んだGPTがGPT-5.4みたいですね。

Plus以降の有償ユーザーに順次ロールアウトされると聞いて、早速触ってみようと思いました。 ただ、私のアカウントではChatGPT 5.4にはまだ展開されていなかったため、Codex Appの方で試してみます。

Codexもいくつかのモデルを選択できるようになっています。これまではChatGPTアプリでも使える普通のモデルであるGPT-5.2とコーディングに特化したGPT-5.2-Codexのように別れていました。レガシーモデルではCodex-MaxやCodex-Miniのようなちょっと味付けが異なるモデルがいくつか用意されていましたが、前のバージョンである5.2ではその2つです。Codexのモデルはその後GPT-5.3-Codexがリリースされました。最新のGPT-5.4は-Codexつきのモデルは現時点では提供されていません。

Codexではさらに推論レベルとしてて、低〜中〜非常に高いまでを選択できるようになっています。推論レベルは、上げれば上げるだけ良いかと言うとそんなことは無く、状況に応じて良いあんばいのレベルを選択する必要があります。 簡単な実装であればデフォルトの「中」で良いはずです。

CodexでGPT-5.4を使ってアプリを実装してみる

何はともあれCodex Appを起動して、何かアプリを作ってみましょう。 そうですね。以前タスク管理をSQLiteで管理していて、そのWebインターフェースをCodexやCopilot CLIに作ってもらいましたが、タスクをカンバンボードで管理できた方が直感的なので、カンバンボードを作ってもらうことにしましょう。

追加の要件として、常に動かし続けるのはリソースの無駄なので、使うときにnpm startを実行して実行し、CTRL + Cで停止しても再開すれば前のデータが永続して使えるような設計にしたいと思います。

まずはプロンプトにNode.jsで動く、カンバンボードを作りたいです。データは永続化されていて、Node.jsサーバーをいったん止めても再開すれば元のデータを復元できるような設計で考えています。と入力しました。

この時点でモックは出来上がっていましたが、実行したコードは列の追加やカードの追加、カードの削除ができませんでした。そのため、プロンプトに列の追加やカードの追加、カードの削除ができません。おそらく、列の削除もできません。と入力しました。

さらにコードが修正されましたが、実行後のカンバンボードには「Persistent task」というタスクが追加されていました。さらにこのタスクが消せない状況でした。そのため、プロンプトにPersistent taskというものが登録されています。テストで使ったものだと思いますが、これが削除できませんと入力しました。

次のような修正をしたようです。

Persistent task は消しました。永続化データの data/board.json から削除済みで、今はボードが空の状態です。

あわせて、カード削除時のID参照も public/app.js で修正しました。form.elements.id ではなく、#card-id を明示的に参照するように変えてあるので、同じ系統の削除不具合は起きにくくなっています。

サーバーを起動し直せば反映されます。/Users/ytooyama/Documents/new project で npm start を実行してください。

再度起動すると次のようなメッセージが表示されていたので、これもプロンプトにエラーメッセージをそのまま投げました。

> node server.js

Kanban board is running on http://localhost:3000
/Users/ytooyama/Documents/new project/src/http.js:60
      throw Object.assign(new Error("Not found"), { statusCode: 404 });
                          ^

Error: Not found
    at serveStatic (/Users/ytooyama/Documents/new project/src/http.js:60:27) {
  statusCode: 404
}

Node.js v25.6.1

この問題の原因は「静的ファイル配信の 404 が async の未捕捉例外になっていた」のが原因だそうで、 修正を施した上で動作チェックをし、「存在しない静的ファイルへのアクセスが try/catch に捕まらず、そのままプロセスを落とす」という不具合を検知して、自動で修正が行われました。

全行程が終わった後のアプリのイメージがこちらです。アプリのタイトルは手動で変更していますが、それ以外はそのままです。

ここまで約5分です。

確かに一発で目的のアプリケーションを作れないのはうんぬんといわれたらその通りではありますが、そもそも人間がコーディングしても最初からばっちり動くコードを作れるなんてことはなかなか難しい話だと思います。

それに対して自然言語でやり取りするだけでアプリケーションが作れるのはすごいし、英語では無く日本語のやり取りでここら辺まで実装できるのはすごいと思います*1

このアプリケーションは手元で動かすことを前提としたため、ユーザー認証周りは実装していません。 複数人で使えるようなサービスにするなら、今回は省いたユーザー認証機能は必須になるでしょう。 状況によってはサービスへのアクセス元の管理をする機能等も実装が必要かもしれません。

生成されたコードについてもなんらかのコードチェックツールを使って、問題のある実装をしていないかチェックは必要だと思います。仕様通り動いたとしても万が一ということもあります。

今回の成果物はGitHubにおいておきます。

github.com

GPT-5.2-CodexやGPT-5.3-Codexとくらべて、出戻り感を感じる事無く目的のアプリを実装できました。 コード部分はGPT-5.3-Codexではあるものの、GPT-5.4は言語の理解力、処理能力が格段に上がっていると感じました。

ChatGPTアプリでもGPT-5.4が使えるようになることを、いまから楽しみにしています。

[Update]

これを書いてしばらくしたら、私のアカウントのChatGPTにもGPT 5.4が来ていました。

*1:とはいえ、人間がコーディングする時代は終わったとは思っていません




以上の内容はhttps://devops-blog.virtualtech.jp/entry/20260309/1773016136より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14