生成AIでの仕様駆動開発ツールは趣味で使いたいものではなかった。
ので所感を記録しておく。
使ったのはGitHubのSpec Kit。 モデルはCloude Sonnet 4、GPT-5-Codex、Gemini 2.5 Pro辺りを気分で使い分けていた。
遅い&トークン消費が速い
spec kitは開発の段階毎に「こういうことをやる」のコマンドとテンプレートが整備されていて、それに従ってタスクを進めるように生成AIに指示していく。
必然的に生成AIが参照する情報や、作業の段階が増えて時間がかかるし、トークン(≒お金)の消費が多い。
レビューがダルい
趣味の開発に使うにはとにかくダルい。
単純にまだまだ精度の低い生成AIのアウトプットを評価する回数が仕様と実装に分かれて増える。
特に生成された仕様や実装計画を実際的なものになるようにレビュー、応答するのは趣味のレベルではやってられない。
仕様や実装計画が完璧なものになったとしても、実装のレビューはまた1からやらなくてはならない。
趣味ではなく仕事での開発では「ある対応でどのような仕様と実装計画がされたのか?」を強制的に記録していく形になるので、一定の意義がありそうに思える。とはいえ、現状でエンタープライズ開発でがっつりこれに依存した開発フローにしたいと思えるものではなかった。
英語の壁
ツールとしてプロンプトやテンプレートが英語なので、既定では仕様や計画が英語で生成される。
自然言語は日本語しか読み書きできない人間としては付き合うのが難しい。
この壁を乗り越えることができるのか? などはGitHub CopilotのPremiumリクエストが回復したら試そうとは思う。
それではまた来月(?)。

残骸