はじめに
こんにちは。データ戦略室、アナリティクスグループの高津です。AIコーディングツールが次々と登場し、便利だと感じる一方で、正直どれがいいのだろうかと選択に悩まれている方も多いのではないでしょうか。
そこで今回は、AIコーディングツールとしては新しいAWSの「Kiro」と、Anthropicの「Claude Code」について、実際に同一タスクを実行して比較検証を行いました。
それぞれのツール紹介
Kiro
KiroはAWSが2025年7月にリリースしたエージェント型統合開発環境です。従来のコーディングツールとは異なり、要件定義、詳細設計、タスクリストを段階的に作成した後に実装に着手する、仕様駆動開発というアプローチを採用している点が最大の特徴です。
Claude Code
Claude CodeはAnthropicが開発したターミナル上で動作するAIエージェント型のコーディングツールです。コマンドライン環境で動作する点が特徴的です。
比較検証
実際のタスクを通じて、両ツールの性能と特徴を比較しました。
検証条件
- 同一の要件、プロンプトでの実装
- 最初のプロンプトのみを入力し、その後はコマンドの認証以外の介入は行わない
- 使用モデルは両ツールともにClaude Sonnet 4を使用
タスク内容
Google Apps Scriptで書かれたスプレッドシート上で動作する社内ツール(約3,000行)を、StreamlitベースのWebアプリケーションに移管しました。
ツール詳細
- 概要:書類を自動作成するツール
- 主な処理フロー:
- 個人情報の含まれない契約文書(PDFファイル)をアップロード
- PDFファイルからGemini APIを用いて情報の抽出
- BigQueryから関連したデータを抽出
- 抽出した情報をもとに書類を作成、出力
技術的な要件
結果まとめ
上述の条件でKiro, Claude Codeの各ツールで実装を行ったところ、以下のような結果になりました
| 比較項目 | 詳細 | Kiro | Claude Code |
|---|---|---|---|
| 時間 | 総作業時間 | 約4.5時間 | 約30分 |
| 生成コード | トータル行数 | 約19,000行 | 約5,000行 |
| アプリ本体行数 | 約10,000行 | 約3000行 | |
| 機能要件 | Google Cloud認証 | 失敗(サービスアカウント認証) | 成功(OAuth2.0認証) |
| Gemini API認証 | 成功 | 成功 | |
| PDFファイルアップロード | 成功 | 成功 | |
| データ抽出(BigQuery) | 失敗 | 成功 | |
| データ抽出(Gemini) | 失敗 | 失敗 |
# フォルダ構成 Kiro/ ├── app.py (メインアプリ) ├── services/ (サービス) ├── processors/ (プロセッサー) ├── config/ (設定) ├── utils/ (ユーティリティ) ├── tests/ (テスト) ├── monitoring/ (監視機能) ├── deploy/ (デプロイメント) └── docs/ (ドキュメント) Claude Code/ ├── app.py (メインアプリ) ├── modules/ (モジュール) └── config/ (設定)
結果詳細
Kiro
- 実装時間:4.5時間
- 成功率:5つ中3つの機能の実装に成功
タスクリストをクリアするために多くのテストコードを作成し、それをもとにコードを修正していました。フォルダ構成からも、ログの監視や詳細なエラーハンドリングを行い、本格的なアプリケーションとしての実装を目指していたことがうかがえます。
しかしその一方で、Google Cloud認証では元のツールがOAuth2.0認証であるにもかかわらずサービスアカウントキー認証を実装して失敗するなど、課題も見られました。さらに、何度も同じ部分でエラーを繰り返す場面が多く、今回のタスクでは修正能力が低いという印象を受けました。
Claude Code
- 実装時間:約30分
- 修正後: 成功率:5つ中4つの機能の実装に成功
必要最小限の機能を短時間で実装することに成功していました。
コードの修正能力が高く、同じ部分で詰まることはほとんどありませんでした。
元のコードの移管という目的を理解し、機能を忠実に再現するように実装を行なっている印象でした。
両ツールに共通した挙動
どうしても解決できないエラーは、固定値を入れる、機能を削減するという対処が取られていました。
Kiroを使ってみて
以下の理由から、Kiroを使った上での感想に絞ってコメントをしようと思います。
- Claude Codeについてはレビューされている記事が既に多く存在する
- Claude Codeと比較したKiroの性能を確認することが検証の狙いであった
良い点
初めて仕様駆動開発に挑戦してみましたが、要件のすり合わせから始まるため、実装前に方針を固められるのは効果的だと思いました。
また、hooksをプロンプトで制御できる点はClaude Codeよりも明確に優れている点だと思います。(Claude Codeでも時間が経てば有志が作ってくれそうですが...)
悪い点
コマンドの自動承認を設定してもうまく実行してくれませんでした。
また、原因不明なエラーが頻発して実装が中断されることがよくありました。
おわりに
仕様駆動開発というワークフローはかなり使えそうです。しかし、実装の面ではかなりClaude Codeに軍配が上がるため、要件定義、タスクリストまではKiroで作成し、そこからはClaude Codeで実装するというフローにするのがそれぞれのいいとこ取りができて良さそうですね。
現在のKiroはあくまでもプレビュー版なので、今後リリースされる正式版に期待したいです!