https://analytics.leverages.jp/entry/2025/08/05/180000

はじめに

こんにちは。データ戦略室、アナリティクスグループの高津です。AIコーディングツールが次々と登場し、便利だと感じる一方で、正直どれがいいのだろうかと選択に悩まれている方も多いのではないでしょうか。
そこで今回は、AIコーディングツールとしては新しいAWSの「Kiro」と、Anthropicの「Claude Code」について、実際に同一タスクを実行して比較検証を行いました。

それぞれのツール紹介

Kiro

KiroはAWSが2025年7月にリリースしたエージェント型統合開発環境です。従来のコーディングツールとは異なり、要件定義、詳細設計、タスクリストを段階的に作成した後に実装に着手する、仕様駆動開発というアプローチを採用している点が最大の特徴です。

Claude Code

Claude CodeはAnthropicが開発したターミナル上で動作するAIエージェント型のコーディングツールです。コマンドライン環境で動作する点が特徴的です。

比較検証

実際のタスクを通じて、両ツールの性能と特徴を比較しました。

検証条件

同一の要件、プロンプトでの実装
最初のプロンプトのみを入力し、その後はコマンドの認証以外の介入は行わない
使用モデルは両ツールともにClaude Sonnet 4を使用

タスク内容

Google Apps Scriptで書かれたスプレッドシート上で動作する社内ツール(約3,000行)を、StreamlitベースのWebアプリケーションに移管しました。

ツール詳細

概要：書類を自動作成するツール
主な処理フロー：

個人情報の含まれない契約文書(PDFファイル)をアップロード
PDFファイルからGemini APIを用いて情報の抽出
BigQueryから関連したデータを抽出
抽出した情報をもとに書類を作成、出力

技術的な要件

Google Cloud認証(BigQuery連携用)
Gemini API認証
PDFファイルの処理機能

結果まとめ

上述の条件でKiro, Claude Codeの各ツールで実装を行ったところ、以下のような結果になりました

比較項目	詳細	Kiro	Claude Code
時間	総作業時間	約4.5時間	約30分
生成コード	トータル行数	約19,000行	約5,000行
	アプリ本体行数	約10,000行	約3000行
機能要件	Google Cloud認証	失敗(サービスアカウント認証)	成功(OAuth2.0認証)
	Gemini API認証	成功	成功
	PDFファイルアップロード	成功	成功
	データ抽出(BigQuery)	失敗	成功
	データ抽出(Gemini)	失敗	失敗

# フォルダ構成
Kiro/  
├── app.py (メインアプリ)  
├── services/ (サービス)  
├── processors/ (プロセッサー)  
├── config/ (設定)  
├── utils/ (ユーティリティ)  
├── tests/ (テスト)  
├── monitoring/ (監視機能)  
├── deploy/ (デプロイメント)   
└── docs/ (ドキュメント) 

Claude Code/  
├── app.py (メインアプリ)  
├── modules/ (モジュール)  
└── config/ (設定)

結果詳細

Kiro

実装時間：4.5時間
成功率：5つ中3つの機能の実装に成功

タスクリストをクリアするために多くのテストコードを作成し、それをもとにコードを修正していました。フォルダ構成からも、ログの監視や詳細なエラーハンドリングを行い、本格的なアプリケーションとしての実装を目指していたことがうかがえます。
しかしその一方で、Google Cloud認証では元のツールがOAuth2.0認証であるにもかかわらずサービスアカウントキー認証を実装して失敗するなど、課題も見られました。さらに、何度も同じ部分でエラーを繰り返す場面が多く、今回のタスクでは修正能力が低いという印象を受けました。

Claude Code

実装時間：約30分
修正後: 成功率：5つ中4つの機能の実装に成功

必要最小限の機能を短時間で実装することに成功していました。
コードの修正能力が高く、同じ部分で詰まることはほとんどありませんでした。
元のコードの移管という目的を理解し、機能を忠実に再現するように実装を行なっている印象でした。

両ツールに共通した挙動

どうしても解決できないエラーは、固定値を入れる、機能を削減するという対処が取られていました。

Kiroを使ってみて

以下の理由から、Kiroを使った上での感想に絞ってコメントをしようと思います。

Claude Codeについてはレビューされている記事が既に多く存在する
Claude Codeと比較したKiroの性能を確認することが検証の狙いであった

良い点

初めて仕様駆動開発に挑戦してみましたが、要件のすり合わせから始まるため、実装前に方針を固められるのは効果的だと思いました。
また、hooksをプロンプトで制御できる点はClaude Codeよりも明確に優れている点だと思います。（Claude Codeでも時間が経てば有志が作ってくれそうですが...）

悪い点

コマンドの自動承認を設定してもうまく実行してくれませんでした。
また、原因不明なエラーが頻発して実装が中断されることがよくありました。

おわりに

仕様駆動開発というワークフローはかなり使えそうです。しかし、実装の面ではかなりClaude Codeに軍配が上がるため、要件定義、タスクリストまではKiroで作成し、そこからはClaude Codeで実装するというフローにするのがそれぞれのいいとこ取りができて良さそうですね。
現在のKiroはあくまでもプレビュー版なので、今後リリースされる正式版に期待したいです！