Agentic Coding アセスメントシート

目的

エンジニアの仕事を設計・コーディング・テストから、継続的な価値提供やAI活用改善の仕事に集中できるようにする

このアセスメントシートは、各業務ステップにおけるAI活用レベルを5段階（Level 1-5）で評価し、現在の状態を把握し、次のレベルへの改善を目指すためのものです。

評価レベルについて

Level	名称	特徴
Level 1	Manual (手作業)	人間が全ての作業を行う。AIは使用しない。
Level 2	Assisted (補完)	AIが補完やサジェストを提供するが、主導権は人間にある。
Level 3	Augmented (生成)	AIが作業を生成するが、人間がチェック・承認する必要がある。
Level 4	Agentic (自律)	人間が目的を伝えると、AIがプロセスを自律的に実行する。
Level 5	Autonomous (自動化)	システムが完全に自律的に動作し、人間は意思決定・監視のみを行う。

大カテゴリ1: 思考・設計フェーズ

上流工程での精度が、後の「手戻り」を最小限にします。

小カテゴリ1.1: 要件定義・設計

観点:

AIが要件を理解し、計画を立てられるか（自律的なプランニング）
Issueや要件文書から適切な実装計画を生成できるか
要件の曖昧さを特定し、質問や確認ができるか
既存仕様との整合性を確認できるか

評価基準（5段階）:

Level	状態	具体的な行動・成果物
Level 1	手作業	自身の知識のみでドキュメントをゼロから書く
Level 2	補完	入力中にAIが続きの文言をサジェストする
Level 3	生成	要件を伝えると設計書のドラフトを一括生成する
Level 4	自律	目的を伝えると既存仕様との整合性を確認し構成を提案する
Level 5	自動化	市場データや課題からAIが自律的に要件を定義・更新し続ける

測定指標:

要件定義・設計書作成時間の短縮率
既存仕様との整合性チェックの自動化率
設計書の品質（レビューでの指摘件数）

小カテゴリ1.2: 設計レビュー

観点:

設計の妥当性を評価し、改善提案ができるか
設計レビューコメントの質と建設性
設計レビュー時間の短縮
設計と実装の乖離を検出できるか

評価基準（5段階）:

Level	状態	具体的な行動・成果物
Level 1	手作業	人間が目視で矛盾やリスクを確認する
Level 2	補完	AIが誤字脱字や表記揺れを指摘する
Level 3	生成	AIが設計書を読み込み、矛盾点やリスクをリストアップする
Level 4	自律	設計と実装の乖離を自動検出し、修正案を提示する
Level 5	自動化	最適なアーキテクチャをAIが常時シミュレーションし、改善を提案・適用する

測定指標:

設計レビュー時間の短縮率
設計レビューコメントの質と量
設計レビュー後の手戻り率
設計と実装の乖離検出率

大カテゴリ2: 実装・検証フェーズ

エンジニアが最も集中力を発揮するセクションです。

小カテゴリ2.1: 実装

観点:

自律的なプランニングとツール利用
人間の修正なしでパスするコード生成率（自律度）
コードの品質（可読性、保守性、パフォーマンス）
複数ファイルを跨いだ実装ができるか

評価基準（5段階）:

Level	状態	具体的な行動・成果物
Level 1	手作業	エディタの基本機能のみで全て手打ちする
Level 2	補完	インライン補完により数行先のコードが提案される
Level 3	生成	自然言語の指示から関数やクラス単位でコードを生成する
Level 4	自律	「〇〇機能を実装して」という指示で複数ファイルを跨ぎ自律実装する
Level 5	自動化	目的を定義するだけで、AIが最適な実装を完了し、本番投入まで完結する

測定指標:

人間の修正なしでパスするコード生成率（自律度）: 目標80%以上
実装時間の短縮率
Linter/フォーマッタの自動適用率
コードレビューでの指摘件数: 目標1PRあたり3件以下

小カテゴリ2.2: テスト実装

観点:

テスト駆動型の自動実装ができるか
テスト実行と自己修正のサイクル回数
テストカバレッジの適切性
実装変更を検知し、不足テストを判断・作成できるか

評価基準（5段階）:

Level	状態	具体的な行動・成果物
Level 1	手作業	テストケースの洗い出しから実装まで全て行う
Level 2	補完	テストの定型文（テンプレート）が提案される
Level 3	生成	実装コードを元に単体・結合テストを丸ごと生成する
Level 4	自律	実装変更を検知し、不足テストを自律的に判断・作成・実行する
Level 5	自動化	コードの変更に対し、AIがカバレッジとエッジケースを常に100%に保つ

測定指標:

テスト実行と自己修正のサイクル回数: 目標3回以内でパス
テストカバレッジ: 目標80%以上
テストの品質（バグ検出率、エッジケースの網羅性）

小カテゴリ2.3: PR作成

観点:

変更内容を適切に説明できるか
PR説明文の質とレビュー待ち時間の短縮
関連Issueとの紐付け
影響範囲を分析し、レビュアーへの注釈を自動で添えられるか

評価基準（5段階）:

Level	状態	具体的な行動・成果物
Level 1	手作業	差分を確認しながら手動で説明文を書く
Level 2	補完	PRタイトルや概要の雛形がサジェストされる
Level 3	生成	差分（diff）からPR説明文をAIが自動生成する
Level 4	自律	影響範囲を分析し、レビュアーへの注釈や動作結果を自動で添える
Level 5	自動化	開発完了と同時に、変更の背景や影響度を含めた完璧なPRが自動発行される

測定指標:

PR説明文の質（レビュアーの理解度、再質問率）
PR作成時間の短縮率
レビュー待ち時間の短縮率

大カテゴリ3: レビュー・リリースフェーズ

品質担保と公開のフェーズです。ここには「修正のループ」が存在するのが特徴です。

小カテゴリ3.1: コードレビュー

観点:

レビューコメントの質と建設性
レビュー時間の短縮と指摘の精度
レビュー指摘の自動修正可能性
プロジェクト独自の設計思想に基づいたレビューができるか

評価基準（5段階）:

Level	状態	具体的な行動・成果物
Level 1	手作業	人間が1行ずつ読み込み、指摘を行う
Level 2	補完	構文エラーやスタイル違反が自動指摘される
Level 3	生成	ロジックの欠陥や改善案をAIがコメントとして出力する
Level 4	自律	プロジェクト独自の設計思想に基づき、自律的にレビューを行う
Level 5	自動化	人間のレビューを介さず、AIが品質を保証し、承認まで完結する

測定指標:

レビュー時間の短縮率
レビュー指摘の精度（指摘の妥当性、誤検知率）
レビューコメントの建設性（改善提案の質）

小カテゴリ3.2: コードレビューの修正

観点:

レビュー指摘を理解し、自己修正できるか
修正サイクル回数と修正時間
修正の正確性（指摘事項の完全な解決）
修正・再テスト・プッシュを自律的に完結できるか

評価基準（5段階）:

Level	状態	具体的な行動・成果物
Level 1	手作業	指摘を読み、自分の手で修正コードを書く
Level 2	補完	修正作業中にAIがコードをサジェストする
Level 3	生成	コメントをAIに渡し、修正コードを生成させて適用する
Level 4	自律	「この指摘を直して」と指示し、AIが修正・再テスト・プッシュを完結する
Level 5	自動化	指摘が行われた瞬間にAIが修正案を提示し、承認のみで修正が完了する

測定指標:

修正サイクル回数: 目標1回で完結
修正時間の短縮率
修正の正確性（指摘事項の完全な解決率）: 目標95%以上

小カテゴリ3.3: ステージングアップ

観点:

デプロイプロセスの自動化
デプロイ時間とエラー発生率
デプロイ後の動作確認の自動化
異常時の原因特定・対処が自律的にできるか

評価基準（5段階）:

Level	状態	具体的な行動・成果物
Level 1	手作業	手動でコマンドを叩き、環境への反映を行う
Level 2	補完	コマンドの補完やスクリプトによる半自動化
Level 3	生成	CI/CD構成ファイルをAIに生成・修正させる
Level 4	自律	デプロイ後のログを監視し、異常時にAIが自律的に原因特定・対処する
Level 5	自動化	リリースサイクルが完全に自動化され、AIが最適なタイミングでデプロイする

測定指標:

デプロイ時間の短縮率
デプロイエラー発生率: 目標5%以下
デプロイ後の動作確認時間の短縮率
異常検知から対処までの時間

アセスメントの実施方法

1. 現在のレベルを評価する

各業務ステップについて、現在の状態がどのレベルに該当するかを評価します。

評価のポイント:

実際の業務フローを観察し、どのレベルに該当するかを判断する
複数のレベルにまたがる場合は、最も頻繁に行われているレベルを選択する
チーム全体で評価する場合は、メンバー間で合意を形成する

2. 目標レベルを設定する

各業務ステップについて、目指すべきレベルを設定します。

推奨:

まずは「実装」や「レビュー修正」などのボトルネック工程をLevel 4に引き上げる
段階的に他の工程もLevel 3→Level 4へと引き上げていく
Level 5は長期的な目標として設定

3. 改善アクションプランを作成する

現在のレベルから目標レベルへ到達するための具体的なアクションを計画します。

アクション例:

Level 2→Level 3: CursorやGitHub CopilotなどのAIツールの導入
Level 3→Level 4: MCP（Model Context Protocol）の活用、プロジェクト固有のルール設定
Level 4→Level 5: 完全自動化のためのCI/CDパイプラインの構築

4. 定期的に再評価する

定期的（四半期ごとなど）にアセスメントを実施し、進捗を確認します。

タムサイトテックブログ

Agentic Coding アセスメントシート

目的

評価レベルについて

大カテゴリ1: 思考・設計フェーズ

小カテゴリ1.1: 要件定義・設計

小カテゴリ1.2: 設計レビュー

大カテゴリ2: 実装・検証フェーズ

小カテゴリ2.1: 実装

小カテゴリ2.2: テスト実装

小カテゴリ2.3: PR作成

大カテゴリ3: レビュー・リリースフェーズ

小カテゴリ3.1: コードレビュー

小カテゴリ3.2: コードレビューの修正

小カテゴリ3.3: ステージングアップ

アセスメントの実施方法

1. 現在のレベルを評価する

2. 目標レベルを設定する

3. 改善アクションプランを作成する

4. 定期的に再評価する

参考資料

グローバルエラーが発生しました

タムサイト テックブログ

Agentic Coding アセスメントシート

目的

評価レベルについて

大カテゴリ1: 思考・設計フェーズ

小カテゴリ1.1: 要件定義・設計

小カテゴリ1.2: 設計レビュー

大カテゴリ2: 実装・検証フェーズ

小カテゴリ2.1: 実装

小カテゴリ2.2: テスト実装

小カテゴリ2.3: PR作成

大カテゴリ3: レビュー・リリースフェーズ

小カテゴリ3.1: コードレビュー

小カテゴリ3.2: コードレビューの修正

小カテゴリ3.3: ステージングアップ

アセスメントの実施方法

1. 現在のレベルを評価する

2. 目標レベルを設定する

3. 改善アクションプランを作成する

4. 定期的に再評価する

参考資料

グローバルエラーが発生しました

タムサイトテックブログ