2026年1月31日

Agentic Coding アセスメントシート

目的

エンジニアの仕事を設計・コーディング・テストから、継続的な価値提供やAI活用改善の仕事に集中できるようにする

このアセスメントシートは、各業務ステップにおけるAI活用レベルを5段階(Level 1-5)で評価し、現在の状態を把握し、次のレベルへの改善を目指すためのものです。


評価レベルについて

Level名称特徴
Level 1Manual (手作業)人間が全ての作業を行う。AIは使用しない。
Level 2Assisted (補完)AIが補完やサジェストを提供するが、主導権は人間にある。
Level 3Augmented (生成)AIが作業を生成するが、人間がチェック・承認する必要がある。
Level 4Agentic (自律)人間が目的を伝えると、AIがプロセスを自律的に実行する。
Level 5Autonomous (自動化)システムが完全に自律的に動作し、人間は意思決定・監視のみを行う。

大カテゴリ1: 思考・設計フェーズ

上流工程での精度が、後の「手戻り」を最小限にします。

小カテゴリ1.1: 要件定義・設計

観点:

  • AIが要件を理解し、計画を立てられるか(自律的なプランニング)
  • Issueや要件文書から適切な実装計画を生成できるか
  • 要件の曖昧さを特定し、質問や確認ができるか
  • 既存仕様との整合性を確認できるか

評価基準(5段階):

Level状態具体的な行動・成果物
Level 1手作業自身の知識のみでドキュメントをゼロから書く
Level 2補完入力中にAIが続きの文言をサジェストする
Level 3生成要件を伝えると設計書のドラフトを一括生成する
Level 4自律目的を伝えると既存仕様との整合性を確認し構成を提案する
Level 5自動化市場データや課題からAIが自律的に要件を定義・更新し続ける

測定指標:

  • 要件定義・設計書作成時間の短縮率
  • 既存仕様との整合性チェックの自動化率
  • 設計書の品質(レビューでの指摘件数)

小カテゴリ1.2: 設計レビュー

観点:

  • 設計の妥当性を評価し、改善提案ができるか
  • 設計レビューコメントの質と建設性
  • 設計レビュー時間の短縮
  • 設計と実装の乖離を検出できるか

評価基準(5段階):

Level状態具体的な行動・成果物
Level 1手作業人間が目視で矛盾やリスクを確認する
Level 2補完AIが誤字脱字や表記揺れを指摘する
Level 3生成AIが設計書を読み込み、矛盾点やリスクをリストアップする
Level 4自律設計と実装の乖離を自動検出し、修正案を提示する
Level 5自動化最適なアーキテクチャをAIが常時シミュレーションし、改善を提案・適用する

測定指標:

  • 設計レビュー時間の短縮率
  • 設計レビューコメントの質と量
  • 設計レビュー後の手戻り率
  • 設計と実装の乖離検出率

大カテゴリ2: 実装・検証フェーズ

エンジニアが最も集中力を発揮するセクションです。

小カテゴリ2.1: 実装

観点:

  • 自律的なプランニングとツール利用
  • 人間の修正なしでパスするコード生成率(自律度)
  • コードの品質(可読性、保守性、パフォーマンス)
  • 複数ファイルを跨いだ実装ができるか

評価基準(5段階):

Level状態具体的な行動・成果物
Level 1手作業エディタの基本機能のみで全て手打ちする
Level 2補完インライン補完により数行先のコードが提案される
Level 3生成自然言語の指示から関数やクラス単位でコードを生成する
Level 4自律「〇〇機能を実装して」という指示で複数ファイルを跨ぎ自律実装する
Level 5自動化目的を定義するだけで、AIが最適な実装を完了し、本番投入まで完結する

測定指標:

  • 人間の修正なしでパスするコード生成率(自律度): 目標80%以上
  • 実装時間の短縮率
  • Linter/フォーマッタの自動適用率
  • コードレビューでの指摘件数: 目標1PRあたり3件以下

小カテゴリ2.2: テスト実装

観点:

  • テスト駆動型の自動実装ができるか
  • テスト実行と自己修正のサイクル回数
  • テストカバレッジの適切性
  • 実装変更を検知し、不足テストを判断・作成できるか

評価基準(5段階):

Level状態具体的な行動・成果物
Level 1手作業テストケースの洗い出しから実装まで全て行う
Level 2補完テストの定型文(テンプレート)が提案される
Level 3生成実装コードを元に単体・結合テストを丸ごと生成する
Level 4自律実装変更を検知し、不足テストを自律的に判断・作成・実行する
Level 5自動化コードの変更に対し、AIがカバレッジとエッジケースを常に100%に保つ

測定指標:

  • テスト実行と自己修正のサイクル回数: 目標3回以内でパス
  • テストカバレッジ: 目標80%以上
  • テストの品質(バグ検出率、エッジケースの網羅性)

小カテゴリ2.3: PR作成

観点:

  • 変更内容を適切に説明できるか
  • PR説明文の質とレビュー待ち時間の短縮
  • 関連Issueとの紐付け
  • 影響範囲を分析し、レビュアーへの注釈を自動で添えられるか

評価基準(5段階):

Level状態具体的な行動・成果物
Level 1手作業差分を確認しながら手動で説明文を書く
Level 2補完PRタイトルや概要の雛形がサジェストされる
Level 3生成差分(diff)からPR説明文をAIが自動生成する
Level 4自律影響範囲を分析し、レビュアーへの注釈や動作結果を自動で添える
Level 5自動化開発完了と同時に、変更の背景や影響度を含めた完璧なPRが自動発行される

測定指標:

  • PR説明文の質(レビュアーの理解度、再質問率)
  • PR作成時間の短縮率
  • レビュー待ち時間の短縮率

大カテゴリ3: レビュー・リリースフェーズ

品質担保と公開のフェーズです。ここには「修正のループ」が存在するのが特徴です。

小カテゴリ3.1: コードレビュー

観点:

  • レビューコメントの質と建設性
  • レビュー時間の短縮と指摘の精度
  • レビュー指摘の自動修正可能性
  • プロジェクト独自の設計思想に基づいたレビューができるか

評価基準(5段階):

Level状態具体的な行動・成果物
Level 1手作業人間が1行ずつ読み込み、指摘を行う
Level 2補完構文エラーやスタイル違反が自動指摘される
Level 3生成ロジックの欠陥や改善案をAIがコメントとして出力する
Level 4自律プロジェクト独自の設計思想に基づき、自律的にレビューを行う
Level 5自動化人間のレビューを介さず、AIが品質を保証し、承認まで完結する

測定指標:

  • レビュー時間の短縮率
  • レビュー指摘の精度(指摘の妥当性、誤検知率)
  • レビューコメントの建設性(改善提案の質)

小カテゴリ3.2: コードレビューの修正

観点:

  • レビュー指摘を理解し、自己修正できるか
  • 修正サイクル回数と修正時間
  • 修正の正確性(指摘事項の完全な解決)
  • 修正・再テスト・プッシュを自律的に完結できるか

評価基準(5段階):

Level状態具体的な行動・成果物
Level 1手作業指摘を読み、自分の手で修正コードを書く
Level 2補完修正作業中にAIがコードをサジェストする
Level 3生成コメントをAIに渡し、修正コードを生成させて適用する
Level 4自律「この指摘を直して」と指示し、AIが修正・再テスト・プッシュを完結する
Level 5自動化指摘が行われた瞬間にAIが修正案を提示し、承認のみで修正が完了する

測定指標:

  • 修正サイクル回数: 目標1回で完結
  • 修正時間の短縮率
  • 修正の正確性(指摘事項の完全な解決率): 目標95%以上

小カテゴリ3.3: ステージングアップ

観点:

  • デプロイプロセスの自動化
  • デプロイ時間とエラー発生率
  • デプロイ後の動作確認の自動化
  • 異常時の原因特定・対処が自律的にできるか

評価基準(5段階):

Level状態具体的な行動・成果物
Level 1手作業手動でコマンドを叩き、環境への反映を行う
Level 2補完コマンドの補完やスクリプトによる半自動化
Level 3生成CI/CD構成ファイルをAIに生成・修正させる
Level 4自律デプロイ後のログを監視し、異常時にAIが自律的に原因特定・対処する
Level 5自動化リリースサイクルが完全に自動化され、AIが最適なタイミングでデプロイする

測定指標:

  • デプロイ時間の短縮率
  • デプロイエラー発生率: 目標5%以下
  • デプロイ後の動作確認時間の短縮率
  • 異常検知から対処までの時間

アセスメントの実施方法

1. 現在のレベルを評価する

各業務ステップについて、現在の状態がどのレベルに該当するかを評価します。

評価のポイント:

  • 実際の業務フローを観察し、どのレベルに該当するかを判断する
  • 複数のレベルにまたがる場合は、最も頻繁に行われているレベルを選択する
  • チーム全体で評価する場合は、メンバー間で合意を形成する

2. 目標レベルを設定する

各業務ステップについて、目指すべきレベルを設定します。

推奨:

  • まずは「実装」や「レビュー修正」などのボトルネック工程をLevel 4に引き上げる
  • 段階的に他の工程もLevel 3→Level 4へと引き上げていく
  • Level 5は長期的な目標として設定

3. 改善アクションプランを作成する

現在のレベルから目標レベルへ到達するための具体的なアクションを計画します。

アクション例:

  • Level 2→Level 3: CursorやGitHub CopilotなどのAIツールの導入
  • Level 3→Level 4: MCP(Model Context Protocol)の活用、プロジェクト固有のルール設定
  • Level 4→Level 5: 完全自動化のためのCI/CDパイプラインの構築

4. 定期的に再評価する

定期的(四半期ごとなど)にアセスメントを実施し、進捗を確認します。


参考資料