こんにちは、アドベントカレンダー の季節ですね。
この記事は クラウドワークス グループ Advent Calendar 2025 シリーズ1の1日目の記事です。
今年の初っ端はプロダクト開発1部 塚本 @hihats よりお送りします。今年のアドカレも盛り上げていきましょう。
はじめに
多くのソフトウェアエンジニアにとって2025年はAgenticコーディング(もといVibe Coding)元年と記憶される年ではないかと思います。
昨年末あたりからDevinやClineが一般公開になり、俄に自律型のコーディングエージェントの可能性について囁かれ始めました。
その後Claude Codeの公開とClaudeの個人向けMaxプラン & Sonnet4モデル発表により、一気に特異点 を越えてきたという印象です。
私たちの組織においても、当然導入を検討し始めたわけですが、そこから訪れる数々の苦難と、数カ月経った今の利用状況およびそれに対する分析についての壮大なおもしろ実験話をお送りします。
本格導入前の状況
2023年からGitHub Copilotは利用中
それまでもGitHub Copilotは活用していて、それだけでも個々の生産性が向上する体験がありました。Cursorは当初、コンテキストが大きすぎるとコードを読みきれないのと、「VSCode のCopilot Chatが技術的な質問以外にも答えてくれる」というオマケ程度のユーザー体験だったのが、Composer Agent(v0.43)の登場による質的変化が起こり、社内でも使いたいという声も増えてきていました。
そんなこんなで、AIによる開発環境を整備する必要性は高まっている状況、そこにさらにClaude CodeやGemini CLI 、Kiroが発表され、キャッチアップが追いつかない。「どうすんのこれ」という状況で「まずは試験的に数名に配布して使用してもらいフィードバックをもらう 」という方法をとりました。数名分の予算であれば確保も比較的容易ですし。
現状の困難
開発の現状は、やらなければいけないことに対して、あきらかに開発ペースが追いついていない状況であり、組織的なエンジニアリングやチームの奮闘、個々の成長などでなんとか踏ん張っているが、更なる打ち手がないとつらいなという内なる思いがそれぞれにありました。
開発生産性をブーストする「便利な道具」として捉えるだけでは不十分で、チーム全体の創造性を拡張したり、プロダクト開発のプロセスそのものを進化させる「拡張思考パートナー 」としてAIを迎え入れた時、一体何が起こるだろうか。
AI活用から描く理想像
エンジニアが、単純な実装作業や外在性認知負荷から解放され、より複雑で本質的な課題解決に集中できる未来
プロダクトオーナーが、アイデア を即座に技術的な観点から深掘りし、仕様の解像度を飛躍的に高められる未来
デザイナーが、エンジニアとのコミュニケーションの壁を越え、インタラクションのイメージを寸分違わず共有できる未来
これらを実現できれば、職種を問わず誰もが当たり前のようにそれぞれの専門性を最大限に発揮し、今までできなかったことができるようになるかもしれないという、かなり淡い理想のイメージと、組織として変化を起こしていくという2つの意味での導入の機運でもありました。
数名が1ヶ月半ほどに渡って使用して分かったメリット/デメリット、有効なユースケース などを全体に共有し、触ったことのない人でも活用イメージが湧いたところで全体導入という結論になりました。
導入直前奇譚
ツール選定については、既に導入済みのGitHub Copilotに合わせて、Cursor、Claude Codeからそれぞれ希望するツールを配布する形にし、加えてDevinも誰でも利用可能としました。
また、使用開始前に以下のガイドライン を作成して、使用者全員が必ず一読するようにしました。
(クリックするとガイドラインの内容を展開します)
AI Agentic Code Editor 利用ガイドライン 版数: v1.0
対象: 全社員
適用ツール: Cursor, Claude Code, その他AI統合開発環境
概要
本ドキュメントは、当社でのAI機能を統合した開発環境(Cursor、Claude Code等)の利用における重要な注意事項とガイドライン を示します。
導入目的
プロダクト開発に関する業務全般の効率向上
プロダクト品質の改善
開発者体験の向上
セキュリティ要件
⚠️ 重要:データ送信に関する注意
外部送信される情報
Cursor, Claude Codeは以下の情報を外部サーバーに送信します:
コード内容 - AIが解析・補完するため
プロジェクト構造 - 文脈理解のため
エラーメッセージ - 問題解決支援のため
使用統計 - サービス改善のため
禁止情報
以下の情報を含んでいるファイルが置かれた環境では 使用禁止
環境変数 を設定しているファイルは .cursorignore に必ず書く(Claude CodeについてはClaude Codeの読み込み除外設定 )
❌ 個人情報(PII)
❌ 顧客データ
❌ 認証情報(パスワード、APIキー、証明書)
❌ 本番環境接続情報
🚫 本番環境のデータを落としてくるときにローカルのリポジトリ のディレクト リに置かないように
Claude Codeの読み込み除外設定
.claude/settings.json
{
"permissions": {
...
"deny": [
"Read(deprecated_files/**)"
]
}
}
その他品質要件
コピーライト
現時点ではライセンス違反の可能性を除去できないのでパブリックリポジトリ での利用は避ける
GitHub Copilotに関しては、ライセンス違反となるコードを生成しないという設定が可能(Org単位)
2025年7月現在、AIが生成したコードの著作権 については依然複雑な問題です
個人のリポジトリ だとしてもオープンソース にして迂闊にライセンス付けたりしないように
信頼性、保守性
必ずコードレビューを実施
Command LineでのAuto-runはやめよう
.claude/settings.json でdeny可能
ガイドライン ここまで
ガイドライン も理解してもらって、「さあアカウント配布やで!」ここからがトンチンカンな出来事です。
Claude Codeには、2025年7月時点でTeam(Enterprise)向けの「Maxプラン相当」が存在しませんでした。Claude Codeが特異点 を越えてきたのは無制限プランの存在ゆえ。仕方ないので各エンジニアが個人でアカウント作成しMaxプランを契約し、会社が経費精算する形を取る形に。
「利用料金の支払いは会社のコーポレートカードで統一しよう」という合理的な判断をしたつもりでしたが、ここに落とし穴がありました。
何人ものエンジニアが、同じ日に、同じクレジットカード番号で、次々とサブスクリプション 登録を試みる——。
システムに「大量の不正決済リスク」と判断され、決済がブロックされる——。
カード会社からは問題が発生していないとのことで、Anthropic社とのやりとりを行いましたが、解決への腰は中々重く。
メールによる問い合わせ内容
一応、動いてくれてはいたそうですが。
無為に時間だけが過ぎていく。。
最終的には、8月に入り、TeamプランにPremiumシートという個人のMaxプラン相当のTierが出てきて、無事会社契約でアカウント配布できました。
というわけでえらくドタバタな顛末でしたが、それまで他社のみなさんどうしてたんですかね?
利用開始以降
無事プロダクトの全員が、何かしらのAgentic コーディングツールを手にすることになり、約4ヶ月程度経過して見えてきたこと
Cursorのアナリティクス機能:データドリブンな導入効果の可視化
Cursorを組織導入する上で非常に助かったのが、Business/Enterpriseプランで提供されるアナリティクス機能 です。
ダッシュボードでは、以下のような指標をリアルタイムで確認できます。
AIコード貢献率(AI Share of Committed Code) :コミットされたコード全体のうち、AIが生成した行数の割合。26.8% を記録しており、つまり、コードベースの約4分の1がAIとの協働で生まれている。
Agent Edits / Tab Completions / Messages Sent :71.7K回のAgent編集、7.8K回のTab補完、6.5K回のメッセージ送信など、利用形態の内訳が一目でわかる
DAU(Daily Active Users)推移 :日次のアクティブユーザー数をグラフで追跡。常時15〜25名が利用しており、チーム利用率の健全性を確認できる。
ユーザー別活用度ランキング :誰がどれだけAIを活用しているかを可視化。ベストプラクティスを持つメンバーを特定し、ナレッジ共有につなげられる。
言語別・モデル別の利用傾向 :GoやTypeScriptでの利用が多いこと、どのAIモデルが選ばれているかなどのトレンドを把握。
Tab補完 vs Composer(Agent)の利用比率 :単純な補完と、より複雑なAgent操作の使い分けがデータで見える。
このアナリティクス機能があるからこそ、「なんとなく便利」ではなく定量 的な効果測定 が可能になりました。現時点でもっとも投資対効果の説明に納得感をもたせられそうなツールです。
Claude Code:大規模タスクの切り札、成長率151%
総コード行数:56,207行(9月)→ 141,361行(10月)、成長率151.5%
トップユーザーの出力:26,356行/月
特徴的な使われ方:新規機能の骨格実装
あるエンジニアは9月に1,971行だった出力が、10月には26,356行と13倍以上に急増 していました。
逆に、9月にトップだったエンジニアが10月には出力を半減させているケースもあります。これは「仕事が減った」のではなく、「Claude Codeが活躍するフェーズの違い」を意味します。
Claude Codeのアナリティクス:充実したガイドと、それを活かせない現実の矛盾
Claude Codeにも簡易的な分析ダッシュボードは存在します。各メンバーの受け入れられたコード行数、アクティビティ(DAU/セッション数)、支出状況などが確認可能です。またAdmin API を使えば、それ以上のAcceptance Rateなども取得可能とドキュメントにはあったので早速取得してみたところ、中身は空っぽ(利用ゼロと同様)のデータしか返ってこない。
調査すると、API キー経由での利用が前提 のようで、私たちのようにTeamプランでPremiumシートを利用している場合、テレメトリを有効化する設定(CLAUDE_CODE_ENABLE_TELEMETRY=1)にはできるが、組織全体のメトリクスを統合的に収集・分析することが困難だと判明しました。
一方で、Anthropic公式は、Claude Code ROI Measurement Guide という非常に充実した計測ガイドをGitHub で公開しています。Prometheus/OpenTelemetryを使ったテレメトリ収集、Grafanaダッシュボード構築、Linearと連携した自動レポート生成まで、エンタープライズ レベルのROI計測フレームワーク が整備されています。
計測可能な指標も魅力的です。
コストメトリクス:総支出、セッション単価、モデル別コスト
トーク ン使用量:入出力トーク ン数、キャッシュ効率
生産性指標:PR数、コミット頻度、セッション時間
チーム分析:開発者別使用量、採用率
サンプルレポートには、開発者ごとの生産性レポートやROI計算の具体例まで含まれています。
つまり、「こうやってROIを計測しましょう」という立派なガイドがあるのに、無制限プランではそれを実践できない という皮肉な状況です。
GitHub 上のIssueでも、「Max契約ではコスト可視性がゼロ」「ROI計算も正当化もできない」という声が上がっています。コミュニティからも同様の課題認識があることがわかります。
github.com
この点は、 Claude Codeのエンタープライズ 対応がまだ発展途上である ことを示しています。ツールとしてのパワーは圧倒的なだけに、組織導入の周辺機能の充実を期待したいところです。
利用状況推移分析
その他にも各種API 等で取得したデータから月別で状況の推移を確認できたりしました
GitHub Copilotは使い始めてから月日が経っていることもあり、劇的な変化は少ないですが引き続き利用は拡大している。まだ使い始めのClaude CodeとCursorは大きく延びている様子がわかります。
言語別比較やエディタ別比較
GitHub CopilotとCursorでは言語別詳細情報や利用エディタ別の情報も取得できます。
言語別の詳細分析では、言語別の提案数の増減や採用率の大幅な変化 などが見られ、それが新しいモデルの出現などと因果関係があるかどうか あたりも考察が面白い分野です。
たとえば
VS Code においては
提案数: 5,601 → 8,831 (+57.7%)
採用率: 22.92% → 24.95% (+2.03pt)
JetBrains
提案数: 4,896 → 3,248 (-33.7%)
採用率: 31.05% → 16.81% (-14.24pt)
となっていて、エディタによって同じ期間においても、採用率が上昇するものと降下するものがあったりします。これは使用言語が第3因子になっている可能性もあり、それも含めて分析していく必要があります。
Acceptance rate
GitHub CopilotとCursorの採用率の違い は、利用方法の違いです。Copilotのほうは、従来からのTab補完や行単位での提案が主で、提案単位が小さいためリジェクトもしやすく、Cursorのエージェントはまとまった単位でコードの提案をしてくるため、いったんAcceptしてあとから修正するという利用方法の違いの影響が大きいようです。
また、採用率の低下は一概に悪いこととも言えず、ユーザー側がAIによる提案の良し悪しを見極める能力がついてきている現れとも言えます。
利用アンケート結果
また、利用者にアンケートに回答してもらい定性的な回答も集約しました。
1. ツール別の利用状況と評価
Claude Code & Cursor(主力ツール)
現状: 開発者のメインストリームはこの2つに二分されている
用途: 「コード生成・補完」「デバッグ 」「仕様相談」が中心
評価: 満足度は比較的高く、特にClaude Codeは「会話(壁打ち)」の相手として、Cursorは「実装作業」の効率化として使い分けられている傾向がある
Devin(期待先行・発展途上)
現状: アカウントは多くの人に発行されていますが、活用度は「二極化」 している
活用できている層: ローカル環境構築不要の利点を活かし、裏でのコーディングや検証に利用
活用できていない層(多数派): 「ほとんど使っていない」「使い方がわからない」「アカウントはあるが放置」という声が目立つ
要因: 「開発業務自体が少なかった」という時期的な要因もありますが、日常業務への組み込み方が確立されていない可能性がある
GitHub Copilot
現状: 併用ツール、あるいはサブ的な立ち位置になりつつある印象です(件数がClaude/Cursorに比べ少ない)。ただし、コード補完としての信頼性は維持している
3. 浮き彫りになった課題(Qualitative Analysis)
アンケートの自由記述および生データから、以下の3つの主要な課題が特定できました。
ナレッジ共有の「サイロ化」
データ: 共有範囲が「個人」や「チーム」に留まっており、「部署」や「全社」への広がりが不足している
現場の声: 「共有はしているが、他の人の役に立っているかわからない」「横断的な活用にはリポジトリ 構成などを考える必要があり大変」という声があり、組織的な仕組み作りが求められている
AIリテラシー と品質リスク
警鐘: 「脆弱性 調査を丸投げ」「結果を確認せずレビューに出す」といった、AIへの過度な依存やリテラシー 不足による品質低下(および手戻りによる生産性低下)を懸念するシニア層からの意見がある
インフラ・運用ルールの整備不足
権限周り: SlackとDevinの連携制限、Cursor用のGithub アカウント運用(個人垢依存)など、セキュリティ/権限管理と利便性の板挟みになっている
設定共有: .claude/settings.json やプロンプト(MCP リスト)の共通化 ・管理場所が整備されていない
まとめ
AI Agenticコーディングの導入は、私たちの開発現場に間違いなくポジティブで、心躍るような変化をもたらし始めました。単純作業の削減、思考の高速化、そして職種間のコミュニケーション革命。そしてこれらはまだ、序章に過ぎない感覚も強いです。
上記で挙げたような課題も引き続き多くある状況です。
今回、私たちが複数のAIコーディングツールを導入した背景にある一つの考え方に、「最高のプロダクトは、最高の開発者体験から生まれる 」という信念があります。
開発者一人ひとりが、退屈な作業から解放され、創造的で知的な挑戦に没頭できる。チーム全員が、職種の壁を越えてスムーズに連携し、アイデア を最速で形にできる。そんな「楽しくて、新しい開発体験」を追求することが、巡り巡ってユーザーに最高の価値を届けることに繋がると、私たちは信じています。
この記事が、皆さんのチームでAI活用の可能性について考える、何かのきっかけになれば幸いです。