医療は1%、法律は0.9%、教育は1.8%。これらは飽和市場ではなく、ほとんど存在しない市場だ。作者:Garry's List翻訳:深潮 TechFlow**深潮導読:**Anthropicが最新リリースしたAIエージェントの実使用調査は、これまでで最も包括的なものである。核心データは、ソフトウェアエンジニアリングがAIエージェントのツール呼び出しの約50%を占めていることだ。一方、医療、法律、教育などの16の垂直分野の合計は、残りの半分にも満たず、各分野のシェアは5%未満である。これは市場が飽和している兆候ではなく、むしろ300の垂直AIユニコーンの地図である。より価値のある発見は、モデルはすでにほぼ5時間独立して動作できるが、実際のユーザーは42分しか働かせていないという逆説的な事実だ。この「信頼赤字」こそが次のプロダクトチャンスである。### 全文は以下の通り:ソフトウェアエンジニアリングは、すべてのAIエージェントツール呼び出しの約50%を占めている。医療、法律、金融などの16の垂直分野はほとんど触れられておらず、各分野のシェアは5%未満だ。これにより、建設されるのを待つ垂直AIユニコーンは300社にのぼる。もし私が今日起業するなら、上の棒グラフの赤色部分をじっと見つめ、自分の未来を見出すまで動かないだろう。Boxの創業者Aaron Levieは次のように述べている:この図は、AIエージェント分野にどれだけ大きなチャンスがあるかをよく示している。水平方向には多くのエージェントの機会があるが、同時に多くのワークフローは深い専門知識を必要とし、ユーザーの垂直分野の独特なプロセスを自動化するのに役立つ。テンプレートは:専有データに接続可能なエージェントソフトウェアを構築し、ユーザーとエージェントの協働を効率的に行う仕組みを作ることだ。これには、深い分野特有のコンテキストエンジニアリング能力と、顧客側の変革管理を推進する能力も含まれる。現時点では、多くの分野に未開拓の空白が存在している。ソフトウェアエンジニアリングは、すべてのAIエージェント活動の半分を占めている。もう半分は16の垂直分野に散らばっており、どれも9%を超えない。医療は1%、法律は0.9%、教育は1.8%。これらは飽和市場ではなく、ほとんど存在しない市場だ。Anthropicは、これまでで最も包括的なAIエージェントの実使用調査を発表した。核心的な発見は、API上のエージェントツール呼び出しの49.7%がソフトウェアエンジニアリングによるものだということだ。背後にある重要な結論は、他のすべてはブルーオーシャンであるということだ。**展開の遅れ**--------起業家を興奮させるべきデータがある:モデルの能力は、ユーザーが信頼を置く範囲をはるかに超えている。METRの能力評価によると、Claudeは人間がほぼ5時間かかるタスクを解決できる。しかし、実際の使用では、第99.9パーセンタイルのセッション時間は約42分に過ぎない。この差——AIが何をできるかと、我々が許す範囲とのギャップ——は巨大なチャンスだ。図:Claude Codeの訓練最長時間は、ほぼ3か月でほぼ倍増した。これは能力向上だけでなく、信頼の強化にもつながっている。出典:x.com2025年10月から2026年1月までに、第99.9パーセンタイルの単一セッション時間はほぼ倍増し、25分未満から45分超に伸びた。各モデルバージョン間での成長は安定している。これは単にモデルが強化されただけでなく、ユーザーが繰り返し使用する中で学習し、エージェントへの信頼を徐々に延ばしている証拠だ。「8月から12月にかけて、Claude Codeは内部ユーザーの最も難しいタスクでの成功率が倍増した。同時に、各セッションの人間の介入回数は5.4回から3.3回に減少した。」能力はすでに存在しているが、展開が追いついていない。これは問題ではなく、むしろ製品のチャンスだ。**信頼の進化**------------新規ユーザーの20%は、Claude Codeの操作を自動承認する。750回のセッションに達すると、40%以上のセッションが完全に自動承認モードで行われるようになる。しかし、逆説的な発見もある:経験豊富なユーザーほど、むしろ介入が多くなる傾向がある。新規ユーザーは5%のラウンドで介入し、熟練ユーザーは9%だ。図:信頼は積み重ねるスキルだ。新規ユーザーは20%のセッションを自動承認する。750回のセッション後には、その割合は40%を超える。画像:Anthropic出典:x.comこれは矛盾ではなく、監督戦略の変化を示している。初心者は操作前に段階的に承認を行い、経験者はまず許可し、問題が起きたときに介入する——彼らは事前承認から能動的な監視へと移行している。安全面で注目すべき発見は、複雑なタスクにおいて、Claude Codeが明確化を求める頻度は人間の能動的介入の2倍以上であることだ。エージェントは確認を一時停止し、最後まで突き進むのではなく、特性として自己制御している。「この研究の核心的な示唆は、エージェントの自主性はモデル、ユーザー、製品の共同構築によるものであるということだ。Claudeは不確実なときに質問を一時停止し、自身の独立性を制限している。ユーザーはモデルとの協働を通じて信頼を築き、それに応じて監督戦略を調整している。」**Levieの垂直AI戦略**-------------------Aaron Levieは、解き放たれるべき巨大な富と価値を指摘している:専有データに接続可能なエージェントソフトウェアを構築し、実在の人々と問題を解決し、コンテキストを最大化して知能出力を高めること。そして——これは多くの起業家が見落としている点だ——顧客側の変革管理を推進することだ。この最後のポイントこそ、垂直AIが非常に模倣されにくい理由だ。誰でもAPIをラップできるが、医療請求、法律調査、建築許可申請などの特有のワークフロー、規制、組織の抵抗を真に理解し操ることができる人は少ない。SaaSは過去数十年で10倍の成長を遂げてきた。過去20年で、40%以上のリスク投資資金がSaaS企業に流入した。この業界は170以上のSaaSユニコーンを生み出している。論理は単純だ:これらのユニコーンのすべてに、垂直AIのバージョンが待機している。そして、そのAIバージョンは10倍大きくなる可能性がある。なぜなら、それはソフトウェアだけでなく、操作員も置き換えるからだ。**共同構築の本質**-----------Anthropicの核心的発見は、AI政策に関わるすべての人が真剣に考えるべき内容だ。自主性はモデルの固有属性ではなく、モデル、ユーザー、製品の共同構築によるものである。展開前の評価だけではこれを捉えきれず、実使用の中で測る必要がある。Anthropicは公式に次のように述べている:API上のエージェントツール呼び出しの約50%はソフトウェアエンジニアリングによるものだが、他の業界も出現しつつある。リスクと自主性の境界が拡大し続ける中、展開後の監視は非常に重要だ。私たちは他のモデル開発者にもこの調査の拡大を推奨している。安全面の数字は安心感を与える:ツール呼び出しの73%には人間が関与しており、操作の不可逆性は0.8%に過ぎない。最もリスクの高い展開シナリオ——APIキーの漏洩や自律暗号取引など——は、多くが安全評価の範囲内であり、実運用ではない。「具体的なインタラクションを規定する規制要件——例えば人間の承認を義務付ける——は、摩擦を生むだけで、安全性を高めるわけではない。」「すべての操作に承認を義務付ける」政策は、生産性の向上を阻害し、安全性も高めない。より良い目標は、人間が監視し介入できる状態を確保することであり、具体的な承認ワークフローを規定しないことだ。**ユニコーンはどこに隠れているか**-----------地図はすでに描かれている。ソフトウェアエンジニアリングはすでに行われている。医療、法律、金融、教育、カスタマーサポート、物流——16の垂直分野は、それぞれの市場シェアが一桁台であり、誰かが専門知識をエージェントに真に埋め込むのを待っている。これまでに300のSaaSユニコーンが誕生し、次に出てくるのは300の垂直AIユニコーンだ。特定の垂直分野を選び、専門知識をエージェントに埋め込み、変革を推進する方法を理解した創業者は、次の10年の企業ソフトウェア市場を握ることになる。モデルはすでに5時間働くことができるが、ユーザーは42分しか働かせていない。これはシグナルだ:我々はまだ非常に初期段階にあり、建設できるものは山ほどある。そして、まだ見ぬ多くの場所で、少なくとも1分間の知能発揮すら見たことのない場所で、何かを作り続ける余地がある。
Anthropicのデータ:AIエージェントの呼び出しのほぼ半数がソフトウェアエンジニアリングに集中しており、これら16の垂直分野は依然としてブルーオーシャンです
医療は1%、法律は0.9%、教育は1.8%。これらは飽和市場ではなく、ほとんど存在しない市場だ。
作者:Garry’s List
翻訳:深潮 TechFlow
**深潮導読:**Anthropicが最新リリースしたAIエージェントの実使用調査は、これまでで最も包括的なものである。核心データは、ソフトウェアエンジニアリングがAIエージェントのツール呼び出しの約50%を占めていることだ。一方、医療、法律、教育などの16の垂直分野の合計は、残りの半分にも満たず、各分野のシェアは5%未満である。
これは市場が飽和している兆候ではなく、むしろ300の垂直AIユニコーンの地図である。より価値のある発見は、モデルはすでにほぼ5時間独立して動作できるが、実際のユーザーは42分しか働かせていないという逆説的な事実だ。この「信頼赤字」こそが次のプロダクトチャンスである。
全文は以下の通り:
ソフトウェアエンジニアリングは、すべてのAIエージェントツール呼び出しの約50%を占めている。医療、法律、金融などの16の垂直分野はほとんど触れられておらず、各分野のシェアは5%未満だ。これにより、建設されるのを待つ垂直AIユニコーンは300社にのぼる。
もし私が今日起業するなら、上の棒グラフの赤色部分をじっと見つめ、自分の未来を見出すまで動かないだろう。
Boxの創業者Aaron Levieは次のように述べている:
この図は、AIエージェント分野にどれだけ大きなチャンスがあるかをよく示している。
水平方向には多くのエージェントの機会があるが、同時に多くのワークフローは深い専門知識を必要とし、ユーザーの垂直分野の独特なプロセスを自動化するのに役立つ。
テンプレートは:専有データに接続可能なエージェントソフトウェアを構築し、ユーザーとエージェントの協働を効率的に行う仕組みを作ることだ。これには、深い分野特有のコンテキストエンジニアリング能力と、顧客側の変革管理を推進する能力も含まれる。
現時点では、多くの分野に未開拓の空白が存在している。
ソフトウェアエンジニアリングは、すべてのAIエージェント活動の半分を占めている。もう半分は16の垂直分野に散らばっており、どれも9%を超えない。医療は1%、法律は0.9%、教育は1.8%。これらは飽和市場ではなく、ほとんど存在しない市場だ。
Anthropicは、これまでで最も包括的なAIエージェントの実使用調査を発表した。核心的な発見は、API上のエージェントツール呼び出しの49.7%がソフトウェアエンジニアリングによるものだということだ。背後にある重要な結論は、他のすべてはブルーオーシャンであるということだ。
展開の遅れ
起業家を興奮させるべきデータがある:モデルの能力は、ユーザーが信頼を置く範囲をはるかに超えている。
METRの能力評価によると、Claudeは人間がほぼ5時間かかるタスクを解決できる。しかし、実際の使用では、第99.9パーセンタイルのセッション時間は約42分に過ぎない。この差——AIが何をできるかと、我々が許す範囲とのギャップ——は巨大なチャンスだ。
図:Claude Codeの訓練最長時間は、ほぼ3か月でほぼ倍増した。これは能力向上だけでなく、信頼の強化にもつながっている。
出典:x.com
2025年10月から2026年1月までに、第99.9パーセンタイルの単一セッション時間はほぼ倍増し、25分未満から45分超に伸びた。各モデルバージョン間での成長は安定している。これは単にモデルが強化されただけでなく、ユーザーが繰り返し使用する中で学習し、エージェントへの信頼を徐々に延ばしている証拠だ。
「8月から12月にかけて、Claude Codeは内部ユーザーの最も難しいタスクでの成功率が倍増した。同時に、各セッションの人間の介入回数は5.4回から3.3回に減少した。」
能力はすでに存在しているが、展開が追いついていない。これは問題ではなく、むしろ製品のチャンスだ。
信頼の進化
新規ユーザーの20%は、Claude Codeの操作を自動承認する。750回のセッションに達すると、40%以上のセッションが完全に自動承認モードで行われるようになる。しかし、逆説的な発見もある:経験豊富なユーザーほど、むしろ介入が多くなる傾向がある。新規ユーザーは5%のラウンドで介入し、熟練ユーザーは9%だ。
図:信頼は積み重ねるスキルだ。新規ユーザーは20%のセッションを自動承認する。750回のセッション後には、その割合は40%を超える。
画像:Anthropic
出典:x.com
これは矛盾ではなく、監督戦略の変化を示している。初心者は操作前に段階的に承認を行い、経験者はまず許可し、問題が起きたときに介入する——彼らは事前承認から能動的な監視へと移行している。
安全面で注目すべき発見は、複雑なタスクにおいて、Claude Codeが明確化を求める頻度は人間の能動的介入の2倍以上であることだ。エージェントは確認を一時停止し、最後まで突き進むのではなく、特性として自己制御している。
「この研究の核心的な示唆は、エージェントの自主性はモデル、ユーザー、製品の共同構築によるものであるということだ。Claudeは不確実なときに質問を一時停止し、自身の独立性を制限している。ユーザーはモデルとの協働を通じて信頼を築き、それに応じて監督戦略を調整している。」
Levieの垂直AI戦略
Aaron Levieは、解き放たれるべき巨大な富と価値を指摘している:専有データに接続可能なエージェントソフトウェアを構築し、実在の人々と問題を解決し、コンテキストを最大化して知能出力を高めること。そして——これは多くの起業家が見落としている点だ——顧客側の変革管理を推進することだ。
この最後のポイントこそ、垂直AIが非常に模倣されにくい理由だ。誰でもAPIをラップできるが、医療請求、法律調査、建築許可申請などの特有のワークフロー、規制、組織の抵抗を真に理解し操ることができる人は少ない。
SaaSは過去数十年で10倍の成長を遂げてきた。過去20年で、40%以上のリスク投資資金がSaaS企業に流入した。この業界は170以上のSaaSユニコーンを生み出している。論理は単純だ:これらのユニコーンのすべてに、垂直AIのバージョンが待機している。そして、そのAIバージョンは10倍大きくなる可能性がある。なぜなら、それはソフトウェアだけでなく、操作員も置き換えるからだ。
共同構築の本質
Anthropicの核心的発見は、AI政策に関わるすべての人が真剣に考えるべき内容だ。自主性はモデルの固有属性ではなく、モデル、ユーザー、製品の共同構築によるものである。展開前の評価だけではこれを捉えきれず、実使用の中で測る必要がある。
Anthropicは公式に次のように述べている:
API上のエージェントツール呼び出しの約50%はソフトウェアエンジニアリングによるものだが、他の業界も出現しつつある。リスクと自主性の境界が拡大し続ける中、展開後の監視は非常に重要だ。私たちは他のモデル開発者にもこの調査の拡大を推奨している。
安全面の数字は安心感を与える:ツール呼び出しの73%には人間が関与しており、操作の不可逆性は0.8%に過ぎない。最もリスクの高い展開シナリオ——APIキーの漏洩や自律暗号取引など——は、多くが安全評価の範囲内であり、実運用ではない。
「具体的なインタラクションを規定する規制要件——例えば人間の承認を義務付ける——は、摩擦を生むだけで、安全性を高めるわけではない。」
「すべての操作に承認を義務付ける」政策は、生産性の向上を阻害し、安全性も高めない。より良い目標は、人間が監視し介入できる状態を確保することであり、具体的な承認ワークフローを規定しないことだ。
ユニコーンはどこに隠れているか
地図はすでに描かれている。ソフトウェアエンジニアリングはすでに行われている。医療、法律、金融、教育、カスタマーサポート、物流——16の垂直分野は、それぞれの市場シェアが一桁台であり、誰かが専門知識をエージェントに真に埋め込むのを待っている。
これまでに300のSaaSユニコーンが誕生し、次に出てくるのは300の垂直AIユニコーンだ。特定の垂直分野を選び、専門知識をエージェントに埋め込み、変革を推進する方法を理解した創業者は、次の10年の企業ソフトウェア市場を握ることになる。
モデルはすでに5時間働くことができるが、ユーザーは42分しか働かせていない。これはシグナルだ:我々はまだ非常に初期段階にあり、建設できるものは山ほどある。そして、まだ見ぬ多くの場所で、少なくとも1分間の知能発揮すら見たことのない場所で、何かを作り続ける余地がある。