Data Anthropic: Hampir setengah dari panggilan AI Agent terkonsentrasi pada rekayasa perangkat lunak, dan 16 bidang vertikal ini masih merupakan lautan biru

2026-02-24 07:51:32

Medis 1%， hukum 0,9%， pendidikan 1,8%。 Ini bukan pasar yang jenuh, melainkan pasar yang hampir belum ada.

Penulis: Garry’s List

Diterjemahkan: Deep潮 TechFlow

Deep潮 Panduan Utama: Anthropic baru saja merilis studi penggunaan AI Agent paling komprehensif hingga saat ini, dengan data inti: pengembangan perangkat lunak menyumbang hampir 50% dari total panggilan alat Agent, sementara bidang vertikal seperti medis, hukum, dan pendidikan bersama 16 bidang lainnya bahkan belum mencapai separuh dari sisanya, masing-masing di bawah 5%.

Ini bukan sinyal pasar jenuh, melainkan peta dari 300 unicorn AI vertikal — yang lebih berharga adalah temuan kontra intuitif yang dikutip dalam artikel: model sudah mampu bekerja secara mandiri hampir 5 jam, tetapi pengguna hanya membiarkannya bekerja selama 42 menit, dan “defisit kepercayaan” ini sendiri adalah peluang produk berikutnya.

Selengkapnya sebagai berikut:

Pengembangan perangkat lunak menyumbang hampir 50% dari semua panggilan alat AI Agent. 16 bidang vertikal seperti medis, hukum, keuangan hampir tidak tersentuh, masing-masing di bawah 5%. Ini berarti ada 300 unicorn AI vertikal yang menunggu untuk dibangun.

Jika saya memulai bisnis hari ini, saya akan fokus pada area merah di grafik batang tersebut sampai saya melihat masa depan saya.

Pendiri Box, Aaron Levie, mengatakan:

Grafik ini mengingatkan kita betapa besar peluang di bidang AI Agent saat ini.

Tentunya akan ada banyak peluang di horizontal, tetapi juga banyak alur kerja yang membutuhkan pengetahuan mendalam di bidang tertentu untuk benar-benar membantu otomatisasi proses unik di vertikal tersebut.

Template-nya adalah: membangun perangkat lunak Agent yang terhubung dengan data khusus, untuk menghubungkan pengguna dan Agent secara efektif dalam alur kerja, sambil memiliki kemampuan engineering konteks khusus bidang tersebut, serta kemampuan mendorong perubahan di sisi pelanggan.

Saat ini, banyak bidang masih memiliki kekosongan besar.

Pengembangan perangkat lunak menguasai hampir setengah dari semua aktivitas AI Agent. Separuh lainnya tersebar di 16 bidang vertikal, masing-masing di bawah 9%. Medis 1%, hukum 0,9%, pendidikan 1,8%. Ini bukan pasar jenuh, melainkan pasar yang hampir belum ada.

Anthropic baru saja merilis studi paling lengkap tentang penggunaan AI Agent secara nyata. Temuan utamanya: pengembangan perangkat lunak menyumbang 49,7% dari panggilan alat API mereka. Kesimpulan utama yang tersembunyi di baliknya adalah: semua bidang lain adalah lautan biru.

Tertinggal dalam Deployment

Ada data yang harusnya membuat pengusaha semangat: kemampuan model sudah jauh melampaui batas kepercayaan pengguna terhadapnya.

Evaluasi kemampuan METR menunjukkan Claude dapat menyelesaikan tugas yang membutuhkan waktu hampir lima jam manusia. Tapi dalam penggunaan nyata, durasi percakapan di persentil 99,9 hanya sekitar 42 menit. Gap ini — antara apa yang bisa dilakukan AI dan apa yang kita izinkan untuk dilakukan — adalah peluang besar.

Gambar: Durasi pelatihan kode Claude hampir dua kali lipat dalam tiga bulan. Ini tidak hanya meningkatkan kemampuannya, tetapi juga memperkuat kepercayaan.

Sumber: x.com

Dari Oktober 2025 sampai Januari 2026, durasi percakapan satu kali di persentil 99,9 hampir dua kali lipat, dari kurang dari 25 menit menjadi lebih dari 45 menit. Pertumbuhan ini stabil di berbagai versi model. Ini bukan hanya model yang menjadi lebih kuat, tetapi pengguna belajar dari penggunaan berulang, secara bertahap memperpanjang kepercayaan mereka terhadap Agent.

“Antara Agustus dan Desember, tingkat keberhasilan Claude Code dalam tugas paling menantang internal pengguna meningkat dua kali lipat, sementara jumlah intervensi manusia per percakapan berkurang dari 5,4 menjadi 3,3.”

Kemampuan sudah ada, deployment belum mengikuti. Ini bukan masalah, melainkan peluang produk.

Bagaimana Kepercayaan Berkembang

20% pengguna baru secara otomatis menyetujui operasi Claude Code. Setelah 750 percakapan, lebih dari 40% percakapan berjalan sepenuhnya dalam mode otomatis. Tapi temuan kontra intuitif: pengguna berpengalaman justru lebih sering melakukan intervensi, bukan lebih sedikit. Pengguna baru melakukan intervensi dalam 5% dari putaran, pengguna lama 9%.

Gambar: Kepercayaan adalah keterampilan yang terus terakumulasi. Pengguna baru secara otomatis menyetujui 20% percakapan. Setelah 750 percakapan, rasio ini akan melebihi 40%.

Gambar: Anthropic

Sumber: x.com

Ini bukan kontradiksi, melainkan perubahan strategi pengawasan. Pemula secara bertahap menyetujui sebelum operasi dilakukan, pengguna lama lebih dulu memberi izin, lalu campur tangan saat ada masalah — mereka beralih dari persetujuan awal ke pengawasan aktif.

Temuan menarik dari aspek keamanan: dalam tugas kompleks, Claude Code secara aktif meminta klarifikasi lebih dari dua kali lipat frekuensi intervensi aktif manusia. Agent akan menunda konfirmasi, bukan langsung melanjutkan. Ini adalah fitur, bukan kekurangan.

“Intisari dari studi ini adalah: otonomi yang dijalankan Agent dalam praktik dibangun bersama oleh model, pengguna, dan produk. Claude akan berhenti bertanya saat tidak yakin, untuk membatasi independensinya. Pengguna membangun kepercayaan melalui kolaborasi dengan model, dan menyesuaikan strategi pengawasan mereka.”

Strategi AI Vertikal Levie

Aaron Levie menunjukkan potensi kekayaan dan nilai besar yang menunggu untuk diungkap: membangun perangkat lunak Agent yang terhubung dengan data khusus, benar-benar menyelesaikan masalah nyata manusia, mengisi konteks secara maksimal untuk output cerdas, dan — bagian yang sering diabaikan oleh banyak pengusaha — mendorong manajemen perubahan di sisi pelanggan.

Faktor terakhir ini adalah alasan utama mengapa AI vertikal sangat sulit diduplikasi. Siapa pun bisa membungkus API, tetapi sangat sedikit yang mampu menguasai workflow, regulasi, dan hambatan organisasi dalam bidang seperti tagihan medis, penemuan hukum, atau perizinan bangunan.

SaaS telah tumbuh sepuluh kali lipat setiap dekade selama puluhan tahun terakhir. Lebih dari 40% dana ventura selama 20 tahun terakhir mengalir ke perusahaan SaaS. Industri ini melahirkan lebih dari 170 unicorn SaaS. Logikanya sederhana: setiap unicorn ini menunggu munculnya versi AI vertikal, dan versi AI ini bisa sepuluh kali lipat besar karena menggantikan bukan hanya perangkat lunak, tetapi juga operator.

Esensi Kolaborasi Bersama

Temuan utama Anthropic patut diperhatikan oleh siapa saja yang terlibat dalam kebijakan AI. Otonomi bukan atribut bawaan model, melainkan dibangun bersama oleh model, pengguna, dan produk. Penilaian sebelum deployment tidak bisa menangkap hal ini; harus diukur dalam penggunaan nyata.

Perwakilan resmi Anthropic menyatakan:

Pengembangan perangkat lunak sekitar 50% dari panggilan alat API kami, tetapi kami juga melihat munculnya industri lain. Dengan batasan risiko dan otonomi yang terus meluas, pengawasan pasca-deploy menjadi sangat penting. Kami mendorong pengembang model lain untuk memperluas studi ini.

Angka-angka keamanan memberi rasa aman: 73% dari panggilan alat melibatkan manusia dalam loop, hanya 0,8% operasi yang tidak dapat dibatalkan. Skenario risiko tertinggi — seperti kebocoran kunci API atau transaksi terenkripsi otomatis — sebagian besar adalah penilaian keamanan, bukan lingkungan produksi nyata.

“Regulasi yang mengatur pola interaksi tertentu — misalnya, mewajibkan manusia menyetujui setiap operasi — hanya akan menimbulkan hambatan, bukan meningkatkan keamanan.”

Memaksa aturan “setiap operasi harus disetujui” akan menghambat produktivitas, bukan meningkatkan keamanan. Tujuan yang lebih baik adalah memastikan manusia dapat memantau dan campur tangan, bukan mengatur alur persetujuan secara ketat.

Di Mana Unicorn Tersembunyi

Peta sudah digambar. Pengembangan perangkat lunak sudah dilakukan. Medis, hukum, keuangan, pendidikan, layanan pelanggan, logistik — 16 bidang vertikal, masing-masing dengan pangsa pasar satu digit — menunggu orang yang benar-benar mengintegrasikan pengetahuan bidang ke dalam Agent.

Dari 300 unicorn SaaS yang lahir sebelumnya, 300 unicorn AI vertikal berikutnya akan segera muncul. Pendiri yang memilih bidang vertikal tertentu, mengintegrasikan pengetahuan bidang ke dalam Agent, dan memahami cara mendorong manajemen perubahan, akan memiliki pasar perangkat lunak perusahaan terbesar dalam dekade berikutnya.

Model sudah mampu bekerja selama lima jam, tetapi pengguna hanya membiarkannya bekerja selama 42 menit. Ini sinyalnya: kita masih sangat awal, masih banyak yang bisa dibangun, dan di banyak tempat yang bahkan belum pernah melihat satu menit pun kecerdasan berfungsi.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.