2026-03-06 02:29:19

GPT-5.4 Dirilis, arah iterasi AI di masa depan semakin jelas. Saat ini, bidang AI telah beranjak dari dialog ke evolusi menjadi agen sistem, manusia bertanggung jawab atas estetika, AI bertanggung jawab atas implementasi, menuju alur kerja kolaboratif manusia dan mesin.

➤ Poin-poin utama peningkatan inti GPT-5.4
1、Menggabungkan kemampuan penalaran umum GPT-5.2 dengan kemampuan pemrograman terbaik GPT-5.3-Codex
2、Mendukung jendela 100 juta token (sekitar 5000 halaman dokumen), dan mengatasi masalah lupa pada teks panjang
3、Operasi langsung di komputer, model dapat langsung melihat layar, mouse, mengetik seperti manusia. Dalam pengujian di OSWorld, tingkat keberhasilan 75.0% telah melampaui rata-rata manusia
4、Memperkenalkan fitur interupsi di tengah jalan. Percakapan tidak lagi kaku dan berurutan, pengguna dapat memasukkan permintaan baru kapan saja saat model sedang berpikir atau menjawab
5、Optimasi efisiensi dan biaya, memperkenalkan mekanisme Tool Search. Model tidak lagi perlu memuat semua definisi alat sebelumnya, melainkan mencari sesuai kebutuhan, menghemat konsumsi token sebesar 47%
➤ Mengapa bisa begitu?
Saat ini, laboratorium AI terkemuka di dunia menghadapi tembok data. Sampai tahun 2026, seluruh teks berkualitas tinggi, kode, buku yang dihasilkan manusia mungkin telah dikumpulkan secara besar-besaran oleh model besar. Pelatihan berbasis teks telah mencapai titik jenuh, seperti Claude code, codex, openclaw yang terintegrasi secara mendalam dengan sistem operasi saat ini, menggantikan sebagian operasi manusia dengan memanggil alat sistem, dan memiliki kesadaran mandiri untuk menyelesaikan tugas.
Ada satu hal yang banyak orang tidak tahu, yaitu model seri codex dilatih bersama kerangka kerja Codex, artinya model seri codex dan kerangka kerja Codex saling native, sehingga model secara alami dapat memanggil semua alat pengembangan di dalam codex.
➤ Penjelasan mendalam tentang arah perkembangan AI di masa depan
1. Dari penggabungan API ke operasi sistem tingkat asli
Kemampuan Computer Use yang ditunjukkan GPT-5.4, dari dialog keluar ke seluruh sistem operasi.
Dulu, model hanya menulis kode dalam sandbox terbatas, setelah upgrade akan memiliki tangan secara fisik. Tidak hanya memahami logika kode, tetapi juga mampu memahami umpan balik visual dari klik, drag, dan error terminal.
Lapisan kerangka baru tidak lagi berupa sekumpulan fungsi alat yang sudah dipersiapkan, melainkan pemahaman mendalam tentang OS. Saat pelatihan, model belajar bagaimana mengamati layar dan memberi umpan balik, sehingga dapat seperti insinyur berpengalaman, mengedit kode sambil melihat perubahan UI di jendela debugging browser, mewujudkan pengembangan end-to-end yang otomatis dan siklik. Ini sudah diimplementasikan di codex.
2. Konteks jutaan token + desain arsitektur tugas jangka panjang + sistem memori = arsitek serba bisa
Dalam arsitektur tiga lapis Codex, lapisan model menyediakan penalaran terstruktur. Konteks 100 juta token yang dibawa GPT-5.4 secara esensial memberikan kanvas yang lebih luas untuk penalaran tersebut.
Sistem memori OpenAI selalu unggul, dengan dirilisnya memori tanpa kehilangan dan memori tak terbatas. Terutama saat model dan kerangka kerja saling native, model dapat dengan cepat menelusuri seluruh basis kode (skala jutaan token), dan kerangka kerja dapat secara akurat menerapkan perubahan ke puluhan file terkait.
Sekarang, di dalam codex, sudah mampu melakukan penulisan ulang seluruh arsitektur dan memahami makna kode secara tepat.
3. Pencarian alat dan ekspansi dinamis
Mekanisme Tool Search yang diperkenalkan GPT-5.4 memungkinkan kerangka kerja memahami pola keluaran model, sehingga model mendapatkan lebih banyak konteks dan melakukan operasi secara tepat.
Arah pengembangan di masa depan adalah tidak lagi memuat ribuan perpustakaan alat sebelumnya (menghindari pemborosan token), melainkan saat model melakukan inferensi dan membutuhkan komponen visualisasi data, secara real-time mencari definisi dan memuatnya melalui Tool Search. Ini berarti skill saat ini mungkin hanya sebagai transisi, dan lebih banyak alat akan diintegrasikan ke dalam konten model, memungkinkan model besar memilih alat mana yang akan dipanggil.
Keuntungannya adalah model besar dapat mempertahankan efisiensi token yang sangat tinggi. Ini menyelesaikan paradoks bahwa semakin banyak alat, semakin bodoh model, dan memungkinkan pohon skill Agent berkembang tanpa batas, melakukan optimisasi otomatis, menemukan jalur terbaik, dan melatih model generasi berikutnya.
4. Interaksi real-time, dari sistem berurutan ke interupsi kapan saja
Fitur interupsi di tengah jalan yang diperkenalkan GPT-5.4 memecahkan status kotak hitam dari AI yang dihasilkan, sehingga jika arah tidak tepat, dapat segera disesuaikan.
Secara kolaboratif, lebih banyak melibatkan keputusan manusia, bukan membiarkan AI berjalan sepenuhnya secara mandiri, mewujudkan kolaborasi transparan. Manusia bertanggung jawab atas estetika, definisi kebutuhan, dan pemilihan solusi, sementara AI bertanggung jawab atas implementasi.
Selain itu, dengan kemampuan intervensi waktu nyata, AI dari status pengiriman tugas satu kali berubah menjadi mitra kerja yang dapat diubah kebutuhan kapan saja.
Secara sederhana, mode Native AI baru (Codex + GPT-5.4) adalah membangun mobil F1 dari nol, dan mesin, chassis, serta ban mobil dirancang sejak hari pertama untuk kecepatan maksimal secara kolaboratif.
Ke depan, kita mungkin tidak lagi mencari model yang lebih kuat, melainkan sistem yang lebih dalam integrasinya dengan lingkungan pengembangan.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.