Ramp Labs mengajukan solusi baru untuk berbagi memori antar-multiagen, konsumsi Token tertinggi turun 65%

GateNews

Berita Gerbang, 11 April, perusahaan infrastruktur AI Ramp Labs merilis hasil riset “Latent Briefing”, yang memungkinkan berbagi memori yang efisien antar sistem multi-agen dengan mengompresi langsung cache KV dari model besar. Dengan tidak mengorbankan akurasi, konsumsi Token diturunkan secara signifikan. Dalam arsitektur multi-agen arus utama, orkestrator (Orchestrator) memecah tugas dan berulang kali memanggil model pekerja (Worker); seiring rantai penalaran terus diperpanjang, jumlah Token meningkat secara eksponensial. Gagasan inti dari Latent Briefing adalah menggunakan mekanisme atensi untuk mengidentifikasi bagian konteks yang benar-benar penting, lalu membuang informasi redundan langsung pada level representasi, bukan mengandalkan ringkasan LLM yang lambat atau penelusuran RAG yang kurang stabil. Pada pengujian benchmark LongBench v2, metode ini menunjukkan performa yang menonjol: konsumsi Token model Worker turun 65%, penghematan Token untuk dokumen berukuran menengah (32k hingga 100k) mencapai median 49%, akurasi keseluruhan meningkat sekitar 3 poin persentase dibanding baseline, sementara waktu tambahan untuk setiap kompresi hanya sekitar 1,7 detik—lebih cepat kira-kira 20 kali dibanding algoritma asli. Eksperimen menggunakan Claude Sonnet 4 sebagai orkestrator dan Qwen3-14B sebagai model pekerja, mencakup skenario dokumen beragam seperti makalah akademik, dokumen hukum, novel, serta laporan pemerintah. Penelitian juga menemukan bahwa ambang kompresi optimal berbeda tergantung tingkat kesulitan tugas dan panjang dokumen—masalah yang sulit cocok untuk kompresi yang agresif guna menyaring kebisingan penalaran yang bersifat spekulatif, sementara dokumen panjang lebih cocok untuk kompresi ringan guna mempertahankan informasi kunci yang tersebar.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Project Prometheus milik Jeff Bezos Menggalang $10B pada $38B Valuasi

Gate News pesan, 24 April — Project Prometheus, sebuah lab AI yang didirikan oleh pendiri Amazon Jeff Bezos dan mantan eksekutif Google Vik Bajaj, telah menutup putaran pendanaan $10 miliar dengan valuasi $38 miliar. JPMorgan Chase dan BlackRock adalah

GateNews3jam yang lalu

OpenAI Meluncurkan GPT-5.5, Dirancang untuk Tugas Agen dan Alur Kerja yang Kompleks

Pesan Berita Gate, 24 April — OpenAI telah secara resmi merilis GPT-5.5, sebuah model AI generasi berikutnya yang dirancang untuk menangani tujuan yang kompleks, integrasi alat, verifikasi mandiri, dan penyelesaian tugas multi-langkah. Model ini unggul dalam penulisan kode dan debugging, riset online, analisis data, pembuatan dokumen

GateNews4jam yang lalu

Startup Agen AI Band Menggalang Putaran Seed $17M yang Dipimpin oleh Sierra Ventures, Hetz Ventures, Team8

Pesan Berita Gate, 24 April — Band, sebuah startup yang membangun platform komunikasi dan kolaborasi untuk agen AI, telah menutup putaran seed sebesar $17 juta yang dipimpin oleh Sierra Ventures, Hetz Ventures, dan Team8. Didirikan pada pertengahan 2025 oleh CEO Arick Goomanovsky dan CTO Vlad Luzin, perusahaan ini mengembangkan perangkat lunak untuk re

GateNews4jam yang lalu

Pelanggaran Keamanan Vercel Meluas hingga Ratusan Pengguna; Pengembang AI Berisiko Lebih Tinggi

Pesan Berita Gate, 23 April — Vercel mengungkap pada 19 April bahwa insiden keamanannya, yang awalnya dijelaskan memengaruhi "sebagian terbatas pelanggan," telah berkembang menjadi komunitas pengembang yang jauh lebih luas, khususnya mereka yang membangun alur kerja agen AI. Serangan tersebut dapat memengaruhi ratusan pengguna

GateNews9jam yang lalu

OpenAI 推 GPT-5.5: 12M konteks, indeks AA teratas, Terminal-Bench 82.7% menulis ulang tolok ukur agen

OpenAI merilis GPT-5.5, dengan fokus pada pekerjaan berbasis agen dan pemrosesan pengetahuan perusahaan, serta secara bersamaan meluncurkannya di ChatGPT dan Codex. Poin-poinnya mencakup jendela konteks 1200 juta token, AA Intelligence Index 60, dengan mengungguli Claude Opus 4.7 dan Gemini 3.1 Pro; harganya adalah $5 per satu juta token untuk input dan $30 per satu juta token untuk output, pengurangan token output sekitar 40%, biaya aktual meningkat sekitar 20%.

ChainNewsAbmedia10jam yang lalu

MagicBlock Meluncurkan Mirage, Alat Pembayaran Privasi Berbasis Command-Line untuk Solana

Pesan Berita Gate, 23 April — MagicBlock telah merilis Mirage, sebuah alat pembayaran privasi berbasis command-line yang dirancang untuk jaringan Solana. Alat ini memungkinkan pengguna membuat dompet, menyetor dana, dan mengirim transaksi privat melalui perintah terminal, bot, atau agen AI. Mirage dibangun di atas Private

GateNews14jam yang lalu
Komentar
0/400
Tidak ada komentar