Ramp Labs mengajukan solusi baru untuk berbagi memori antar-multiagen, konsumsi Token tertinggi turun 65%

GateNews

Berita Gerbang, 11 April, perusahaan infrastruktur AI Ramp Labs merilis hasil riset “Latent Briefing”, yang memungkinkan berbagi memori yang efisien antar sistem multi-agen dengan mengompresi langsung cache KV dari model besar. Dengan tidak mengorbankan akurasi, konsumsi Token diturunkan secara signifikan. Dalam arsitektur multi-agen arus utama, orkestrator (Orchestrator) memecah tugas dan berulang kali memanggil model pekerja (Worker); seiring rantai penalaran terus diperpanjang, jumlah Token meningkat secara eksponensial. Gagasan inti dari Latent Briefing adalah menggunakan mekanisme atensi untuk mengidentifikasi bagian konteks yang benar-benar penting, lalu membuang informasi redundan langsung pada level representasi, bukan mengandalkan ringkasan LLM yang lambat atau penelusuran RAG yang kurang stabil. Pada pengujian benchmark LongBench v2, metode ini menunjukkan performa yang menonjol: konsumsi Token model Worker turun 65%, penghematan Token untuk dokumen berukuran menengah (32k hingga 100k) mencapai median 49%, akurasi keseluruhan meningkat sekitar 3 poin persentase dibanding baseline, sementara waktu tambahan untuk setiap kompresi hanya sekitar 1,7 detik—lebih cepat kira-kira 20 kali dibanding algoritma asli. Eksperimen menggunakan Claude Sonnet 4 sebagai orkestrator dan Qwen3-14B sebagai model pekerja, mencakup skenario dokumen beragam seperti makalah akademik, dokumen hukum, novel, serta laporan pemerintah. Penelitian juga menemukan bahwa ambang kompresi optimal berbeda tergantung tingkat kesulitan tugas dan panjang dokumen—masalah yang sulit cocok untuk kompresi yang agresif guna menyaring kebisingan penalaran yang bersifat spekulatif, sementara dokumen panjang lebih cocok untuk kompresi ringan guna mempertahankan informasi kunci yang tersebar.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

0G Labs Meluncurkan Aplikasi 0G sebagai Gerbang Ekosistem: Komputasi Terdesentralisasi, AI yang Dapat Diverifikasi, dan $0G Token Menutup Siklus

0G Labs meluncurkan 0G App, sebuah platform tanpa kode yang memungkinkan pengguna membuat aplikasi AI melalui bahasa alami. Platform ini menggabungkan kemampuan komputasi terdesentralisasi dan AI, mengatasi masalah sentralisasi sekaligus meningkatkan privasi. Peluncuran ini bertujuan untuk mendorong adopsi AI Agent dan terintegrasi dengan ekosistem AI yang lebih luas dari 0G.

GateNews12jam yang lalu

Jiransoft Meluncurkan Office Agent, Solusi AI Perusahaan yang Menangani Kekhawatiran Keamanan dan Biaya

Jiransoft telah meluncurkan Office Agent, sebuah solusi AI yang mengatasi masalah keamanan, biaya, dan keandalan dalam adopsi generative AI. Solusi ini menawarkan kontrol akses berbasis peran, melindungi data sensitif, serta mendukung penyesuaian tanpa kode untuk berbagai departemen.

GateNews17jam yang lalu

Eastsoft Bermitra dengan M2M Tech untuk Menerapkan Humanoid AI dalam Sistem Robotik Fisik

Eastsoft dan M2M Tech telah menjalin kemitraan untuk mengintegrasikan layanan AI percakapan Eastsoft ke dalam platform robotika M2M Tech, menciptakan humanoid AI tingkat lanjut untuk penggunaan industri, pertama kali dipamerkan di Nvidia GTC 2026.

GateNews18jam yang lalu

GitLab Memperdalam Kemitraan dengan Google Cloud, Saham Melonjak Hampir 7% Setelah Jam Perdagangan

GitLab mengumumkan kemitraan dengan Google Cloud, meningkatkan sahamnya hampir 7%. Kolaborasi ini mengintegrasikan Duo Agent milik GitLab dengan Vertex AI milik Google Cloud, sehingga menyempurnakan alur kerja pengembang perusahaan. Model komersial baru memungkinkan pelanggan cloud menggunakan komitmen yang sudah ada untuk layanan GitLab.

GateNews19jam yang lalu

64% Bisnis Singapura Menggunakan AI Setiap Hari, Temuan Survei HubSpot

Sebuah survei HubSpot mengungkap bahwa 64% pemimpin bisnis di Singapura menggunakan AI, tetapi hanya 18% yang mempekerjakan agen yang sepenuhnya otonom. Hambatan utama mencakup kepercayaan, kualitas data, dan kesenjangan keterampilan. Banyak yang memperkirakan peningkatan pentingnya AI dalam 12-24 bulan.

GateNews20jam yang lalu

Konferensi BeyondBlocks Asia 2026 Dijadwalkan pada 16-17 April di Seoul

Konferensi BeyondBlocks Asia 2026 akan diadakan di Seoul pada 16-17 April, dengan fokus pada AI, Web3, stablecoin, dan gaming. Konferensi ini menampilkan pembicara dan diskusi terkemuka tentang masa depan integrasi blockchain dan AI.

GateNews22jam yang lalu
Komentar
0/400
Tidak ada komentar