Perplexity розкриває метод пост-тренування агента веб-пошуку; модель на базі Qwen3.5 перевершує GPT-5.4 за точністю та вартістю

Gate News message, 23 квітня — Дослідницька команда Perplexity опублікувала технічну статтю, яка детально описує її методологію пост-тренування для агентів веб-пошуку. Підхід використовує дві моделі Qwen3.5 із відкритим кодом (Qwen3.5-122B-A10B та Qwen3.5-397B-A17B) і застосовує конвеєр у два етапи: контрольоване донавчання (SFT) для формування дотримання інструкцій і мовної узгодженості, а потім онлайн підкріплювальне навчання (RL) для оптимізації точності пошуку та ефективності використання інструментів.

Фаза RL використовує алгоритм GRPO із двома джерелами даних: власним багатокроковим верифікованим набором запитань-відповідей, зібраним із внутрішніх стартових запитів, що вимагають 2–4 кроків міркування з верифікацією за допомогою кількох розв’язувачів, та розмовними даними загального призначення на основі рубрики, які перетворюють вимоги розгортання на об’єктивно перевірювані атомарні умови, щоб запобігти деградації поведінки SFT.

Дизайн винагород використовує gated aggregation — лише коли досягнуто базової правильності (відповідність питання-відповіді або коли виконано всі критерії рубрики), бали преференцій додаються, запобігаючи тому, щоб сигнали високої преференції маскували фактичні помилки. Штрафи за ефективність використовують прив’язку в межах групи, застосовуючи згладжені штрафи до викликів інструментів і довжини генерації, що перевищує базовий рівень правильних відповідей у тій самій групі.

Оцінювання показує, що Qwen3.5-397B-SFT-RL досягає результатів найвищого класу на пошукових бенчмарках. На FRAMES він досягає 57,3% точності за одного виклику інструмента, випереджаючи GPT-5.4 на 5,7 відсоткового пункта та Claude Sonnet 4.6 на 4,7 відсоткового пункта. За помірного бюджету (чотири виклики інструментів) він досягає 73,9% точності при $0,02 за запит, порівняно з 67,8% точності GPT-5.4 при $0,085 за запит і 62,4% точності Sonnet 4.6 при $0,153 за запит. Показники вартості базуються на публічному ціноутворенні кожного провайдера через API та виключають оптимізації кешування.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Fere AI завершує раунд фінансування на $1.3 млн, очолений Ethereal Ventures

Повідомлення Gate News, 24 квітня — Fere AI, платформа для торгових агентів цифровими активами на основі ШІ, оголосила про завершення раунду фінансування на $1.3 млн, який очолила Ethereal Ventures; також участь взяли Galaxy Vision Hill і Kosmos Ventures. Платформа підтримує міжланцюгові мережі, зокрема Ethereum,

GateNews9год тому

Провідний CEX-гаманець запускає AgenticWallet для AI-агентів із нульовими комісіями під час промо-періоду

Повідомлення Gate News, 24 квітня — Великий криптовалютний біржовий гаманець запустив AgenticWallet, спеціалізований безключовий гаманець, призначений для AI-агентів. Платформа дозволяє користувачам авторизувати AI-агентів для безпечного виконання угод, переказів і операцій з керування активами в межах налаштованих

GateNews11год тому

Web3 AI Infrastructure AIW3 Залучає $2M у seed-фінансуванні на чолі з Buffalo Capital

Повідомлення Gate News, 24 квітня — платформа інфраструктури Web3 AI AIW3 оголосила про завершення $2 мільйонного seed-раунду. Раунд очолювала Buffalo Capital, а GalaXin Capital і Three-stones Ventures брали участь як співінвестори. AIW3 переходить до Agent-as-a-Service

GateNews13год тому

Уряд ОАЕ оголосив про впровадження AI-агентів, якнайшвидше 2028 року завершити автоматизацію половини бізнес-процесів

Об’єднані Арабські Емірати оголосили, що протягом двох років 50% підрозділів, служб і операцій федерального уряду будуть працювати за допомогою автономних AI-агентів, ставши першими у світі. AI стане урядовим виконавчим партнером, допомагатиме приймати рішення, покращувати послуги та здійснювати самовдосконалення. Усі державні службовці зобов’язані пройти навчання, а показники ефективності міністрів і результати впровадження AI пов’язують із цим, що просуватиметься спеціальною групою, яку контролюватиме президент. Захід ґрунтується на багаторічному накопиченні політик і AI-стратегії та в центрі має людину.

ChainNewsAbmedia14год тому

OristaPay запускає платіжну систему, керовану ШІ, у Telegram: забезпечує миттєві розрахунки USDT на TON

Повідомлення Gate News, 24 квітня — OristaPay, бренд, що працює під керівництвом RD Technologies, оголосив про повний платіжний шлях, який дає змогу AI-агентам виконувати транзакції в екосистемі Telegram під час Гонконгського Web3-фестивалю. Система дозволяє користувачам ініціювати транзакції цифрових активів через взаємодію з природною мовою, не виходячи з інтерфейсу чату через na

GateNews16год тому
Прокоментувати
0/400
Немає коментарів