A Perplexity revela método de pós-treinamento de agente de busca na web; modelo baseado em Qwen3.5 supera GPT-5.4 em acurácia e custo

Noticiário da Gate, 23 de abril — A equipe de pesquisa da Perplexity publicou um artigo técnico detalhando sua metodologia de pós-treinamento para agentes de busca na web. A abordagem usa dois modelos Qwen3.5 de código aberto (Qwen3.5-122B-A10B e Qwen3.5-397B-A17B) e emprega um pipeline em duas etapas: fine-tuning supervisionado (SFT) para estabelecer aderência a instruções e consistência de linguagem, seguido de aprendizado por reforço online (RL) para otimizar a acurácia da busca e a eficiência do uso de ferramentas.

A fase de RL aproveita o algoritmo GRPO com duas fontes de dados: um conjunto de dados proprietário de perguntas e respostas verificáveis multi-hop construído a partir de consultas iniciais internas que exigem 2–4 saltos de raciocínio com verificação por múltiplos resolvedores, e dados gerais de conversação baseados em rubricas que convertem requisitos de implantação em condições atômicas objetivamente verificáveis para evitar degradação do comportamento do SFT.

O desenho de recompensa emprega agregação filtrada — as pontuações de preferência só contribuem quando a correção do baseline é alcançada (correspondência pergunta-resposta ou quando todos os critérios da rubrica forem atendidos), impedindo que sinais de alta preferência mascarem erros factuais. As penalidades de eficiência usam ancoragem dentro do grupo, aplicando penalidades suaves às chamadas de ferramenta e ao comprimento de geração que excede o baseline de respostas corretas no mesmo grupo.

A avaliação mostra que o Qwen3.5-397B-SFT-RL alcança desempenho de nível superior em benchmarks de busca. Em FRAMES, atinge 57,3% de acurácia com uma única chamada de ferramenta, superando GPT-5.4 em 5,7 pontos percentuais e Claude Sonnet 4.6 em 4,7 pontos percentuais. Com orçamento moderado (quatro chamadas de ferramentas), obtém 73,9% de acurácia a US$ 0,02 por consulta, em comparação com 67,8% de acurácia do GPT-5.4 a US$ 0,085 por consulta e 62,4% de acurácia do Sonnet 4.6 a US$ 0,153 por consulta. Os valores de custo são baseados na precificação pública de API de cada provedor e excluem otimizações de caching.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Fere AI Conclui Rodada de Financiamento de US$ 1,3 Milhão Liderada pela Ethereal Ventures

Mensagem do Gate News, 24 de abril — A Fere AI, uma plataforma de agente de negociação de ativos digitais alimentada por IA, anunciou a conclusão de uma rodada de financiamento de US$ 1,3 milhão liderada pela Ethereal Ventures, com a participação da Galaxy Vision Hill e da Kosmos Ventures. A plataforma oferece suporte a redes cross-chain, incluindo Ethereum,

GateNews6h atrás

Principal Carteira de CEX Lança Agentic Wallet para Agentes de IA com Zero Taxas Durante Período Promocional

Mensagem do Gate News, 24 de abril — Uma grande corretora de criptomoedas lançou a AgenticWallet, uma carteira sem chaves especializada, projetada para agentes de IA. A plataforma permite que os usuários autorizem agentes de IA a executar com segurança operações de negociação, transferências e gerenciamento de ativos dentro de parâmetros configurados

GateNews8h atrás

Web3 AI Infrastructure AIW3 Capta $2M na Rodada Seed Liderada pela Buffalo Capital

Mensagem do Gate News, 24 de abril — A plataforma de infraestrutura de IA Web3 AIW3 anunciou a conclusão de uma rodada de captação seed de $2 milhões. A rodada foi liderada pela Buffalo Capital, com GalaXin Capital e Three-stones Ventures participando como co-investidoras. A AIW3 está fazendo a transição para um paradigma de execução on-chain de Agente-como-Serviço

GateNews10h atrás

O governo dos Emirados Árabes anunciou a introdução de agentes de IA, com a conclusão mais rápida em 2028 de que metade dos processos estará funcionando automaticamente

Os Emirados Árabes Unidos anunciaram que, em dois anos, 50% dos órgãos do governo federal, serviços e operações serão conduzidos por agentes de IA autônomos, tornando-se o primeiro caso no mundo. A IA se tornará a parceira de execução do governo, auxiliando na tomada de decisões, aprimorando serviços e se otimizando continuamente. Todos os servidores públicos são obrigados a passar por treinamento, e o desempenho dos ministros e a eficácia da adoção de IA serão vinculados, impulsionados por um comitê especializado supervisionado pelo presidente. Esta iniciativa decorre de mais de uma década de acumulação de políticas e da estratégia de IA, com foco central na abordagem centrada no ser humano.

ChainNewsAbmedia11h atrás

OristaPay Lança Sistema de Pagamentos com IA no Telegram, Habilita Liquidações Instantâneas de USDT na TON

Mensagem da Gate News, 24 de abril — OristaPay, uma marca operada sob a RD Technologies, anunciou um caminho completo de pagamentos que permite que agentes de IA executem transações dentro do ecossistema do Telegram durante o Hong Kong Web3 Festival. O sistema permite que os usuários iniciem transações de ativos digitais por meio de interações em linguagem natural sem sair da interface de bate-papo através de na

GateNews13h atrás
Comentário
0/400
Sem comentários