Mensagem do Gate News, 23 de abril — A equipa de investigação da Perplexity publicou um artigo técnico que detalha a sua metodologia de pós-treinamento para agentes de pesquisa na web. A abordagem utiliza dois modelos Qwen3.5 de código aberto (Qwen3.5-122B-A10B e Qwen3.5-397B-A17B) e recorre a um pipeline em duas etapas: fine-tuning supervisionado (SFT) para estabelecer obediência a instruções e consistência linguística, seguido de aprendizagem por reforço online (RL) para otimizar a precisão da pesquisa e a eficiência no uso de ferramentas.
A fase de RL utiliza o algoritmo GRPO com duas fontes de dados: um conjunto de dados proprietário de perguntas e respostas verificáveis multi-hop construído a partir de queries iniciais internas que exigem 2–4 hops de raciocínio com verificação por múltiplos solucionadores, e dados conversacionais gerais baseados em rubricas que convertem requisitos de implementação em condições atómicas objetivamente verificáveis para evitar a degradação do comportamento do SFT.
O desenho de recompensas emprega agregação com gating — as pontuações de preferência só contribuem quando a correcção de base é alcançada (correspondência pergunta-resposta ou quando todos os critérios da rubrica são satisfeitos), impedindo que sinais de preferência elevados mascarem erros factuais. As penalizações de eficiência utilizam ancoragem dentro do grupo, aplicando penalizações suaves às chamadas de ferramentas e ao comprimento da geração que excede a base de respostas correctas no mesmo grupo.
A avaliação mostra que o Qwen3.5-397B-SFT-RL atinge o melhor desempenho de referência em benchmarks de pesquisa. No FRAMES, alcança 57,3% de precisão com uma única chamada de ferramenta, superando o GPT-5.4 em 5,7 pontos percentuais e o Claude Sonnet 4.6 em 4,7 pontos percentuais. Sob um orçamento moderado (quatro chamadas de ferramentas), atinge 73,9% de precisão a $0,02 por consulta, em comparação com 67,8% de precisão do GPT-5.4 a $0,085 por consulta e 62,4% de precisão do Sonnet 4.6 a $0,153 por consulta. Os valores de custo baseiam-se na tarifação pública por API de cada fornecedor e excluem optimizações de caching.
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
A Anthropic Lança /ultrareview para o Claude Code: Revisão de Código em Nuvem com Vários Agentes
Mensagem do Gate News, 23 de abril — A Anthropic introduziu /ultrareview (research preview), uma funcionalidade de revisão de código multi-agente baseada na nuvem para o Claude Code. Os utilizadores podem escrever /ultrareview na CLI para iniciar um conjunto de agentes de revisão numa sandbox remota que trabalham em paralelo para analisar diffs entre a
GateNews11m atrás
A OpenAI lança agentes de workspace do ChatGPT para automação de fluxos de trabalho empresariais
Mensagem do Gate News, 23 de Abril — A OpenAI anunciou o lançamento de agentes de workspace no ChatGPT a 22 de Abril, introduzindo agentes de IA partilhados concebidos para automatizar tarefas complexas e fluxos de trabalho alargados entre ferramentas e equipas dentro de uma organização. Os agentes são alimentados por Codex e operam num ambiente baseado na nuvem com acesso a um
GateNews12m atrás
Alibaba Cloud Lança JVS Crew, Plataforma de Agentes de IA de Nível Empresarial
Mensagem de Gate News, 23 de abril — A Alibaba Cloud lançou oficialmente o JVS Crew, uma plataforma de construção de Agentes de IA de nível empresarial concebida com uma abordagem "integração-em-primeiro-lugar". A plataforma permite que as empresas incorporem rapidamente capacidades de Agentes de IA em aplicações existentes, serviços SaaS ou hardware inteligente
GateNews24m atrás
Os bancos de Taiwan juntam-se para criar uma IA local! Modelos de linguagem financeiros de grande escala em funcionamento o mais tardar até ao final do ano
As 16 instituições financeiras lideradas pela Chint Trust & Holdings anunciaram o lançamento do projeto “Modelo Financeiro de Linguagem Grande FinLLM”. A primeira versão do modelo bancário está prevista para ser publicada em agosto, e no 1.º trimestre de 2026 serão lançados agentes de IA baseados no FinLLM. O treino terá início em maio, com um orçamento de cerca de 40–70 milhões de yuan. Devido a exigências regulamentares e à necessidade de adaptação ao local, o treino será centrado em dados locais, reforçando a IA soberana, construindo infraestruturas base comuns e alargando-se ao setor do acesso financeiro inclusivo. O plano já foi incluído no plano nacional de desenvolvimento de IA e obteve apoio interministerial.
ChainNewsAbmedia1h atrás
CEO da Google: investimento de 185 mil milhões em capital para 2026; reforço dos investimentos na era dos agentes de IA
O CEO da Google, Sundar Pichai, anunciou a 22 de abril, na conferência Google Cloud Next realizada em Las Vegas, que a Google planeia investir entre 175 mil milhões e 185 mil milhões de dólares em despesas de capital em 2026, para construir a infraestrutura necessária para agentes de inteligência artificial autónomos (AI Agent), o que representa um aumento face aos 31 mil milhões de dólares em 2022.
MarketWhisper2h atrás
A Google revela a lista de candidatos ao novo lançamento da Jules e reposiciona-a como uma plataforma de desenvolvimento de produtos ponta-a-ponta
De acordo com o anúncio oficial da equipa Google Jules em 23 de abril, a orientação do produto da Jules evoluiu de um agente de codificação assíncrona para uma «plataforma de desenvolvimento de produtos agentic ponta a ponta». A nova versão consegue ler o contexto completo do produto, decidir de forma autónoma o próximo rumo de construção e submeter PR. Em paralelo, a equipa oficial anunciou a abertura de uma lista de candidatos para a nova versão.
MarketWhisper2h atrás