Token em dois meses, dez vezes: ansiedade de capacidade de computação e lógica de aumento de preços na mesa-redonda do OpenClaw no Fórum Zhongguancun

De acordo com a monitorização da 1M AI News, o fundador do Moonlit Shadow, Yang Zhilin, presidiu uma mesa redonda sobre OpenClaw e temas de código aberto de IA na Cúpula Zhongguancun 2026. Os convidados incluíram o CEO da Zhipu Huazhang, Zhang Peng; o cofundador e CEO da Wuwen Core, Xia Lixue; Luo Fuli, responsável pelo grande modelo MiMo da Xiaomi; e Huang Chao, professor assistente na Universidade de Hong Kong. A discussão abrangeu três níveis: modelos, infraestrutura de computação e aplicações de agentes.

Xia Lixue apresentou um dado direto: desde o final de janeiro, o uso de tokens pela Wuwen Core dobrou a cada duas semanas, acumulando um aumento de dez vezes, e ela comentou: “Essa velocidade só tinha visto na era do 3G, quando o tráfego móvel era assim.” Zhang Peng explicou, do ponto de vista de um fabricante de modelos, a lógica por trás do recente aumento de preço do GLM5 Turbo da Zhipu: os agentes não são mais apenas perguntas e respostas; completar uma tarefa pode consumir dez ou até cem vezes mais tokens do que responder a uma questão simples. Isso envolve planejamento de tarefas de longo prazo, debug contínuo e processamento de informações multimodais. “Competir por preços baixos a longo prazo não é benéfico para o desenvolvimento de toda a indústria.”

Fuli acredita que o principal gargalo na era dos agentes é o custo e a velocidade de raciocínio com contextos longos. Só quando for possível manter custos baixos e alta velocidade com contextos de milhões ou até dezenas de milhões de tokens, tarefas de alta produtividade poderão ser entregues aos modelos. Ela revelou que a “auto-evolução” dos modelos já saiu do conceito para a prática. Em tarefas de pesquisa científica com objetivos claros, os modelos já podem operar autonomamente por dois ou três dias, acelerando a eficiência de suas equipes quase dez vezes. Ela também levantou uma questão: a demanda por raciocínio cresceu quase dez vezes na última fase, e o crescimento total de tokens neste ano poderá chegar a cem vezes?

Huang Chao analisou três gargalos técnicos na camada de aplicações de agentes: insuficiência na capacidade de planejamento de tarefas de longa duração, a pressão de expansão de memória causada pela colaboração de múltiplos agentes, e os riscos de ferramentas de baixa qualidade e injeções maliciosas no ecossistema de habilidades. Ele apontou que a gestão de memória nos frameworks atuais ainda se limita a sistemas de arquivos e ao formato Markdown, e que no futuro será necessário avançar para um design em camadas.

No encerramento da mesa redonda, os quatro convidados resumiram as tendências para os próximos 12 meses com uma palavra cada:

  1. Huang Chao: “Ecossistema” — o software passará de voltado para humanos para um design nativo de agentes
  2. Luo Fuli: “Auto-evolução” — considerada “o único lugar onde é possível criar algo novo”
  3. Xia Lixue: “Tokens sustentáveis” — espera que a China se torne uma fábrica mundial de tokens
  4. Zhang Peng: “Capacidade de computação” — afirmou que por trás do crescimento de dez vezes, “há uma demanda cem vezes maior que ainda não foi atendida”
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.
Comentário
0/400
Sem comentários