Google lança chips de TPU de oitava geração com melhor relação preço-desempenho, separa treino e inferência

Mensagem do Gate News, 22 de Abril — A Google Cloud anunciou a disponibilização dos seus chips TPU (Tensor Processing Unit) personalizados de oitava geração, a 22 de Abril. A nova gama inclui o TPU 8t, concebido especificamente para tarefas de treino de IA, e o TPU 8i, optimizado para cargas de trabalho de inferência de IA. Ambos os chips ficarão disponíveis mais tarde este ano. A Google também revelou novas ferramentas para criar agentes de IA e anunciou um fundo de $750 milhões para impulsionar a adopção de IA nas empresas.

O TPU 8t oferece 2,8 vezes o desempenho do TPU Ironwood da geração anterior da Google, no mesmo patamar de preço. O TPU 8i melhora o desempenho em 80% face ao seu antecessor e incorpora uma arquitectura de memória estática de acesso aleatório (SRAM) para proporcionar “transferência em grande escala com custo-efectivo e baixa latência, permitindo que milhões de agentes corram em simultâneo”, segundo o CEO Sundar Pichai. Em comparação com o Ironwood, tanto o TPU 8t como o TPU 8i atingem uma eficiência superior a dobrar por watt, com o TPU 8t a melhorar 124% e o TPU 8i a melhorar 117%. A Google optimizou a eficiência energética em toda a pilha tecnológica e integrou sistemas de gestão de potência dinâmica que ajustam o consumo com base na procura em tempo real.

Os modelos de primeira parte da Google processam agora mais de 160 mil milhões de tokens por minuto através de chamadas directas de API dos clientes, acima dos 100 mil milhões no trimestre passado. A IA passa agora a gerar 75% de todo o novo código na Google, em comparação com 50% no outono do ano passado. O Gemini Enterprise, a oferta empresarial da Google, cresceu 40% em cadeia, no trimestre, em utilizadores mensais activos pagantes. A empresa espera investir ligeiramente mais de metade do seu orçamento de computação de aprendizagem automática em serviços na nuvem até 2026, para servir melhor clientes e parceiros na nuvem. A Google está também a alargar a sua colaboração com a Broadcom para desenvolver e fornecer chips TPU personalizados para futuras gerações, à medida que grandes empresas tecnológicas procuram alternativas às GPUs caras e com fornecimento limitado da NVIDIA e da AMD.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

O Agente de IA já consegue reproduzir autonomamente artigos académicos complexos: Mollick afirma que os erros se devem mais ao texto original humano do que à IA

Mollick indica que os métodos de publicação e os dados, por si só, permitem que agentes de IA reproduzam investigação complexa sem a existência do artigo original e do código; se a reprodução não corresponder ao artigo original, isso deve-se na maioria das vezes a erros no processamento dos dados do próprio artigo ou a uma extrapolação excessiva das conclusões, e não à IA. A Claude primeiro reproduz o artigo, e depois o GPT‑5 Pro faz uma validação cruzada; na maioria dos casos, é bem-sucedido, apenas ficando bloqueado quando os dados são demasiado grandes ou quando há problemas com replication data. Esta tendência reduz drasticamente os custos de mão-de-obra, tornando a reprodução numa verificação geralmente executável, além de colocar desafios institucionais para a revisão pelos pares e para a governação; as ferramentas de governação por parte do governo ou tornar-se-ão numa questão fundamental.

ChainNewsAbmedia1h atrás

OpenAI Integra Codex no Modelo Principal a Partir do GPT-5.4, Descontinua a Linha Separada de Programação

Mensagem da Gate News, 26 de abril — O responsável de developer experience da OpenAI, Romain Huet, revelou numa declaração recente no X que a Codex, a linha de modelos especializados de programação mantida de forma independente pela empresa, foi integrada no modelo principal a partir do GPT-5.4 e deixará de receber atualizações separadas

GateNews1h atrás

Salesforce vai contratar 1.000 graduados e estagiários para produtos de IA, aumenta previsões de receitas para o AF2026

Mensagem do Gate News, 26 de abril — A Salesforce irá contratar 1.000 graduados e estagiários para trabalhar em produtos de IA, incluindo Agentforce e Headless360, à medida que a empresa expande o seu negócio de software de IA, anunciou o CEO Marc Benioff no X. A empresa também aumentou as suas previsões de receitas para o ano fiscal de 2026 para um intervalo entre 41,45 mil milhões de USD e 41,55 mil milhões de USD, acima da sua previsão anterior de 41,1 mil milhões de USD para 41,3 mil milhões de USD.

GateNews1h atrás

Alibaba Cloud Lança Qwen-Image-2.0-Pro com Geração de Texto-para-Imagem e Edição Unificadas, Suportando Renderização de Texto Multilingue

Mensagem de Gate News, 26 de abril — A plataforma Alibaba Cloud Bailian lançou o Qwen-Image-2.0-Pro, uma versão completa da série Qwen-Image-2.0 que combina a geração de texto para imagem e a edição de imagens num único modelo. Os utilizadores podem modificar objetos, texto e estilos diretamente através de comandos em linguagem natural

GateNews3h atrás

A API DeepSeek V4-Pro recebe um desconto de 75% até 5 de Maio; o preço de saída cai para $0.87 por milhão de tokens

Mensagem de Notícias da Gate, 26 de Abril — A DeepSeek anunciou um desconto de 75% por tempo limitado nos preços da API V4-Pro, válido até 5 de Maio às 15:59 UTC. Após o desconto, o preço por milhão de tokens é: cache de entrada (hit) $0.03625

GateNews4h atrás

A Anthropic Implementa Salvaguardas Eleitorais para o Claude Antes das Eleições Gerais de 2026

A Anthropic anunciou na sexta-feira um conjunto de medidas de integridade eleitoral concebidas para impedir que o seu chatbot de IA Claude seja usado como arma para espalhar desinformação ou manipular eleitores antes das eleições legislativas intercalares dos EUA de 2026 e de outras grandes contendas a nível mundial este ano. A sede da San Francisco-based

CryptoFrontier9h atrás
Comentar
0/400
Nenhum comentário