Mensagem do Gate News, 17 de abril — O Google revelou o Gemini 3.1 Flash TTS, um modelo avançado de texto para fala com recursos de expressão emocional e controle aprimorados, em 15 de abril. O novo modelo será disponibilizado gradualmente por meio de APIs para desenvolvedores, Vertex AI corporativo e ferramentas de colaboração.

As principais capacidades do modelo incluem tags de áudio baseadas em linguagem natural para ajustar a velocidade, a entonação e a emoção, além de um “Director Mode” para especificar cenas e papéis de personagens e gerar saídas de voz mais nuances. Um recurso de múltiplos locutores permite gerar diálogos simultâneos, possibilitando fluxos de conversa mais naturais, adequados para podcasts, conteúdos de áudio e assistentes de IA. O modelo suporta mais de 70 idiomas e dialetos, refletindo sotaques e expressões regionais para experiências de voz localizadas globalmente.

O Google destacou desempenho e eficiência de custos, alcançando altas pontuações em benchmarks de avaliação humana cega, enquanto reduzia custos computacionais com sua arquitetura Flash — projetada para adoção empresarial em larga escala. O áudio gerado inclui marca d’água SynthID para identificar conteúdo gerado por IA e combater a desinformação.

A iniciativa reflete a intensificação da concorrência em interfaces de voz. A OpenAI está combinando recursos de voz em tempo real com IA conversacional para interações semelhantes às humanas, enquanto a Meta está expandindo investimentos em personagens de IA com experiências sociais baseadas em voz. Observadores da indústria apontam que, embora atuação em alto nível e trabalhos criativos possam continuar sendo impulsionados por humanos por enquanto, mercados de produção repetitiva e em larga escala podem ver uma adoção gradual de IA em dublagem, publicidade e setores de audiobooks.

Ver fonte

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

O Agente de IA já pode reproduzir de forma independente artigos acadêmicos complexos: Mollick diz que os erros estão mais no texto original humano do que na IA

Agente de IA Notícias do setor de IA

Mollick aponta que, com métodos e dados públicos, é possível que agentes de IA reproduzam pesquisas complexas sem acesso ao artigo original e ao código; se a reprodução não corresponder ao artigo original, geralmente é um erro no processamento dos dados do próprio artigo ou um excesso de conclusões, e não da IA. A Claude primeiro reproduz o artigo, e então o GPT‑5 Pro faz uma validação cruzada; na maioria das vezes funciona, apenas ficando impedida quando os dados são grandes demais ou quando há problemas com replication data. Essa tendência reduz significativamente os custos de mão de obra, fazendo com que a reprodução se torne uma forma comum e executável de verificação, além de também levantar desafios institucionais para revisão e governança, em que ferramentas de governança governamental podem se tornar um tema-chave.

ChainNewsAbmedia1h atrás

OpenAI Mescla Codex no Modelo Principal a Partir do GPT-5.4, Descontinua Linha Separada de Codificação

Notícias do setor de IA

Mensagem do Gate News, 26 de abril — O chefe de experiência do desenvolvedor da OpenAI, Romain Huet, revelou em uma declaração recente no X que Codex, a linha de modelos de codificação especializada mantida de forma independente pela empresa, foi mesclada ao modelo principal a partir do GPT-5.4 e não receberá mais atualizações separadas

GateNews1h atrás

Salesforce vai contratar 1.000 graduados e estagiários para produtos de IA, e eleva orientação de receita para FY2026

Notícias do setor de IA

Mensagem do Gate News, 26 de abril — A Salesforce contratará 1.000 graduados e estagiários para trabalhar em produtos de IA, incluindo Agentforce e Headless360, à medida que a empresa expande seu negócio de software de IA, anunciou o CEO Marc Benioff no X. A empresa também elevou sua orientação de receita para o ano fiscal de 2026 para um intervalo entre US$41,45 bilhões e US$41,55 bilhões, acima da sua previsão anterior de US$41,1 bilhões a US$41,3 bilhões. A mudança nas contratações segue a reestruturação da força de trabalho da Salesforce em fevereiro, quando a empresa cortou menos de 1.000 funções nas áreas de marketing, produto, análise de dados e sua equipe Agentforce. Os agentes de IA da Salesforce já entregaram US milhão em economia anual no suporte ao cliente, lidando com 2,6 milhões de conversas. A receita recorrente anual do Agentforce cresceu 330% para US milhão.

GateNews1h atrás

Alibaba Cloud lança Qwen-Image-2.0-Pro com texto para imagem e edição unificados, com suporte a renderização de texto multilíngue

Notícias do setor de IA

Mensagem de Notícias do Gate, 26 de abril — A plataforma Alibaba Cloud Bailian lançou o Qwen-Image-2.0-Pro, uma versão completa da série Qwen-Image-2.0 que combina geração de texto para imagem e edição de imagens em um único modelo. Os usuários podem modificar objetos, texto e estilos diretamente por meio de comandos naturais

GateNews3h atrás

API DeepSeek V4-Pro ganha 75% de desconto até 5 de maio; preço de saída cai para US$ 0,87 por milhão de tokens

Notícias do setor de IA

Mensagem de Notícias da Gate, 26 de abril — A DeepSeek anunciou um desconto de 75% por tempo limitado no preço da API V4-Pro, válido até 5 de maio às 15:59 UTC. Após o desconto, o preço por milhão de tokens é: cache de entrada com acerto $0.03625

GateNews4h atrás

A Anthropic Implementa Safeguardas Eleitorais para o Claude Antes das Eleições de Meio de Mandato de 2026

Notícias do setor de IA

A Anthropic anunciou na sexta-feira um conjunto de medidas de integridade eleitoral, projetadas para impedir que seu chatbot de IA Claude seja usado como arma para espalhar desinformação ou manipular eleitores antes das eleições legislativas de meio de mandato dos EUA de 2026 e de outros grandes pleitos ao redor do mundo este ano. A empresa com sede em São Francisco-based

CryptoFrontier10h atrás

Comentário

0/400

Sem comentários