Google lance Gemini 3.1 Flash TTS avec une expression émotionnelle améliorée et des capacités multi-intervenants

Message de Gate News, 17 avril — Google a dévoilé Gemini 3.1 Flash TTS, un modèle avancé de synthèse vocale doté de fonctionnalités d’expression émotionnelle et de contrôle améliorées, le 15 avril. Le nouveau modèle sera déployé progressivement via des API développeur, Vertex AI à destination des entreprises, et des outils de collaboration.

Les capacités clés du modèle incluent des balises audio basées sur le langage naturel pour affiner la vitesse, l’intonation et l’émotion, ainsi qu’un « Director Mode » permettant de spécifier des scènes et les rôles des personnages afin de générer des sorties vocales plus nuancées. Une fonctionnalité multi-intervenants permet de générer un dialogue simultanément, offrant des flux de conversation plus naturels adaptés aux podcasts, aux contenus audio et aux assistants IA. Le modèle prend en charge plus de 70 langues et dialectes, reflétant les accents et les expressions régionales pour des expériences vocales localisées à l’échelle mondiale.

Google a mis l’accent sur les performances et l’efficacité des coûts, obtenant de hauts scores sur des références d’évaluation humaine à l’aveugle tout en réduisant les coûts de calcul grâce à son architecture Flash — conçue pour une adoption à grande échelle en entreprise. L’audio généré inclut le marquage filigrane SynthID pour identifier les contenus générés par IA et lutter contre la désinformation.

Ce mouvement reflète une concurrence de plus en plus forte dans les interfaces vocales. OpenAI combine des fonctionnalités vocales en temps réel avec une IA conversationnelle pour des interactions plus proches de l’humain, tandis que Meta élargit ses investissements dans des personnages IA avec des expériences sociales basées sur la voix. Des observateurs du secteur notent que, bien que le jeu d’acteur et le travail créatif de haut niveau puissent encore rester pilotés par des humains pour le moment, les marchés de production répétitifs et à grande échelle pourraient voir une adoption progressive de l’IA dans le doublage, la publicité et les secteurs des livres audio.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

DeepSeek cherche un financement de 1,8 milliard de dollars avec une valorisation de $20B au milieu d’une vague de départs de talents

Message de Gate News, 25 avril — DeepSeek prévoit de lever 1,8 milliard de dollars, valorisant l’entreprise à environ $20 milliards, selon des sources familières du dossier. La levée de fonds intervient alors que la startup d’IA fait face à une attrition importante des talents, plusieurs chercheurs principaux quittant l’entreprise pour rejoindre ByteDance, Tencent, Xiaomi, et la société de véhicules autonomes Horizon Robotics.

GateNewsIl y a 4h

Le juge rejette les allégations de fraude dans la plainte d’Elon Musk contre OpenAI ; l’affaire progresse vers un procès avec deux allégations restantes

Message de Gate News, 24 avril — Un juge fédéral a rejeté les allégations de fraude dans la plainte d’Elon Musk contre OpenAI, Sam Altman, Greg Brockman et Microsoft, ouvrant la voie à la poursuite de l’affaire devant le tribunal sur deux allégations restantes : violation de la confiance à but caritatif et enrichissement injustifié. États-Unis.

GateNewsIl y a 8h

Le PDG d'OpenAI, Sam Altman, s'excuse d'avoir omis de signaler à la police le compte banni du tireur de l'école

Message de Gate News, 25 avril — Le PDG d'OpenAI, Sam Altman, a présenté ses excuses à la communauté de Tamborine, au Canada, pour l'incapacité de l'entreprise à prévenir la police au sujet d'un compte banni lié à Jesse Van Rootselaar, qui a tué huit personnes dans une école en février avant de mettre fin à ses jours. OpenAI

GateNewsIl y a 8h

Les Émirats arabes unis annoncent une transition vers un modèle de gouvernement basé sur l’IA au cours des deux prochaines années

Son Altesse Cheikh Mohammed bin Rashid Al Maktoum a déclaré que l’objectif était que 50% des secteurs gouvernementaux fonctionnent grâce à une IA agentique autonome. La transition comprendra également la formation des employés fédéraux pour « maîtriser l’IA », et sera supervisée par Cheikh Mansour bin Zayed. Points clés :

CoinpediaIl y a 8h

La plateforme de trading d’IA Fere AI lève 1,3 M$ de fonds, menée par Ethereal Ventures

Message de Gate News, 25 avril — Fere AI, une plateforme de trading d’actifs numériques propulsée par l’IA, a annoncé avoir finalisé un tour de financement de 1,3 million de dollars mené par Ethereal Ventures, avec la participation de Galaxy Vision Hill et de Kosmos Ventures, selon Globenewswire. La plateforme prend en charge des réseaux inter-chaînes

GateNewsIl y a 9h

Google augmente avec 40 milliards de dollars d’investissement dans Anthropic : d’abord 10 milliards, puis libération de 30 milliards en fonction des résultats, avec une puissance de calcul de 5 GW de TPU

Alphabet augmente sa mise sur Anthropic à 40 milliards de dollars, en deux étapes : première injection de 10 milliards de dollars en espèces, valorisation à 3 800 milliards de dollars ; les 300 milliards de dollars restants seront libérés par tranches après l’atteinte des objectifs de performance. Google Cloud fournira 5 GW de ressources de calcul TPU sur cinq ans ; dans le même temps, Amazon a également annoncé un investissement pouvant aller jusqu’à 25 milliards de dollars, ce qui montre que le soutien en puissance de calcul et en capitaux d’Anthropic se renforce en parallèle.

ChainNewsAbmediaIl y a 10h
Commentaire
0/400
Aucun commentaire