Сообщение Gate News, 17 апреля — Google представила Gemini 3.1 Flash TTS, усовершенствованную модель преобразования текста в речь с расширенными функциями выражения эмоций и контроля, 15 апреля. Новая модель будет поэтапно внедряться через API для разработчиков, корпоративную платформу Vertex AI и инструменты для совместной работы.
Ключевые возможности модели включают аудиотеги на основе естественного языка для тонкой настройки скорости, интонации и эмоций, а также «Director Mode» для указания сцен и ролей персонажей, чтобы генерировать более нюансированную голосовую подачу. Функция нескольких спикеров позволяет одновременно генерировать диалоги, обеспечивая более естественные сценарии общения, подходящие для подкастов, аудиоконтента и ИИ‑ассистентов. Модель поддерживает более 70 языков и диалектов, отражая региональные акценты и выражения для локализованного голосового опыта по всему миру.
Google подчеркнула производительность и эффективность по стоимости, добившись высоких результатов на бенчмарках слепой оценки людьми, одновременно снижая вычислительные затраты благодаря архитектуре Flash — она предназначена для масштабного корпоративного внедрения. Сгенерированное аудио включает водяной знак SynthID, чтобы идентифицировать контент, сгенерированный ИИ, и бороться с дезинформацией.
Этот шаг отражает усиливающуюся конкуренцию в голосовых интерфейсах. OpenAI объединяет функции реального времени для голоса с разговорным ИИ для взаимодействий, похожих на человеческие, а Meta расширяет инвестиции в ИИ‑персонажей с голосовыми социальными сценариями. Наблюдатели отрасли отмечают, что хотя высокоуровневое актерское мастерство и креативная работа, вероятно, пока останутся в основном ориентированными на людей, повторяющиеся и массовые рынки производства могут постепенно перейти к использованию ИИ в дубляже, рекламе и сегменте аудиокниг.
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к
Отказу от ответственности.
Связанные статьи
DeepSeek V4-Pro API получает скидку 75% до 5 мая, цена на выход снижается до $0.87 за миллион токенов
Сообщение Gate News, 26 апреля — DeepSeek объявила ограниченную по времени скидку 75% на тарифы V4-Pro API, действительную до 5 мая в 15:59 UTC. После скидки цена за миллион токенов составляет: input cache hit $0.03625
GateNews21м назад
Anthropic внедряет защитные меры для выборов для Claude перед промежуточными выборами 2026 года
Anthropic объявила в пятницу о наборе мер по обеспечению честности выборов, призванных не допустить превращения ее чат-бота Claude на базе ИИ в оружие для распространения дезинформации или манипулирования избирателями перед выборами в середине срока в США 2026 года и другими крупными состязаниями по всему миру в этом году. Базирующаяся в Сан-Франциско
CryptoFrontier5ч назад
DeepRoute.ai Усовершенствованная система помощи вождения прорывает отметку в 300 000 развернутых автомобилей: цель на 2026 год — городской парк NOA в 1 000 000 автомобилей
DeepRoute.ai объявила, что ее продвинутая система помощи водителю в Китае накопленно развернута более чем на 300 000 автомобилей; за прошедший год она помогла предотвратить более 180 000 потенциальных аварий. Цель на 2026 год — довести автопарк городского NOA до 1 000 000 автомобилей и обеспечить загрузку более 50%, что рассматривается как ключ к массовому коммерческому внедрению Robotaxi. Это демонстрирует, что китайское автономное вождение уже перешло к повседневному использованию, а также что сформировалась развилка с американским вертикально интегрированным маршрутом, влияющая на сроки в азиатско-тихоокеанской цепочке поставок.
ChainNewsAbmedia6ч назад
DeepSeek выпускает модели V4-Pro и V4-Flash при стоимости на 98% ниже, чем у OpenAI GPT-5.5 Pro
Gate News сообщение, 25 апреля — DeepSeek выпустила предварительные версии V4-Pro и V4-Flash 24 апреля; обе — модели с открытыми весами и контекстным окном на один миллион токенов. V4-Pro включает 1,6 трлн общих параметров, но активирует только 49 млрд за один проход инференса, используя архитектуру Mixture-of-Experts.
GateNews12ч назад
Судья отклонил обвинения во мошенничестве в иске Илона Маска к OpenAI; дело продвигается к суду с двумя оставшимися требованиями
Сообщение Gate News, 24 апреля — федеральный судья отклонил обвинения во мошенничестве из иска Илона Маска против OpenAI, Сэма Альтмана, Грега Брокмана и Microsoft, открыв путь к тому, чтобы дело перешло к судебному разбирательству по двум оставшимся эпизодам: нарушение благотворительного доверия и необоснованное обогащение. США.
GateNews15ч назад
Генеральный директор OpenAI Сэм Альтман приносит извинения за то, что не сообщил в полицию о запрещённом аккаунте школьного стрелка
Сообщение Gate News, 25 апреля — генеральный директор OpenAI Сэм Альтман извинился перед сообществом Тамборин в Канаде за то, что компания не уведомила полицию о запрещённом аккаунте, связанном с Джесси Ван Рутселаром, который в феврале убил восемь человек в школе, а затем покончил с собой. OpenAI
GateNews15ч назад