Новости генеративного ИИ

Релизы, обновления и тренды — всё самое важное простым языком

9 из 183

Apple
Голос

Siri AI наконец-то умная: живые тесты нового ассистента Apple

Apple переосмыслила Siri до неузнаваемости — теперь это разговорный ИИ на базе Gemini, который знает ваши планы, фото и сообщения. Мы проверили, что из этого вышло.

20 июня4 мин чтения
Apple
Голос

Siri на Gemini: Apple снова представляет «новую» Siri на WWDC 2026

Apple в третий раз анонсирует обновлённую Siri — теперь на движке Google Gemini. Главный козырь: приватность вместо мощи, и бета-статус как щит от провала.

6 июня5 мин чтения
S
Голос

Sesame: голосовой ИИ с памятью всех ваших разговоров

Новый голосовой агент запоминает каждую беседу и использует контекст прошлых диалогов. Разбираемся, что это меняет для пользователей и насколько это безопасно.

1 июня5 мин чтения
ElevenLabs
Голос

ElevenLabs Dubbing v2: теперь 90 языков и голос звучит как оригинал

ElevenLabs обновила автодубляж: поддержка выросла до 90+ языков, а главное — модель сохраняет голос оригинального спикера, его тембр, высоту и интонацию на всех языках.

29 мая4 мин чтения
S
Голос

StepAudio 2.5 Realtime: голосовой ИИ, который чувствует усталость в вашем голосе

Шанхайский StepFun выпустил end-to-end голосовую модель реального времени с ролевым RLHF и пониманием паралингвистики — и сразу занял первое место по всем пяти бенчмаркам.

25 мая4 мин чтения
xAI
Голос

Grok Voice Think Fast 1.0: голосовой ИИ от xAI, который думает на ходу

xAI выпустила флагманскую голосовую модель, обогнавшую GPT Realtime и Gemini на бенчмарке τ-voice Bench — 67,3% против 35,3% у конкурентов.

16 мая4 мин чтения
xAI
Голос

Grok Voice Agent API: голосовой ИИ от xAI теперь доступен разработчикам

xAI открыла Grok Voice Agent API для сторонних разработчиков — голосовой ИИ с задержкой менее 700 мс уже интегрирован в LiveKit и Voximplant.

13 мая4 мин чтения
xAI
Голос

xAI запустила голосовые API Grok: речь в текст и текст в речь

Элон Маск бросает перчатку ElevenLabs и Deepgram: xAI открыла автономные API для распознавания и синтеза речи с впечатляющими бенчмарками точности.

12 мая4 мин чтения
OpenAI
Голос

OpenAI запустила три голосовых модели с интеллектом GPT-5

OpenAI представила GPT-Realtime-2, GPT-Realtime-Translate и GPT-Realtime-Whisper — голосовые модели нового поколения с рассуждением в реальном времени и переводом на 70+ языков.

8 мая4 мин чтения

🔥 Популярные теги

🚀 Genova-ai

Все ИИ-инструменты без VPN и зарубежных карт

Попробовать бесплатно →