Новости генеративного ИИ
Релизы, обновления и тренды — всё самое важное простым языком
9 из 183
Siri AI наконец-то умная: живые тесты нового ассистента Apple
Apple переосмыслила Siri до неузнаваемости — теперь это разговорный ИИ на базе Gemini, который знает ваши планы, фото и сообщения. Мы проверили, что из этого вышло.
Siri на Gemini: Apple снова представляет «новую» Siri на WWDC 2026
Apple в третий раз анонсирует обновлённую Siri — теперь на движке Google Gemini. Главный козырь: приватность вместо мощи, и бета-статус как щит от провала.
Sesame: голосовой ИИ с памятью всех ваших разговоров
Новый голосовой агент запоминает каждую беседу и использует контекст прошлых диалогов. Разбираемся, что это меняет для пользователей и насколько это безопасно.
ElevenLabs Dubbing v2: теперь 90 языков и голос звучит как оригинал
ElevenLabs обновила автодубляж: поддержка выросла до 90+ языков, а главное — модель сохраняет голос оригинального спикера, его тембр, высоту и интонацию на всех языках.
StepAudio 2.5 Realtime: голосовой ИИ, который чувствует усталость в вашем голосе
Шанхайский StepFun выпустил end-to-end голосовую модель реального времени с ролевым RLHF и пониманием паралингвистики — и сразу занял первое место по всем пяти бенчмаркам.
Grok Voice Think Fast 1.0: голосовой ИИ от xAI, который думает на ходу
xAI выпустила флагманскую голосовую модель, обогнавшую GPT Realtime и Gemini на бенчмарке τ-voice Bench — 67,3% против 35,3% у конкурентов.
Grok Voice Agent API: голосовой ИИ от xAI теперь доступен разработчикам
xAI открыла Grok Voice Agent API для сторонних разработчиков — голосовой ИИ с задержкой менее 700 мс уже интегрирован в LiveKit и Voximplant.
xAI запустила голосовые API Grok: речь в текст и текст в речь
Элон Маск бросает перчатку ElevenLabs и Deepgram: xAI открыла автономные API для распознавания и синтеза речи с впечатляющими бенчмарками точности.
OpenAI запустила три голосовых модели с интеллектом GPT-5
OpenAI представила GPT-Realtime-2, GPT-Realtime-Translate и GPT-Realtime-Whisper — голосовые модели нового поколения с рассуждением в реальном времени и переводом на 70+ языков.