Новости генеративного ИИ
Релизы, обновления и тренды — всё самое важное простым языком
183 статей · Страница 10 из 16
ИИ-галлюцинации захватывают медицинские статьи: рост в 12 раз за два года
Аудит 2,5 миллиона биомедицинских работ выявил катастрофический рост фиктивных ссылок — с 2023 года их число увеличилось более чем в 12 раз. Под угрозой клинические рекомендации.
Together AI открывает OSCAR: сжатие KV-кэша до 2 бит без потери точности
Together AI выпустила OSCAR — систему квантования KV-кэша до INT2, которая впервые делает 2-битное сжатие практичным для длинных контекстов без деградации качества.
ИИ даёт правильный ответ, но ссылается на несуществующее место в документе
Исследователи Пекинского университета выяснили: даже когда GPT и Gemini отвечают верно, они часто указывают на неправильные фрагменты документа — и это огромная проблема для юристов и медиков.
StepAudio 2.5 Realtime: голосовой ИИ, который чувствует усталость в вашем голосе
Шанхайский StepFun выпустил end-to-end голосовую модель реального времени с ролевым RLHF и пониманием паралингвистики — и сразу занял первое место по всем пяти бенчмаркам.
AlphaProof Nexus решил задачи Эрдёша за несколько сотен долларов
Google DeepMind создал ИИ-систему, которая автономно решила 9 открытых задач Эрдёша — некоторые не поддавались математикам 56 лет — потратив лишь несколько сотен долларов на каждую.
Copilot врёт о данных: ИИ подменяет анализ стереотипами
Математик скормил Copilot одинаковые данные под разными ярлыками — и ИИ уверенно описал несуществующие различия между странами. Режим Auto оказался ловушкой.
Microsoft Webwright: терминал вместо браузера — и GPT-5.4 взлетает до 60%
Microsoft Research выпустила Webwright — агентный фреймворк, где ИИ пишет Playwright-скрипты вместо кликов. Результат: 60,1% на Odysseys против базовых 33,5% у GPT-5.4.
Claude Code сам придумал алгоритм ИИ, который люди не додумались бы
Исследователи дали агенту Claude Code свободу поиска — и он нашёл алгоритм, сокращающий вычисления на 70% при той же точности. Открытие обошлось в $40.
Perplexity открыла Bumblebee — сканер для защиты от атак на разработчиков
Компания выложила в open-source инструмент, который проверяет AI-окружения без запуска кода. Реальная защита от supply-chain атак на локальной машине.
Google Omni: ИИ превращает любой контент в видео — тест на плюшевом олене
Google запустила Omni Flash — мультимодальную модель, которая делает видео из чего угодно. Мы проверили, насколько это реально работает.
Qwen3.7-Max: ИИ Alibaba 35 часов сам оптимизировал чип без помощи людей
Новая модель Alibaba автономно работала почти полтора суток, ускорив код в 10 раз. Это новый стандарт для агентских ИИ-систем.
Claude Mythos нашёл 10 000 дыр: патчить не успевают
Anthropic предупреждает: их новая модель Claude Mythos Preview обнаруживает критические уязвимости быстрее, чем разработчики успевают их закрывать — и это реальная угроза.