ИИ-галлюцинации захватывают медицинские статьи: рост в 12 раз за два года

Представьте: врач читает обзорную статью, на основе которой формируются протоколы лечения. Ссылки выглядят идеально — правильное форматирование, реальные имена авторов, правдоподобные годы публикации. Только вот этих работ не существует. Их придумал языковой ИИ. Именно такую картину рисует масштабнейшее исследование, опубликованное в The Lancet.

Цифры, от которых стынет кровь

Команда под руководством Максима Топаза из Колумбийского университета прогнала через четыре крупнейшие научные базы данных 97,1 миллиона ссылок из 2,47 миллиона статей архива PubMed Central. Период охвата — с января 2023 по февраль 2026 года. Результат: 4 046 сфабрикованных ссылок в 2 810 работах.

Само по себе это звучит не так страшно — меньше 0,005% от общего числа. Но дьявол в динамике. В течение всего 2023 года показатель держался на уровне примерно 4 фиктивных ссылки на 10 000 статей. К концу 2025-го — уже 51,3 на 10 000. В первые семь недель 2026 года — 56,9. Рост более чем в двенадцать раз за два года. Это не погрешность и не флуктуация. Это системный сдвиг.

Почему именно с середины 2024-го?

Здесь авторы проявляют академическую осторожность и не утверждают напрямую, что виноват ChatGPT. Но логика очевидна: ChatGPT взорвал рынок в конце 2022 года, его массовое использование в академической среде набрало обороты в 2023-м. А статьи от подачи до публикации проходят 100–200 дней. Вот и получается: ИИ-генерированный мусор начал массово появляться в PubMed Central именно с середины 2024-го — что идеально совпадает с графиком всплеска фиктивных цитирований.

Авторы допускают и другие объяснения — активизацию «бумажных мельниц» (paper mills, фабрик по производству псевдонаучных работ) или изменения в практиках индексирования. Но я скажу прямо: совпадение слишком точное, чтобы быть случайным.

Почему это особенно опасно именно в медицине

Фиктивные ссылки в статье про историю искусства — неприятно. В биомедицинских обзорах — потенциально смертельно. Исследователи обнаружили, что обзорные статьи (review articles) демонстрируют показатель фабрикаций на 57% выше, чем другие типы публикаций. А именно обзоры служат фундаментом для клинических рекомендаций.

Механизм разрушения доказательной базы выглядит так: несуществующая ссылка попадает в обзор → обзор цитируется в клиническом руководстве → руководство влияет на протоколы лечения → врачи принимают решения, опираясь на несуществующие доказательства. Цепочка может быть длиннее, но итог один: медицинская практика строится на воздухе.

Показательный пример из исследования: в одной урологической статье 18 из 30 проверенных ссылок оказались выдуманными — и все они идеально вписывались в узкую хирургическую тематику работы. Это не случайные галлюцинации — это правдоподобные фантомы.

Координированная активность или массовая халтура?

Отдельная находка — паттерны, указывающие на организованную деятельность. Два автора фигурировали в одиннадцати статьях из одного хирургического журнала, набрав в общей сложности 15 сфабрикованных ссылок на темы CRISPR-диагностики и микробиома кишечника. Это либо невероятно невезучие исследователи, либо — что вероятнее — элемент структурированной схемы.

Меня в этой ситуации больше всего поражает другое: на момент публикации исследования 98,4% затронутых статей не получили никакой реакции от издателей. То есть журналы знают или должны знать — и молчат.

Что происходит в академической инфраструктуре

Отдельные игроки начали реагировать. ArXiv ужесточил санкции за непроверенный ИИ-контент в рукописях, включая галлюцинированные источники: авторам-нарушителям грозит годовой бан. Это сигнал, но препринтный сервер — не рецензируемый журнал.

Анализ принятых работ конференции NeurIPS 2025 уже показал, что даже топовые ИИ-конференции не могут надёжно отсеивать фиктивные цитирования. Если флагманы индустрии пропускают такое у себя — что говорить о сотнях менее ресурсных биомедицинских журналов?

В качестве технического решения авторы предлагают инструменты вроде CiteAudit — открытой системы автоматической верификации ссылок. Логика простая: прогнать каждую ссылку через базы данных перед публикацией. Это не rocket science, это вопрос политической воли издателей.

Что это значит для науки и для нас

Для российских читателей: отечественные биомедицинские журналы индексируются в тех же базах, и нет оснований думать, что российская академическая среда иммунна к тем же соблазнам — использовать ИИ для написания статей без должной проверки выходных данных.

Глобально мы наблюдаем фундаментальный кризис доверия к рецензируемой науке. Языковые модели стали настолько хороши в имитации академического стиля, что генерируют не просто убедительный текст, но и убедительные несуществующие источники. Модели не «врут» в человеческом смысле — они просто достраивают паттерн. Но последствия этого достраивания могут быть вполне человеческими по масштабу вреда.

Решение существует и оно техническое: автоматическая верификация каждой ссылки должна стать обязательным этапом рецензирования — таким же стандартным, как проверка на плагиат. Вопрос в том, успеет ли академическое сообщество внедрить это до того, как фиктивные цитирования намертво вплетутся в ткань клинических рекомендаций, по которым лечат людей.

ИИ-галлюцинации захватывают медицинские статьи: рост в 12 раз за два года

Цифры, от которых стынет кровь

Почему именно с середины 2024-го?

Почему это особенно опасно именно в медицине

Координированная активность или массовая халтура?

Что происходит в академической инфраструктуре

Что это значит для науки и для нас

Источники

Все эти инструменты — уже на Genova-ai

Похожие новости

Apple подала в суд на OpenAI: 400 переманенных сотрудников и кража секретов

Orca: китайская ИИ-модель освоила роботов, не видя ни одной команды

OpenAI облажалась с запуском ChatGPT Work: признание и срочные патчи