В июле 2025 года журнал Nature представил модель искусственного интеллекта под названием «Центавр». Разработанная на основе языковых моделей и настроенная с помощью психологических экспериментов, она успешно справилась с 160 когнитивными тестами: от принятия решений до исполнительного контроля. Многие эксперты посчитали это прорывом на пути к созданию ИИ, способного моделировать человеческое мышление.
Однако новое исследование, опубликованное в National Science Open, ставит под сомнение эти достижения. Учёные из Чжэцзянского университета утверждают, что успех «Центавра» связан с переобучением — модель не понимала суть задач, а просто запоминала шаблоны ответов. В одном из тестов ей заменили описание задания на фразу «Пожалуйста, выберите вариант А», но она продолжила давать «правильные» ответы из исходного набора данных.
Это напоминает студента, который блестяще сдаёт экзамены, зазубрив формат вопросов, но не разбираясь в материале. Такое поведение подчёркивает главную проблему современных языковых моделей: их «чёрный ящик» не позволяет понять, как они приходят к результатам. Поэтому тщательное и разнообразное тестирование становится критически важным для оценки реальных способностей ИИ.
Главный же вывод исследования касается языкового понимания. «Центавр» не умеет распознавать намерения, стоящие за вопросами, а лишь манипулирует статистическими паттернами. Учёные подчёркивают: именно понимание языка, а не просто подбор ответов, — самое серьёзное препятствие на пути к ИИ, способному моделировать человеческое познание.
Источник: This AI knew the answers but didn’t understand the questions