Современные исследования в области искусственного интеллекта всё чаще указывают на необходимость создания моделей мира (world models) для достижения общего искусственного интеллекта (AGI). Google DeepMind и ведущие учёные, такие как Ян Лекун, подтверждают: без таких моделей AGI останется недостижимой целью.
Позиция Янна Лекуна: архитектура для AGI
Ян Лекун, главный научный сотрудник Meta AI, предлагает строить AGI на основе моделей мира, имитирующих человеческое мышление. Его архитектура включает:
-
Генерация действий — система анализирует возможные действия (например, перемещение объекта).
-
Моделирование мира — предсказание последствий действий на основе сенсорных данных и памяти.
-
Оценка сценариев — расчёт «полезности» каждого исхода для задачи и безопасности.
По мнению Лекуна, такая система должна обучаться через взаимодействие с миром, а не только на текстовых данных. Ключевой элемент — способность предвидеть результаты действий, что требует внутреннего представления физических и социальных законов
Google DeepMind: модели мира как путь к AGI
В январе 2025 года компания Google объявила о создании специализированной команды для разработки моделей мира, способных имитировать физическую реальность5. В отличие от современных ИИ, которые реагируют на данные, эти модели позволят:
-
Прогнозировать изменения окружающей среды (например, последствия климатических явлений).
-
Планировать действия в условиях неопределённости.
-
Обобщать знания из разных областей57.
Как отметил генеральный директор Google DeepMind Демис Хассабис, современные системы ИИ, включая LLM (большие языковые модели), не способны к причинно-следственному анализу, что критически ограничивает их применение в реальном мире14.
Почему LLM недостаточно?
Несмотря на успехи языковых моделей, они сталкиваются с фундаментальными ограничениями:
-
Зависимость от данных — требуют огромных массивов данных, но не понимают контекст
-
Отсутствие обратной связи — неспособность корректировать действия на основе последствий
-
Плохая обобщаемость — знания, полученные в одной области, не переносятся на другие.
Модели мира решают эти проблемы через:
-
Внутренние симуляции — предсказание результатов до совершения действия
-
Мультимодальность — интеграция данных от датчиков, текста, изображений
-
Память и планирование — сохранение опыта для долгосрочных стратегий
Технические вызовы
Даже при поддержке Google и Meta разработка моделей мира сталкивается с трудностями:
-
Архитектура — необходимо объединить подходы на основе нейронных сетей с символьными методами
-
Обучение — как эффективно тренировать систему на редких событиях (например, аварийных ситуациях)
-
Безопасность — предотвращение непреднамеренных последствий действий AGI
Ян Лекун считает, что преодоление этих барьеров займёт около десяти лет. Однако уже сейчас проекты вроде Sora (OpenAI) и World Labs (стартап с финансированием в 230 миллионов долларов) демонстрируют прогресс в симуляции физических процессов
Заключение
Создание AGI без моделей мира напоминает попытку построить самолёт, не зная аэродинамики. Google DeepMind и Ян Лекун едины во мнении: только системы, способные внутренне моделировать реальность, смогут достичь интеллекта человеческого уровня. Хотя технические препятствия остаются, инвестиции в эту область (как со стороны корпораций, так и стартапов) указывают на её ключевое значение для будущего ИИ