Они показали, как автономное поведение и динамика всего мозга возникают у воплощенных агентов с внутренней мотивацией, обусловленной моделями мира.
Команда из Carnegie Mellon и IBM Research создала виртуальную рыбку данио-рерио, которая не только плавает как настоящая, но и "думает" теми же нейронными схемами. Это первая модель, которая одновременно воспроизводит и поведение животного, и активность всех клеток его мозга.
Новый алгоритм 3M-Progress основан на простой, но интересной идее: сравнивать текущий опыт с "этологической памятью"— моделью того, как должно работать нормальное поведение.
Как это работает?
- Агент изучает мир в естественных условиях, формируя "этологическую память"
- В новой ситуации он строит текущую модель происходящего
- Расхождения между моделями становятся источником внутренней мотивации
- Агент исследует состояния, где модели "спорят", и отдыхает там, где они согласны.
Почему это важно?
1. Доказана возможность создания агентов с устойчивой внутренней мотивацией, основанной на принципах работы мозга.
2. Первая работающая модель нейро-глиальных взаимодействий в контексте целенаправленного поведения.
3. Показано, как автономность может возникать из сравнения внутренних моделей мира.
3M-Progress агенты научились стабильно переключаться между активностью и пассивностью, точно воспроизводя паттерны настоящих рыбок. Другие алгоритмы (ICM, RND, Disagreement) провалились.
Модель объяснила практически всю дисперсию в активности ~300,000 клеток мозга рыбки (130K нейронов + 130K астроцитов). Удивительно, но хватило простого сопоставления "один к одному".
Анализ главных компонент показал, что искусственные "нейроны" и "астроциты" действительно воспроизводят функции своих биологических прототипов.
Это значительный прогресс, работа ограничена одним типом поведения у простого животного в упрощенной среде. Биологическая точность все еще далека от реальности.