Carnegie Mellon и IBM обучили нейроагент с динамикой мозга

Они показали, как автономное поведение и динамика всего мозга возникают у воплощенных агентов с внутренней мотивацией, обусловленной моделями мира.

Команда из Carnegie Mellon и IBM Research создала виртуальную рыбку данио-рерио, которая не только плавает как настоящая, но и "думает" теми же нейронными схемами. Это первая модель, которая одновременно воспроизводит и поведение животного, и активность всех клеток его мозга.

Новый алгоритм 3M-Progress основан на простой, но интересной идее: сравнивать текущий опыт с "этологической памятью"— моделью того, как должно работать нормальное поведение.

Как это работает?

- Агент изучает мир в естественных условиях, формируя "этологическую память"
- В новой ситуации он строит текущую модель происходящего
- Расхождения между моделями становятся источником внутренней мотивации
- Агент исследует состояния, где модели "спорят", и отдыхает там, где они согласны.

Почему это важно?
1. Доказана возможность создания агентов с устойчивой внутренней мотивацией, основанной на принципах работы мозга.

2. Первая работающая модель нейро-глиальных взаимодействий в контексте целенаправленного поведения.

3. Показано, как автономность может возникать из сравнения внутренних моделей мира.

3M-Progress агенты научились стабильно переключаться между активностью и пассивностью, точно воспроизводя паттерны настоящих рыбок. Другие алгоритмы (ICM, RND, Disagreement) провалились.

Модель объяснила практически всю дисперсию в активности ~300,000 клеток мозга рыбки (130K нейронов + 130K астроцитов). Удивительно, но хватило простого сопоставления "один к одному".

Анализ главных компонент показал, что искусственные "нейроны" и "астроциты" действительно воспроизводят функции своих биологических прототипов.

Это значительный прогресс, работа ограничена одним типом поведения у простого животного в упрощенной среде. Биологическая точность все еще далека от реальности.

Вы здесь

Carnegie Mellon и IBM обучили нейроагент с динамикой мозга