Параллельное мышление — это способность одновременно исследовать несколько путей решения задачи, а затем объединять результаты.
Авторы разработали новую систему обучения Parallel-R1, которая происходит в 2 этапа:
Базовое обучение: ИИ учится на простых математических задачах, осваивает формат параллельного мышления.
Продвинутое обучение: модель сама пробует разные стратегии на сложных задачах, получает обратную связь и улучшается.
Система использует специальные "метки" в тексте, чтобы показать, где начинается параллельное мышление, какие пути рассматриваются и как они объединяются.
На математических задачах новый подход дает прирост точности около 8%. На особо сложных олимпиадных задачах — до 43% улучшения.
Интересно, что поведение ИИ меняется в процессе обучения: сначала он использует параллельные пути для поиска решений, а потом — для проверки уже найденных ответов.
Ограничения - метод протестирован только на математике. Неясно, сработает ли он в других областях. Кроме того, обучение требует значительных вычислительных ресурсов.