Вы здесь

Tencent представили обучение языковых моделей параллельному мышлению

Дата публикации:12.09.2025, 14:29

Поделись с друзьями!

Параллельное мышление — это способность одновременно исследовать несколько путей решения задачи, а затем объединять результаты.

Авторы разработали новую систему обучения Parallel-R1, которая происходит в 2 этапа:

Базовое обучение: ИИ учится на простых математических задачах, осваивает формат параллельного мышления.

Продвинутое обучение: модель сама пробует разные стратегии на сложных задачах, получает обратную связь и улучшается.

Система использует специальные "метки" в тексте, чтобы показать, где начинается параллельное мышление, какие пути рассматриваются и как они объединяются.

На математических задачах новый подход дает прирост точности около 8%. На особо сложных олимпиадных задачах — до 43% улучшения.

Интересно, что поведение ИИ меняется в процессе обучения: сначала он использует параллельные пути для поиска решений, а потом — для проверки уже найденных ответов.

Ограничения - метод протестирован только на математике. Неясно, сработает ли он в других областях. Кроме того, обучение требует значительных вычислительных ресурсов.