Together AI и команда Agentica выпустили ИИ- агента для программирования DeepSWE, который построен на базе ИИ- модели Qwen3-32B.
DeepSWE обучен с помощью обучения с подкреплением, т.е. модель учится решать задачи через пробы и ошибки, получая обратную связь от результатов своей работы.
DeepSWE использует rLLM — модульный фреймворк от команды Agentica.
На бенчмарке SWEBench-Verified, где ИИ-агенты решают реальные GitHub issues, DeepSWE показал 42.2% успешных решений с первой попытки и 59% при использовании дополнительного времени на обдумывание.