MLE-Dojo — это платформа, которая позволяет ИИ-агентам учиться решать сложные задачи, такие как анализ данных, настройка моделей, отладка кода и прогнозирование временных рядов. Она основана на 200+ реальных задачах с Kaggle, охватывающих табличные данные, компьютерное зрение,обработку текста и многое другое.
Ключевые возможности : 1. Работает как тренажер для агентов, где они могут итеративно тестировать гипотезы, получать обратную связь и совершенствоваться. 2. Поддерживает тонкую настройку и обучение с подкреплением с детальной историей действий агента и среды. 3. структура позволяет легко добавлять новые задачи, инструменты и действия через удобный API. 4. Метрика HumanRank Score сравнивает результаты агентов с достижениями людей на лидерборде Kaggle, обеспечивая честную оценку. 5. Результаты тестирования 8 современных LLM (например, o3-mini, DeepSeek-r1, Gemini-2.5-Pro) доступны в реальном времени. MLE-Dojo помогает: - Разрабатывать умных агентов, которые могут самостоятельно решать задачи MLE. - Сравнивать производительность LLM в реальных сценариях. - Ускорять исследования в области автономного машинного обучения. - Обучать и тестировать новые подходы в безопасной и воспроизводимой среде.