Anthropic опубликовала подробный разбор своей системы Claude Research — функции, которая использует несколько ИИ-агентов для исследования сложных тем.
По внутренним тестам Anthropic, многоагентная система превосходит одноагентную на 90% для таких задач.
Claude Research работает по принципу "главный агент + подчинённые". Когда пользователь задаёт вопрос, главный агент разбивает его на подзадачи и создаёт специализированных подагентов для параллельного поиска информации. Каждый подагент работает в своём контексте и возвращает результаты координатору.
Многоагентный подход показывает хорошие результаты для задач, которые можно разделить на независимые части:
- Поиск информации о членах советов директоров компаний из списка S&P 500
- Исследование различных аспектов сложной темы
- Задачи, где нужно обработать больше информации, чем помещается в один контекст.
Система плохо подходит для задач, где:
- Агенты должны постоянно обмениваться информацией
- Все агенты должны работать с одним общим контекстом
- Много зависимостей между подзадачами
- Большинство задач программирования, например, не очень подходят для такого подхода.
Многоагентные системы потребляют очень много токенов:
Если обычные агенты используют в 4 раза больше токенов, чем чат. То многоагентные системы в 15 раз больше токенов, чем чат.
Это означает, что подход экономически оправдан только для задач высокой ценности.
Практические выводы:
- Многоагентные системы подходят для узкого класса задач с возможностью параллелизации.
- 15-кратное увеличение потребления токенов требует соответствующей ценности задачи.
- Большая часть работы — в правильном описании задач для агентов и координации между ними.
- Качество описаний инструментов напрямую влияет на производительность агентов.
- Нужны специальные подходы для тестирования непредсказуемых систем.