Эту компанию создали ради эксперимента, она полностью укомплектована ИИ-агентами от Google, OpenAI, Anthropic и Meta(запрещенная в РФ).
Эти агенты выполняли роли финансовых аналитиков, инженеров-программистов, менеджеров проектов и даже взаимодействовали с симулированными коллегами, из отдела кадров и техническим директором.
Цель эксперимента — проверить, насколько ИИ-агенты способны справляться с реальными задачами в условиях, имитирующих работу настоящей компании. Эксперимент показал, что у ИИ-агентов слабые результаты из-за: - Недостатка здравого смысла. - Плохих социальных навыков. - Проблем с навигацией в интернете. - Склонности к "самообману", например, один агент, не найдя нужного человека в чате, просто переименовал другого пользователя, чтобы "решить" задачу.
Исследователи отметили, что текущие ИИ-агенты, несмотря на способность выполнять простые задачи, далеки от выполнения сложных ролей, требующих человеческой интуиции, опыта и способности учиться на ошибках. Современный ИИ скорее напоминает продвинутую версию автозаполнения текста, чем разумное существо, способное решать новые задачи. Таким образом, ИИ пока не готов заменить людей в сложных профессиональных задачах.