ChatGPT Agent — это ИИ, который не только отвечает на вопросы, но и выполняет задачи, используя собственный «виртуальный компьютер».
Пользователь активирует режим агента через меню «Agent Mode» или команду «/agent» в интерфейсе ChatGPT.
Он может:
- Проводить исследования, собирать данные с веб-сайтов и синтезировать их в отчёты.
- Создавать презентации, таблицы и другие документы с возможностью их редактирования.
- Взаимодействовать с веб-сайтами: заполнять формы, кликать по кнопкам, искать информацию.
- Работать с внешними сервисами через API (например, Gmail, GitHub) с помощью ChatGPT Connectors.
- Планировать задачи: от бронирования ресторана до анализа финансовых данных.
ChatGPT Agent использует набор инструментов:
1. Визуальный браузер, который взаимодействует с сайтами, как человек, кликая и прокручивая страницы.
2. Текстовый браузер, который быстро собирает информацию с веб-страниц.
3. Терминал, выполняющий код в изолированной среде.
4. API-доступ, который интегрируется с внешними сервисами.
5. Memento сохраняет прогресс для долгих задач.
Задачи занимают от 5 до 30 минут в зависимости от сложности.
Сэм Альтман назвал технологию «передовой, но не готовой для высокорисковых задач или работы с чувствительными данными». Пользователям рекомендуют быть осторожными, особенно при предоставлении личной информации.
ChatGPT Agent — часть глобального тренда на агентские ИИ, которые становятся цифровыми помощниками, способными выполнять многоэтапные задачи. По прогнозам Litslink, рынок ИИ-агентов вырастет с $5.4 млрд в 2022 году до $47.1 млрд к 2030 году с годовым ростом 45%.