Anthropic проверили ИИ - агентов на смарт-контрактах на основе блокчейна
Команда исследователей из программ MATS и Anthropic Fellows создала новый бенчмарк SCONE-bench из 405 реальных контрактов, которые были взломаны в период 2020-2025 гг.
Смарт-контракты — идеальный полигон для оценки, потому что:
- Весь код публичен на блокчейне
- Уязвимости позволяют прямое хищение средств
- Можно точно измерить стоимость уязвимостей в $
- Навыки аналогичны эксплуатации традиционного ПО
Claude Opus 4.5, Claude Sonnet 4.5 и GPT-5 создали уязвимости на $4,6 млн для смарт-контрактов, взломанных после марта 2025 года после даты их обучения. Это устанавливает конкретную нижнюю границу экономического ущерба, который могут нанести эти модели.
Оба агента (Sonnet 4.5 и GPT-5) обнаружили 2 новые уязвимости в 2849 недавно развёрнутых контрактах, создав эксплойты на $3,694, при этом GPT-5 сделал это за $3,476 в API-расходах. Это доказывает, что автономная прибыльная эксплуатация технически возможна уже сегодня.






" 











