Anthropic и создатель ChatGPT создали ИИ-агента, выявляющий вредоносное дообучение ИИ-моделей
Команда Anthropic совместно с Джоном Шульманом, который ранее был chief scientist OpenAI, а сейчас сооснователь Thinking Machines, представили ИИ-агента аудитора - систему на базе LLM, которая проверяет тонко настроенные модели перед их развертыванием.