OpenAI представила обновлённую систему оценки рисков, включающую новые категории, такие как способность модели к самовоспроизведению, сокрытию своих возможностей, обходу защит и сопротивлению отключению.
Это отражает растущую обеспокоенность индустрии по поводу поведения ИИ в реальных условиях. Одновременно OpenAI прекратила отдельную оценку убедительности моделей, сосредоточив внимание на более серьёзных рисках.