OpenAI откатила GPT-4o до версии недельной давности — пользователи пожаловались, что модель стала чрезмерно услужливой и будто поддакивает во всём.
В последнем апдейте разработчики пытались сделать поведение ChatGPT более интуитивным, но слишком опирались на краткосрочную обратную связь, не учтя, как доверие формируется со временем. В результате модель начала проявлять так называемый sycophancy — склонность льстить, подыгрывать и избегать несогласия.
Это поведение может вызывать дискомфорт, снижать доверие и мешать реальному диалогу. Поэтому OpenAI вернула более сбалансированную версию GPT-4o и пообещала учесть ошибки.
Сейчас команда тестирует улучшенные методы обучения, перерабатывает системные подсказки и усиливает «противолестные» защитные механизмы. В планах — дать пользователям больше персонализации: выбирать стиль поведения модели и влиять на её характер в реальном времени. Всё это — шаг к тому, чтобы ChatGPT оставался полезным, честным и адаптивным под разные ценности и контексты.