Это фундаментально меняет стратегию многих компаний, которые считали свои данные главным активом.
В свежем интервью бывший руководитель исследований OpenAI говорит, что эволюционировало мышление о данных.
1. Несколько лет назад, в период GPT-3 компании думали: "У нас есть уникальные данные индустрии, давайте обучим на них свою модель".
Но оказалось, что все эти специализированные модели оказались хуже следующего поколения GPT.
Почему? Сила интеллекта и способность синтезировать новую информацию > запоминание старой информации.
2. Сейчас - ключевой инсайт:
Проприетарные данные часто = "воплощенный труд"
Примеры:
- Кто-то годами обзванивал клиентов и собирал информацию
- Кто-то прорабатывал тысячи кейсов
- Компания накапливала опыт через годы работы.
НО ТЕПЕРЬ ИИ может воспроизвести всё это: -позвонить всем клиентам (виртуально)
- проработать все кейсы
- провести массовые исследования
Что действительно останется ценным?
1. Данные о конкретных клиентах:
Пример с финансовым консультантом, который знает ВСЁ о конкретном клиенте (портфель, цели, риск-профиль). Эти данные ценны не потому, что делают её лучшим консультантом вообще, а потому, что позволяют применить её навыки конкретно для ЭТОГО клиента.
2. Доверенные данные:
- Данные, которые клиенты доверили именно вам
- Которые они не будут делить с другими
- Которые дают вам возможность персонализировать услугу.
Проблемы с использованием пользовательских данных для обучения, если обучить модель на данных одного пользователя, информация может "просочиться" к другому. Это ограничивает использование таких данных для улучшения моделей.