Все знают, что сфера ИИ очень конкурентна и многие стартапы терпят неудачу. Раньше их код и накопленные данные просто пылились и не приносили денег.
Но теперь ситуация меняется - OpenAI и Google отчаянно ищут новые источники данных для обучения своих моделей, потому что публично доступные данные из интернета уже в значительной степени исчерпаны.
Особенно ценны приватные кодовые базы реальных продуктов — они сложнее, учитывают безопасность, масштабируемость и реальные бизнес-правила, в отличие от открытого кода хобби-проектов.
Такой код помогает улучшать ИИ в программировании, что сейчас очень прибыльно и в автоматизации исследований.
Появились посредники — компании по разметке и курации данных. Они скупают кодовые базы закрывшихся стартапов за десятки тысяч долларов, а потом перепродают их ИИ-лабораториям.
Одна из таких компаний - посредников Turing даже запускает инициативу Project Lazarus для систематического приобретения таких "мёртвых" кодовых баз.
Эти базы используют по-разному:
- Для предобучения, чтобы улучшить общее понимание кода.
- Для дообучения.
Для закрывающихся стартапов это способ вернуть хоть какие-то деньги инвесторам. Основатели находят продавцов через связи или напрямую связываются с экс-разработчиками.
Пока это не массовая тенденция, но эксперты считают, что это станет нормальной опцией при закрытии: "А что ещё делать с кодом?"






" 











