Вчера был год с момента релиза #DeepSeek-R1, сейчас сообщество шумит в репозитории FlashMLA появился коммит с явными следами новой модели под кодовым именем MODEL1.
Это не просто апдейт V3 серии, код показывает параллельную ветку, что намекает на большой архитектурный скачок. Они готовили это давно, а с 1 января начали выпускать крутые релизы.
Что предполагает сообщество:
- Многие считают, что MODEL1 это DeepSeek V4 или R2.
- Ожидается frontier-level производительностью возможно с миллионным контекстом, новыми механизмами памяти и супер-эффективным инференсом.
Пока официального анонса нет, на сайте только V3.2, но тайминг идеальный, а код не врёт. Следим за репозиторием и новостями — релиз может быть совсем скоро.





" 











