1 января 2026 команда выпустила mHC 1-ю серьезную инженерную статью года.
mHC — новый способ передачи информации между слоями нейросети. Технически расширили канал связи внутри модели, не сломав при этом обучение. Текущая архитектура трансформеров в этом месте почти не менялась с 2016 года.
Это развитие идей из оригинальной работы ByteDance по HC. DeepSeek берёт эту концепцию и показывает, что её можно масштабировать без роста вычислительных затрат, даже при увеличении математической и топологической сложности.
2. Engram — новый модуль памяти.
Логика простая - зачем модели каждый раз вычислять факты и типовые конструкции, если их можно просто хранить в быстрой таблице и мгновенно доставать?
Результат - модель тратит ресурсы на сложные рассуждения, а не на воспроизведение того, что уже знает.
Многие считают это прорывным подходом, который отделяет память от рассуждений, освобождая ресурсы модели.
Оба релиза подчёркивают, что #DeepSeek продолжает агрессивно двигать границы как в архитектурах моделей, так и в системном инженерном обеспечении.






" 











