Исследователи из Sakana AI и Университета Нотр-Дам представили систему IASC (Interactive Agentic System for ConLangs) — 1-й комплексный инструмент для создания искусственных языков с помощью LLM.
IASC пошагово конструирует искусственный язык — сначала придумывает звуки, потом грамматику, потом письменность, потом пишет учебник.
Главное открытие этой работы - LLM действительно понимают, как работает язык вообще, но лучше справляются с обычными паттернами, как английский порядок слов, чем с редкими, как эргативность в баскском.
Практически - инструмент для создания языков + диагностика того, что ИИ реально понимает в лингвистике.
IASC показывает, что современные LLM обладают достаточными металингвистическими знаниями для создания правдоподобных искусственных языков при правильной организации процесса.
Ключевыми факторами успеха являются модульность, итеративность и агентный подход с обратной связью.
Работа также выявляет свойство LLM - их знания о языке неравномерны и коррелируют с частотностью явлений в обучающих данных. Это ограничивает, но не отменяет их полезность как инструмента для лингвистических задач.