AIRI победили в двух престижных соревнованиях MindGames Arena и CURE-Bench.

MindGames Arena - соревнование, где агенты играют в социальные игры - переговоры, доверие, манипуляции. Это продолжение знаменитой серии Concordia, которую год назад запустили Google DeepMind.

Команда In2AI, которая состояла из AIRI + Coframe + Иннополис, взяла 1-е место в самом сложном треке Generalization (новые игры, которых модель никогда не видела). Их модель на 8 млрд параметров обыграла оппонентов, включая агентов на GPT-5, Gemini 2.5 Pro и Grok 4, и сделала это сразу в двух дивизионах: эффективные и открытый.

По сути, они показали, что в социальном интеллекте грамотный RL важнее размера.

А вторая история - медицинские рекомендации без интернета. Команда VIM, которая состояла из AIRI + iMak AI Lab, вошла в топ-8 на CURE-Bench - первый большой челлендж от Гарварда и MIT, где проверяли именно терапевтический ИИ.

Ребята выбрали самый сложный трек - Internal Model Reasoning, где нельзя использовать внешние базы, API, поисковики. Kaggle.

В итоге их модель показала высокую согласованность с врачебной практикой, когда нельзя гуглить и подглядывать в справочники.

Это показывает, что медицинский ИИ ≠ обязательно LLM + RAG + PubMed.
Команда показала, что можно обойтись без этого и всё равно выдавать клинически осмысленные рекомендации, которые проходят тройную проверку.

Это важно для нашего реального мира, где в больнице интернета может не быть, базы могут быть недоступны, а решение нужно прямо сейчас.
За согласованность прогнозов и отсутствие выдуманных фактов в рассуждениях команда получила Excellence Award.

Вы здесь

AIRI победили в двух престижных соревнованиях MindGames Arena и CURE-Bench.