Группа «Т-Технологии» выпустила LLM с гибридным режимом рассуждений T-Pro 2.0

21 июля, 12:37|

Группа «Т-Технологии» представила гибридную большую языковую модель T-Pro 2.0. Пользователь может выбрать между быстрым ответом или режимом рассуждения для сложных задач. Модель основана на семействе Qwen 3 китайской Alibaba и включает методы непрерывного предобучения и выравнивания.

Размер T-Pro 2.0 — 32 млрд параметров. Она способна решать сложные аналитические задачи, структурно рассуждать, планировать действия, выдвигать гипотезы и опровергать их.

Т-Банк планирует интегрировать новую модель в работу ИИ-ассистентов. Внутренняя версия T-Pro 2.0, обученную на собственных данных, внедрили в работу автономных агентов поддержки банка. Утверждается, что они стали решать задачи пользователей без участия оператора на 10% чаще без дополнительных затрат на разработку или операционные процессы.

Как отмечает «Т-Технологии», T-Pro 2.0 показал более высокое качество на русскоязычных бенчмарках, включая MERA, ruMMLU, Ru Arena Hard, ru AIME, ru LCB, по сравнению с другими открытыми моделями на 30 млрд параметров. В этих бенчмарках новая модель превосходит Qwen3-32B, Ruadapt 3 32B V2, DeepSeek-R1-Distill-Qwen-32B и Gemma 3 27B.

Компания также утверждает, что модель дает ответы в два раза быстрее, чем модели Qwen3 и DeepSeek R1 Distil аналогичных размеров. Это объясняется более плотной токенизацией русского языка и ускорением генерации токенов большими языковыми моделями за счет использования дополнительной модели меньшего размера.

Затраты на разработку составили меньше 120 млн руб. В сумму включены расходы на вычислительные мощности для R&D и финального дообучения, а также зарплаты сотрудников.

«Т-Технологии» также опубликовала бенчмарк T-Math — это набор из 331 задачи российских математических олимпиад для старшеклассников. Приводятся результаты шести ИИ-моделей. T-Pro 2.0 занимает пятую строчку с результатом pass@1 0,54 (доля успешных решений с первой попытки — 54%).

Кроме этого «Т-Технологии» выпустили набор данных для контролируемой тонкой настройки (SFT) T-Wix. Он разделен на две группы: первый содержит 468,6 тыс. примеров и охватывает широкий спектр тем, второй — около 31 тыс. примеров и сосредоточен на сложных математических и научных задачах.

«Т-Технологии» выпустила первые большие языковые модели на 32 млрд параметров и на 7 млрд параметров T-Pro и T-Lite в 2024 году. По данным компании, ежемесячно их скачивают больше 15 тыс. раз.

Подробнее

Технологии:

#искусственный_интеллект #генеративный_ИИ #бенчмарк

Компании:

#Т_Технологии

Расскажите знакомым:

Материалы
по теме: