
Большая языковая модель
Выложенная в общий доступ модель T-Pro выпущена в размере 32,8 млрд параметров. Построенную на базе модели семейства Qwen-2.5 с помощью технологии продолженного предобучения (Continual Pretraining), ее специально адаптировали для работы на русском языке и выполнения определенных задач. Обучение происходило в формате BF16 на четырех графических процессорах NVIDIA H100. Разработчики дообучали модель на русскоязычных данных из Common Crawl, текстах книг, коде и проприетарных датасетах. На всех этапах обучения базовая длина контекста составляла 8 тыс. токенов.
Модель можно тонко настроить под выполнение требуемых бизнес-задач и/или использовать в режиме промптинга — применения для конкретных задач с помощью подробных инструкций. Разработчики предупреждают, что T-Pro не предназначена для использования в качестве готового голосового ИИ-ассистента. Также они рекомендуют применять метод генерации с дополненной выборкой (RAG) и тонкую настройку при создании продуктов на основе модели.
T-Pro была представлена группой компаний «Т-Технологии» в декабре 2024 года.
В июле 2025 года была выпущена новая версия модели — T-Pro 2.0, дообученная на основе нейросети Qwen3. Для тонкой настройки с учителем (Supervised Fine-Tuning, SFT) использовался датасет T-Wix из более чем 500 тыс. промптов.
Разработчики расширили кириллическую часть токенизатора китайской модели более чем в пять раз, что позволило повысить его эффективность для русского языка на 30%. Кроме того, по их заявлениям, это помогло ускорить инференс модели.
Новый гибридный режим рассуждений позволил T-Pro 2.0 генерировать ответы более высокого качества, в два раза уменьшить требуемый для генерации ответов объем вычислительных ресурсов, а также решать более сложные аналитические задачи.
Репозиторий T-Pro 1.0 на Hugging Face
Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности
ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.