T-Pro на ICT.Moscow

T-Pro

Большая языковая модель

Описание:

Выложенная в общий доступ модель T-Pro выпущена в размере 32,8 млрд параметров. Построенную на базе модели семейства Qwen-2.5 с помощью технологии продолженного предобучения (Continual Pretraining), ее специально адаптировали для работы на русском языке и выполнения определенных задач. Обучение происходило в формате BF16 на четырех графических процессорах NVIDIA H100. Разработчики дообучали модель на русскоязычных данных из Common Crawl, текстах книг, коде и проприетарных датасетах. На всех этапах обучения базовая длина контекста составляла 8 тыс. токенов.

Модель можно тонко настроить под выполнение требуемых бизнес-задач и/или использовать в режиме промптинга — применения для конкретных задач с помощью подробных инструкций. Разработчики предупреждают, что T-Pro не предназначена для использования в качестве готового голосового ИИ-ассистента. Также они рекомендуют применять метод генерации с дополненной выборкой (RAG) и тонкую настройку при создании продуктов на основе модели.

T-Pro была представлена группой компаний «Т-Технологии» в декабре 2024 года.

Пост на Habr

👤 Анатолий Потапов

Технологии:

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source

Разработчик:

#Т_Технологии

Проект запущен:

2024

Контакты:

Сайт:

Страница на Hugging Face

417

Последнее обновление:14.01.2025

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.

Редакция:
hello@ict.moscow

Сотрудничество:
partners@ict.moscow

Политика конфиденциальности Пользовательское соглашение

Если не указано иное, материалы доступны по лицензии Creative Commons BY 4.0