ГлавнаяЛента

Т-Технологии

Группа «Т-Технологии» открыла доступ к большим языковым моделям на русском языке

11 декабря 2024, 14:32|
30

Речь идет о модели T-Pro на 32 млрд параметров и обновленной T-Lite на 7 млрд параметров. Обе доступны под лицензией Apache 2.0.

T-Pro, как объясняют в компании, работает в двух режимах: ее можно дообучить (Fine-Tuning) под конкретные бизнес-задачи, а также использовать в режиме промптинга. Другая модель — T-Lite — была представлена еще в июле. Сейчас среди изменений в ней: адаптивность, способность модели лучше понимать контекст и создавать тексты с меньшим количеством ошибок и большей логической связностью.

Модели входят в семейство собственных специализированных языковых моделей компании — Gen-T. Они предназначены для решения конкретных узкоспециализированных задач.

Также в компании поясняют, что модели T-Lite и T-Pro основаны на базе моделей семейства Qwen-2.5 китайской Alibaba Group, но дообучены и адаптированы под русский язык. «Такой подход позволяет «Т-Технологиям» существенно сократить затраты на создание больших языковых моделей — на 80–90% по сравнению с компаниями, которые обучают их с нуля. При этом качество решений LLM-продуктов на русском языке превосходит решения, базирующиеся на открытых и проприетарных моделях от OpenAI, Google и Anthropic», — говорят там.


T-Pro и T-Lite на Hugging Face


Подробнее

Расскажите знакомым:

Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.



Если не указано иное, материалы доступны по лицензии Creative Commons BY 4.0