logo T-lite

T-lite

Большая языковая модель

Описание:

Выложенная в открытый доступ большая языковая модель T-lite предназначена для разработки на ее основе русскоязычных приложений, которые не предполагают передачи данных третьим лицам. Это, к примеру, ассистенты поддержки, инструменты для анализа и обобщения больших объемов текста, интеллектуальные поисковые системы.

Входящая в семейство специализированных языковых моделей GEN-T T-lite была представлена Центром искусственного интеллекта Т-Банка в июле 2024 года. Она выпущена в размере 8 миллиардов параметров. Обучение происходило в формате BF16 на 96 видеокартах NVIDIA A100.

На бенчмарках MERA, ru-MT-Bench и RuArenaGeneral T-lite превзошла такие зарубежные большие языковые модели, как Llama 3 и ChatGPT-3.5. По заявлениям разработчиков, после дообучения для конкретных задач модель показывала качество работы, сопоставимое с проприетарными моделями размером от 20 млрд параметров.

Разработчики не рекомендуют использовать T-lite в качестве готового помощника и советуют дообучать ее для конкретных целей.


Инструктивная версия модели

Базовая версия модели


👤Анатолий Потапов


logo T-lite
Проект запущен:
2024
Сайт:
Последнее обновление:15.11.2024
Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.



Если не указано иное, материалы доступны по лицензии Creative Commons BY 4.0