• лента
  • кейсы
  • московские решения
  • аналитика рынка
  • ICT.moscow об ИИ
  • презентации
  • подписка
  • материалы по теме
logo T-Math

T-Math

Бенчмарк для LLM

Описание:

T-Math предназначен для оценки рассуждающих способностей LLM в области математики.

Он содержит 331 задачу Всероссийской олимпиады школьников и Московской олимпиады школьников по математике, проходивших в период с 1998 по 2025 год.

Все задачи были выделены из PDF-файлов с помощью моделей Qwen-VL и вручную проверены оценщиками на соответствие источнику. Среди них были отобраны задания высокой сложности, ответы на которые должны быть представлены в числовом выражении.

Бенчмарк T-Math презентован группой компаний «Т-Технологии» в июле 2025 года. Доступен как открытое ПО.


Репозиторий на Hugging Face


👤 Данил Таранец


Участвует в спецпроектах ICT.Moscow:
logo T-Math
Проект запущен:
2025
Контакты:

1923
Последнее обновление:17.11.2025
Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.