logo T-Math

T-Math

Бенчмарк для LLM

Описание:

T-Math предназначен для оценки рассуждающих способностей LLM в области математики.

Он содержит 331 задачу Всероссийской олимпиады школьников и Московской олимпиады школьников по математике, проходивших в период с 1998 по 2025 год.

Все задачи были выделены из PDF-файлов с помощью моделей Qwen-VL и вручную проверены оценщиками на соответствие источнику. Среди них были отобраны задания высокой сложности, ответы на которые должны быть представлены в числовом выражении.

Бенчмарк T-Math презентован группой компаний «Т-Технологии» в июле 2025 года. Доступен как открытое ПО.


Репозиторий на Hugging Face


👤 Данил Таранец


Участвует в спецпроектах ICT.Moscow:
logo T-Math
Проект запущен:
2025
Последнее обновление:17.11.2025
Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.