logo DeathMath

DeathMath

Бенчмарк для больших языковых моделей

Описание:

Выложенный в открытый доступ бенчмарк поможет протестировать и оценить способность больших языковых моделей решать задачи по математике и физике.

DeathMath позволяет проанализировать понимание моделью физических концепций, сравнить производительность разных решений на русскоязычном контенте и оценить улучшение их способностей решать научные задачи.

Бенчмарк был представлен командой Vikhr Models в апреле 2025 года.


Репозиторий на GitHub


👤 Илья Кулешов


logo DeathMath
Проект запущен:
2025
Последнее обновление:12.05.2025
Материалы о разработчике
Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.