27
📖Почитать на выходных: о создании метрик для оценки генеративных моделей
Руководитель службы аналитики и исследований в «Яндексе» Ирина Барская в материале на «Хабре» рассказала о том, существует ли универсальный метод оценки работы LLM-моделей.
Также она затронула тему бенчмарков и объяснила, почему нельзя полагаться только на них и может ли одна модель правильно оценить другую.
👉🏻 Читать материал
***
📎 Лонгрид ICT.Moscow о тенденциях в разработке бенчмарков для моделей ИИ в России.
ОригиналРуководитель службы аналитики и исследований в «Яндексе» Ирина Барская в материале на «Хабре» рассказала о том, существует ли универсальный метод оценки работы LLM-моделей.
Также она затронула тему бенчмарков и объяснила, почему нельзя полагаться только на них и может ли одна модель правильно оценить другую.
👉🏻 Читать материал
***
📎 Лонгрид ICT.Moscow о тенденциях в разработке бенчмарков для моделей ИИ в России.