WEIRD на ICT.Moscow

WEIRD

Датасет

Описание:

Выложенный в открытый доступ синтетический датасет WEIRD призван помочь в оценке способности моделей ИИ находить нарушающие здравый смысл, т. е. противоречащие реальности, изображения.

В качестве основы создатели WEIRD использовали изображения датасета WHOOPS!. С помощью модели OpenAI GPT-4o на основании картинок исходного датасета были сгенерированы новые подписи, после чего к ним посредством модели DALL-E были созданы соответствующие изображения.

Получившийся датасет содержит 400 пар нормальных и нарушающих здравый смысл изображений. Каждой из них присвоен один из десяти промптов, требующих от модели определить, нарушается ли в изображении здравый смысл.

Датасет WEIRD был представлен исследователями из Института AIRI и «Сколтеха» в октябре 2025 года. Развернутая версия датасета интегрирована в бенчмарк MERA.

👤 Василий Коновалов

👤 Елисей Рыков

Тематика:

#датасеты

Технологии:

#искусственный_интеллект #генеративный_ИИ #нейросети #машинное_обучение #open_source

Разработчик:

#AIRI #Сколтех

Проект запущен:

2025

Контакты:

Сайт:

Страница на Hugging Face

Последнее обновление:14.10.2025

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.

Редакция:
hello@ict.moscow

Сотрудничество:
partners@ict.moscow

Политика конфиденциальности Пользовательское соглашение