50
По вашему мнению, каких наборов данных (датасетов) в первую очередь не хватает в открытом доступе для создания новых и доработки существующих ИИ-решений и сервисов? (можно выбрать несколько вариантов)
- 18%медицинских данных для систем принятий врачебных решений и eHealth-приложений
- 6%данных для обучения биометрических систем
- 7%датасетов для обучения беспилотных автомобилей
- 16%ГИС и urban-данных (пешеходные потоки, посещаемость парков, перемещения городского транспорта, пр.)
- 10%наборов аудио и текстовых данных на русском языке
- 2%наборов аудио и текстовых данных на иностранных языках
- 17%обезличенных городских данных из разных сфер (ЖКХ, городские услуги, контакт-центры, пр.)
- 0%других данных (напишу в @ict_moscow_chat)
- 14%ничего из перечисленного: под каждый проект нужно собирать датасет с учетом его специфики
- 5%данных достаточно, их нехватка — уже не проблема для разработчиков