

Датасет для обучения больших языковых моделей
Датасет Cultura-Ru-Edu состоит из 140 млн обучающих текстовых веб-материалов на русском языке, отобранных из набора данных CulturaX моделью-классификатором на основе модели USER.
Cultura-Ru-Edu опубликован разработчиками из лаборатории искусственного интеллекта VK Lab в ноябре 2024 года. Доступен как открытое ПО.
Датасет аннотаций, которые использовались для обучения классификатора
#искусственный_интеллект#генеративный_ИИ#нейросети#машинное_обучение#open_source
Разработчик:
Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности
ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.