logo DataProcessingFramework

DataProcessingFramework

Фреймворк для обработки мультимодальных данных

Описание:

Выложенный в открытый доступ фреймворк DataProcessingFramework позволяет провести предварительную обработку больших датасетов для генеративных (создающих в частности изображения и видео) моделей искусственного интеллекта (в том числе и мультимодальных): отфильтровать данные, изменить их, добавить метаданные (сгенерировать описание), перевести наборы данных в другой формат и валидировать их.

Функционал DataProcessingFramework содержит фильтры для видео, изображений, различных комбинаций этих модальностей, а также интерфейс к ним. При этом, подчеркивают разработчики, код всех фильтров един. Среди основных сущностей фреймворка можно выделить Processor (объект, инкапсулирующий в себя датасет и все методы для взаимодействия с данными), Filter, Transforms (позволяет изменить сами данные, в частности кадровую частоту видео или размер изображений) и Pipelines (позволяет объединить несколько фильтров и трансформаций, выполняет логирование всех этапов и обрабатывает непредвиденные ошибки).

Фреймворк был представлен Лабораторией искусственного интеллекта «Сбера» в мае 2024 года.


👤 Игорь Павлов


logo DataProcessingFramework
Проект запущен:
2024
Последнее обновление:21.01.2025
Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.



Если не указано иное, материалы доступны по лицензии Creative Commons BY 4.0