

Мультиагентная система для извлечения данных
Мультиагентная система (МАС) nanoMINER может применяться для извлечения экспериментальных параметров наноматериалов из текстов, графиков и таблиц научных статей.
МАС состоит из трех ИИ-агентов. Работающий на основе подхода ReAct агент-оркестратор на базе модели OpenAI GPT-4o управляет текстовым (для выполнения задачи NER — Named Entity Recognition, распознавания именных сущностей) и визуальным (для обработки графиков и таблиц) агентами. В основе первого лежат модели Mistral 7B и Llama 3, второго — модели YOLOv8 и GPT-4o.

С помощью инструментов Pdfplumber и Pytesseract система извлекает необходимые текст и изображения. Первый разбивается на сегменты по 2048 токенов, из которых текстовый ИИ-агент извлекает необходимые параметры. Визуальный агент обрабатывает графики и таблицы для восстановления структурной логики статьи.
Кроме того, система может предсказывать по химической формуле тип кристаллической решетки молекулы, даже если он не указан в статье. По заявлениям разработчиков, точность предсказания составляет 86%.
Система nanoMINER была представлена исследователями из МГУ им. М.В. Ломоносова и Университета ИТМО на конференции ICLR (International Conference on Learning Representations) в апреле 2025 года. Доступна как открытое ПО.
Статья в журнале Npj Computational Materials

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности
ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.