logo nanoMINER

nanoMINER

Мультиагентная система для извлечения данных

Описание:

Мультиагентная система (МАС) nanoMINER может применяться для извлечения экспериментальных параметров наноматериалов из текстов, графиков и таблиц научных статей.

МАС состоит из трех ИИ-агентов. Работающий на основе подхода ReAct агент-оркестратор на базе модели OpenAI GPT-4o управляет текстовым (для выполнения задачи NER — Named Entity Recognition, распознавания именных сущностей) и визуальным (для обработки графиков и таблиц) агентами. В основе первого лежат модели Mistral 7B и Llama 3, второго — модели YOLOv8 и GPT-4o.

С помощью инструментов Pdfplumber и Pytesseract система извлекает необходимые текст и изображения. Первый разбивается на сегменты по 2048 токенов, из которых текстовый ИИ-агент извлекает необходимые параметры. Визуальный агент обрабатывает графики и таблицы для восстановления структурной логики статьи.

Кроме того, система может предсказывать по химической формуле тип кристаллической решетки молекулы, даже если он не указан в статье. По заявлениям разработчиков, точность предсказания составляет 86%.

Система nanoMINER была представлена исследователями из МГУ им. М.В. Ломоносова и Университета ИТМО на конференции ICLR (International Conference on Learning Representations) в апреле 2025 года. Доступна как открытое ПО.


Репозиторий на GitHub

Статья в журнале Npj Computational Materials


👤 Карина Романова

👤 Сабина Мирзаева

👤 Олег Загорулько

👤 Юлия Разливина


Участвует в спецпроектах ICT.Moscow:
logo nanoMINER
Проект запущен:
2025
Последнее обновление:13.11.2025
Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.