«Сколтех» и Институт органической химии имени Н.Д. Зелинского создали систему на основе машинного обучения для обработки больших объемов данных, полученных методом высокоразрешающей масс-спектрометрии (метод исследования и идентификации вещества). Ученые подчеркнули, что новый алгоритм значительно ускорил процесс поиска новых соединений, снизив затраты и повысив экологичность научных исследований.
За годы работы в лабораториях накапливаются терабайты данных, особенно во время проведения экспериментов с использованием высокоразрешающей масс-спектрометрии. Однако из-за трудностей ручной обработки информации, исследователи успевают изучить лишь малую ее часть. До 95% собранной информации остается вне поля зрения ученых, что ведет к упущению ценных научных открытий.
«Основу нашего подхода составляет уникальный алгоритм, который объединяет методы машинного обучения и анализ распределения сигналов в масс-спектрах. Это позволило существенно уменьшить число ложноположительных результатов при идентификации химических веществ. Алгоритм прошел проверку на исторических данных по реакции Мизороки-Хека и обнаружил не только известные, но и абсолютно новые химические превращения», — рассказал научный руководитель проекта Валентин Анаников.
Исследователи ожидают, что с помощью нового подхода возможно обрабатывать данные из разных направлений, помогая находить ранее неизвестные реакции, катализаторы и механизмы.
Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности
ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.