Ученые Института искусственного интеллекта AIRI представили способ снижения числа ошибочных SQL-запросов, сгенерированных большими языковыми моделями. Для этого используется внешний классификатор и оценка калиброванности.
Исследователи провели тесты с несколькими LLM, в том числе с DAIL-SQL, T5 и Llama 3 (разработка Meta, которая признана экстремистской и запрещена в России). Большие языковые модели генерировали SQL-запросы для сотрудников больницы при работе с внутренней базой данных. LLM были обучены на двух наборах данных и после этого выдавали примерно 30% ошибочных SQL-запросов.
Утверждается, что новый подход позволяет отсеять до 90% ошибочных запросов. Внешний классификатор работает как автоматический фильтр: он принимает решения о выдаче запроса пользователю на основе оценки уверенности модели. Калиброванность оценки показывает, насколько уверенность модели соответствует ее реальному качеству при данном показателе уверенности.
«Мы показали, что ИИ-модели часто ошибаются в генерации запросов, но делают это уверенно, а вот когда вопрос не имеет ответа — колеблются. Поэтому внешний классификатор в качестве фильтра надежнее определяет именно такие «неотвечаемые» вопросы», — объяснила руководитель группы «Прикладное NLP» AIRI Елена Тутубалина.
Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности
ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.