Ученые AIRI, МФТИ и «Сколтеха» совместно с зарубежными исследователями разработали метод выявления сгенерированных ИИ текстов

23 июля, 15:50|

201

Международная группа ученых представила подход к распознаванию текстов, созданных ИИ, с использованием разреженных автокодировщиков (Sparse Autoencoders, SAE). Новый метод позволяет определять, на основании чего материал считается сгенерированным. В работе также приняли участие сотрудники исследовательского центра Huawei и французского Universite Paris Cite.

Для исследования ученые давали нейросети Gemma-2-2B примеры текстов и сохраняли внутренние состояния с глубоких слоев модели для каждого текста. С помощью SAE из этих внутренних состояний были выявлены тысячи «атомарных» признаков. Исследователи обучили на этих признаках классификатор для распознавания сгенерированных текстов, а также провели интерпретацию признаков в терминах, понятных человеку.

Ученые выявили универсальные признаки, которые характерны для многих ИИ-моделей, и специфические, которые присущи отдельным семействам ИИ или определенным типам текста. Например, в текстах на научные темы нейросети используют излишне сложные синтаксические конструкции, а в текстах на финансовую тематику — необоснованные многословные рассуждения о простых фактах.

Новый подход позволяет также обнаруживать некоторые попытки скрыть факт генерации текста: добавление лишних пробелов, артиклей или нестандартных символов с целью запутать детекторы. Человек может проверить, почему детектор посчитал текст сгенерированным.

Ученые предполагают, что новый метод создает основу для разработки более интерпретируемых детекторов: они будут не только признавать текст сгенерированным, но и давать пояснения, какие признаки были выявлены. В будущем исследователи планируют применить подход к более мощным языковым моделям, а также изучить более сложные признаки.

Подробнее

Технологии:

#искусственный_интеллект #нейросети #генеративный_ИИ

Компании:

#МФТИ #AIRI #Сколтех #Huawei

Расскажите знакомым:

Материалы
по теме:

15:55

Нейросеть GigaChat сдала экзамены в РАНХиГС по направлениям «Экономика и финансы» и «Финансовая грамотность»

Сбербанк

15:22

В Москве с 2026 года начнется эксперимент по применению ИИ для выявления нарушений в благоустройстве

Ведомости

14:33

«Сбер» представил ИИ-помощников для пользователей и бизнеса

Коммерсант

12:01

AppSec Solutions разработал SCA-анализатор AppSec.Track для проверки сгенерированного кода

AppSec Solutions

16 дек. 12:56

Москва разрабатывает подход для оптимизации градостроительного развития с помощью ИИ и цифровых двойников

mos.ru

смотреть еще

Главное про цифровые технологии в Москве

Нажимая на кнопку, вы соглашаетесь с политикой конфиденциальности

Что такое ICT.Moscow?

ICT.Moscow — открытая площадка о цифровых технологиях в Москве. Мы создаем наиболее полную картину развития рынка технологий в городе и за его пределами, помогаем бизнесу следить за главными трендами, не упускать возможности и находить новых партнеров.

Редакция:
hello@ict.moscow

Сотрудничество:
partners@ict.moscow

Политика конфиденциальности Пользовательское соглашение