Publication: МЕТОД УСТРАНЕНИЯ ИСКАЖЕНИЙ, ВСТРАИВАЕМЫХ ПИКСЕЛЬНЫМИ АТАКАМИ
Дата
2025
Авторы
Есипов, Д. А.
Сулименко, Н. С.
Попов, И. Ю.
Journal Title
Journal ISSN
Volume Title
Издатель
НИЯУ МИФИ
Аннотация
Искусственный интеллект получил широкое распространение за счет эффективности решения многих прикладных задач, в том числе обработки изображений. Однако с внедрением технологий искусственного интеллекта в информационных системах растет количество уязвимостей. Основные угрозы информационной безопасности могут быть реализованы посредством искажения входных изображений. Недостатком существующих методов защиты является привязка к набору данных или архитектуре нейронной сети. Целью текущей работы является расширение области применения устранения искажений, оптимизированных по L_0, а также уменьшение влияния указанных атак на отклик защищаемой модели. Предложен метод устранения возмущений, встраиваемых пиксельными атаками модификации изображений, поступающих в нейронные сети, посредством математических преобразований входных данных независимо от модели и набора данных. Восстановление модифицированных атакой пикселей изображения предполагает предварительное обнаружение внесенного искажения. Рассмотрены преобразования билинейная интерполяция, алгоритм Телеа и др. К искаженному пикселю применяется выбранное математическое преобразование и в его позицию записываются восстановленные значения цветовых компонент. Каждый модифицированный пиксель обрабатывается последовательно. Восстановленное изображение подается на вход защищаемой модели. Апробация метода выполнена на наборах данных CIFAR-10 и MNIST. Метод восстановления демонстрирует малое отличие между оригинальным и восстановленным пикселями, на изображениях наблюдается идентичный отклик. Следует отметить, что восстановление поведения модели зависит от качества самой модели. Предложенный метод применим для устранения искажений, характерных для однопиксельных атак и распределенных искажений (JSMA), однако не позволяет ликвидировать сосредоточенные искажения (вредоносный патч). Метод может быть применим для цветных изображений и изображений в оттенках серого независимо от набора данных и потенциально универсален к архитектуре нейронной сети.
Описание
Ключевые слова
Атака по карте значимости на основе Якобиана , Однопиксельная атака , Метрика L0 , Вредоносное возмущение , Состязательная атака , Обработка изображений , Искусственная нейронная сеть
Цитирование
Есипов, Дмитрий А.; Сулименко, Никита С.; Попов, Илья Ю. Метод устранения искажений, встраиваемых пиксельными атаками, [S.l.], т. 32, № 3, с. 13–25, 2025. ISSN 2074-7136. URL: https://bit.spels.ru/index.php/bit/article/view/1813. DOI: http://dx.doi.org/10.26583/bit.2025.3.02