Publication:
ФОРМИРОВАНИЕ РАЗМЕЧЕННОГО НАБОРА ДАННЫХ НА ОСНОВЕ СМОДЕЛИРОВАННЫХ КОМПЬЮТЕРНЫХ АТАК

creativeworkseries.issn 2074-7128 (Print)
dc.contributor.authorПавлычев, А. В.
dc.contributor.authorКузьминец, К. В.
dc.contributor.authorБреус, Д. Е.
dc.contributor.authorШелупанов, А. А.
dc.date.accessioned2026-06-02T14:41:05Z
dc.date.available2026-06-02T14:41:05Z
dc.date.issued2025
dc.description.abstractВ рамках работы предложен подход к созданию массива данных, необходимого для будущих систем машинного обучения искусственного интеллекта, предназначенных для противодействия компьютерным атакам. Авторами проведен краткий обзор современных способов выявления компьютерных атак, в том числе с помощью анализа лог-файлов операционной системы с применением методов машинного обучения. Рассмотрены различные подходы к моделированию атак и формированию наборов данных. Предложен алгоритм для формирования базы данных из записей системных журналов и соответствующих им компьютерных атаках и сценариях пользовательской работы, учитывающий различные подходы и лучшие практики. Для реализации алгоритма спроектирована и развернута виртуальная сетевая инфраструктура, предназначенная для автоматизированного извлечения файлов системных журналов операционной системы после запуска заранее подготовленных скриптов. В результате проведенного исследования сформулирован алгоритм моделирования компьютерных атак и формирования размеченного набора данных из системных журналов операционной системы. Согласно разработанному алгоритму в результате проведенной серии экспериментов получена база данных, которую можно использовать для обучения моделей машинного обучения и применения в современных интеллектуальных средствах защиты информации. Датасет, содержащий 1 473 559 записей, размещен на платформе Kaggle. Научная новизна заключается в доработке алгоритма моделирования компьютерных атак и формирования набора данных из системных журналов операционной системы, который в отличие от существующих подходов автоматизирует процесс сбора данных, что обеспечивает более полное покрытие тактик MITRE ATT&СК. Усовершенствованный алгоритм включает механизмы валидации выполнения скриптов и передачи метаданных, что повышает достоверность данных, получаемых в ходе выполнения скриптов и формирования датасета, в отличие от алгоритмов, не учитывающих данные аспекты.
dc.description.urihttps://bit.spels.ru/index.php/bit/article/view/1858
dc.identifier.citationПавлычев, Алексей В. и др. Формирование размеченного набора данных на основе смоделированных компьютерных атак. Безопасность информационных технологий, [S.l.], т. 32, № 4, с. 1–17, 2025. ISSN 2074-7136. URL: https://bit.spels.ru/index.php/bit/article/view/1858. DOI: http://dx.doi.org/10.26583/bit.2025.4.01.
dc.identifier.doi10.26583/bit.2025.4.01
dc.identifier.urihttps://openrepository.mephi.ru/handle/123456789/42881
dc.publisherНИЯУ МИФИ
dc.subjectНабор данных
dc.subjectМашинное обучение
dc.subjectСистемные журналы
dc.subjectТактики и техники
dc.subjectКомпьютерные атаки
dc.subjectАлгоритм
dc.titleФОРМИРОВАНИЕ РАЗМЕЧЕННОГО НАБОРА ДАННЫХ НА ОСНОВЕ СМОДЕЛИРОВАННЫХ КОМПЬЮТЕРНЫХ АТАК
dc.title.alternativeНаучная Статья
dc.typeArticleru
dspace.entity.typePublication
journal.titleБезопасность информационных технологий
journalvolume.identifier.nameБезопасность Информационных Технологий
relation.isJournalIssueOfPublication6e2fcc35-b1cf-408e-bee8-f365b97d71d0
relation.isJournalIssueOfPublication.latestForDiscovery6e2fcc35-b1cf-408e-bee8-f365b97d71d0
relation.isJournalOfPublication3b9ae913-eaeb-4d29-a767-7f6ca8a0e066
Файлы
Original bundle
Теперь показываю 1 - 1 из 1
Загружается...
Уменьшенное изображение
Name:
1858-3121-1-PB.pdf
Size:
881.04 KB
Format:
Adobe Portable Document Format
Description:
License bundle
Теперь показываю 1 - 1 из 1
Загружается...
Уменьшенное изображение
Name:
license.txt
Size:
3.45 KB
Format:
Item-specific license agreed to upon submission
Description:
Коллекции