Publication: ФОРМИРОВАНИЕ РАЗМЕЧЕННОГО НАБОРА ДАННЫХ НА ОСНОВЕ СМОДЕЛИРОВАННЫХ КОМПЬЮТЕРНЫХ АТАК
| creativeworkseries.issn | 2074-7128 (Print) | |
| dc.contributor.author | Павлычев, А. В. | |
| dc.contributor.author | Кузьминец, К. В. | |
| dc.contributor.author | Бреус, Д. Е. | |
| dc.contributor.author | Шелупанов, А. А. | |
| dc.date.accessioned | 2026-06-02T14:41:05Z | |
| dc.date.available | 2026-06-02T14:41:05Z | |
| dc.date.issued | 2025 | |
| dc.description.abstract | В рамках работы предложен подход к созданию массива данных, необходимого для будущих систем машинного обучения искусственного интеллекта, предназначенных для противодействия компьютерным атакам. Авторами проведен краткий обзор современных способов выявления компьютерных атак, в том числе с помощью анализа лог-файлов операционной системы с применением методов машинного обучения. Рассмотрены различные подходы к моделированию атак и формированию наборов данных. Предложен алгоритм для формирования базы данных из записей системных журналов и соответствующих им компьютерных атаках и сценариях пользовательской работы, учитывающий различные подходы и лучшие практики. Для реализации алгоритма спроектирована и развернута виртуальная сетевая инфраструктура, предназначенная для автоматизированного извлечения файлов системных журналов операционной системы после запуска заранее подготовленных скриптов. В результате проведенного исследования сформулирован алгоритм моделирования компьютерных атак и формирования размеченного набора данных из системных журналов операционной системы. Согласно разработанному алгоритму в результате проведенной серии экспериментов получена база данных, которую можно использовать для обучения моделей машинного обучения и применения в современных интеллектуальных средствах защиты информации. Датасет, содержащий 1 473 559 записей, размещен на платформе Kaggle. Научная новизна заключается в доработке алгоритма моделирования компьютерных атак и формирования набора данных из системных журналов операционной системы, который в отличие от существующих подходов автоматизирует процесс сбора данных, что обеспечивает более полное покрытие тактик MITRE ATT&СК. Усовершенствованный алгоритм включает механизмы валидации выполнения скриптов и передачи метаданных, что повышает достоверность данных, получаемых в ходе выполнения скриптов и формирования датасета, в отличие от алгоритмов, не учитывающих данные аспекты. | |
| dc.description.uri | https://bit.spels.ru/index.php/bit/article/view/1858 | |
| dc.identifier.citation | Павлычев, Алексей В. и др. Формирование размеченного набора данных на основе смоделированных компьютерных атак. Безопасность информационных технологий, [S.l.], т. 32, № 4, с. 1–17, 2025. ISSN 2074-7136. URL: https://bit.spels.ru/index.php/bit/article/view/1858. DOI: http://dx.doi.org/10.26583/bit.2025.4.01. | |
| dc.identifier.doi | 10.26583/bit.2025.4.01 | |
| dc.identifier.uri | https://openrepository.mephi.ru/handle/123456789/42881 | |
| dc.publisher | НИЯУ МИФИ | |
| dc.subject | Набор данных | |
| dc.subject | Машинное обучение | |
| dc.subject | Системные журналы | |
| dc.subject | Тактики и техники | |
| dc.subject | Компьютерные атаки | |
| dc.subject | Алгоритм | |
| dc.title | ФОРМИРОВАНИЕ РАЗМЕЧЕННОГО НАБОРА ДАННЫХ НА ОСНОВЕ СМОДЕЛИРОВАННЫХ КОМПЬЮТЕРНЫХ АТАК | |
| dc.title.alternative | Научная Статья | |
| dc.type | Article | ru |
| dspace.entity.type | Publication | |
| journal.title | Безопасность информационных технологий | |
| journalvolume.identifier.name | Безопасность Информационных Технологий | |
| relation.isJournalIssueOfPublication | 6e2fcc35-b1cf-408e-bee8-f365b97d71d0 | |
| relation.isJournalIssueOfPublication.latestForDiscovery | 6e2fcc35-b1cf-408e-bee8-f365b97d71d0 | |
| relation.isJournalOfPublication | 3b9ae913-eaeb-4d29-a767-7f6ca8a0e066 |