Publication:
Применение методов текст майнинга для анализа корпуса текстов Федеральных норм и правил в области использовании атомной энергии

Дата
2023
Авторы
Генералов, М. В.
Journal Title
Journal ISSN
Volume Title
Издатель
Научные группы
Организационные подразделения
Выпуск журнала
Аннотация
В работе рассмотрены способы применения алгоритмов интеллектуального анализа текстов Text Mining для нормативной документации атомной отрасли. На первом этапе происходит анализ предметной области, определение требований для модуля выявления и сравнения требований и осуществляется описание предварительной подготовки документации для применения методов Text Mining. На втором этапе, рассматриваются и выбираются подходящие методы интеллектуального анализа текста для выполнения поставленной задачи, а именно, методы извлечения информации и методы нечеткого сравнения текстов. Далее, анализируются библиотеки для обработки естественного языка, которые будут использоваться при разработке модуля. После этого, разрабатывается программный модуль для выявления и сравнения требований и проводится его тестирование. Для разработки используется язык программирования Python и библиотека spaCy для обработки естественного языка с применением встроенных в нее русскоязычных моделей. Целью работы является выявление требований из текстов нормативной документации, а именно из федеральных норм и правил в атомной отрасли и дальнейшая проверка других текстов на соответствии выявленным требованиям.
Описание
Уровень образования: магистратура; Код направления/специальности: 09.04.02; Группа: М21-Ш04
Ключевые слова
ВКР , Выпускная квалификационная работа
Цитирование
Генералов, М. В. Применение методов текст майнинга для анализа корпуса текстов Федеральных норм и правил в области использовании атомной энергии : Выпускная квалификационная работа, магистратура, 09.04.02 / М. В. Генералов ; рук. работы Андриенко Ю.А., 2023