Publication: Разработка методов автоматического рубрицирования на основе тезауруса
Дата
2016
Авторы
Ченкураев, Б. С.
Journal Title
Journal ISSN
Volume Title
Издатель
Аннотация
Целью выпускной квалификационной работы является разработка методов автоматической рубрикации на основе тезауруса. Задача рубрикации является актуальной в связи с тем, что в условиях постоянно увеличивающегося объема обрабатываемой и накапливаемой информации использование классификаторов-рубрикаторов позволяет ограничить поиск необходимой информации относительно небольшим подмножеством документов. Рассматриваются основные методы решения задачи рубрикации. Также был проведен обзор существующих весов признаков. Предложен способ «взвешивания» признаков (в рамках данной задачи признаками являются термины) на основе тезауруса. На основе потокового линейного классификатора и предложенного способа взвешивания признака был разработан метод рубрикации на основе тезауруса. Построена математическая модель этого метода. Разработано программное средство, реализующее предложенный метод. Проведены эксперименты по оценке алгоритма автоматической рубрикации для построенного линейного рубрикатора. Проведено обоснование экономической эффективности внедрения разработанного программного средства.
Описание
Уровень образования: бакалавриат; Код направления/специальности: 01.03.02; Группа: Р08-281
Ключевые слова
ВКР , Выпускная квалификационная работа
Цитирование
Ченкураев, Б. С. Разработка методов автоматического рубрицирования на основе тезауруса : Выпускная квалификационная работа, бакалавриат, 01.03.02 / Б. С. Ченкураев ; рук. работы Максимов Николай Вениаминович, 2016