ENSURING SAFETY WHILE ENHANCING PERFORMANCE: ENCOURAGING REINFORCEMENT LEARNING BY ADDRESSING CONSTRAINTS AND UNCERTAINTY

Aghbolagh, M. A.

Publication:
ENSURING SAFETY WHILE ENHANCING PERFORMANCE: ENCOURAGING REINFORCEMENT LEARNING BY ADDRESSING CONSTRAINTS AND UNCERTAINTY

Файлы

1635-2501-2-PB.pdf(1.46 MB)

Дата

2024

Авторы

Aghbolagh, M. A.

Издатель

НИЯУ МИФИ

Выпуск журнала

Безопасности Информационных Технологий

2024-31 - 2

Аннотация

Striking a balance between safety and performance remains a critical concern, despite advancements in the field. To address this issue, a versatile framework named Safety Goes Along with Performance (SGAWP) is proposed, centered on off-policy algorithms grounded in value function optimization. SGAWP utilizes reinforcement learning to navigate the data space, emphasizing high task performance while addressing risks (such as undesirable states) by incorporating safety costs into the value function. By integrating uncertainty management and task performance constraints, SGAWP aims to achieve improved safety performance alongside respectable task performance. Moreover, SGAWP leverages curiosity-driven exploration to expand the data space and employs task policies to enhance safety policy performance. As a result, SGAWP enhances safety performance with minimal loss in task performance. Beyond its success in reinforcement learning, SGAWP holds promise for applications like autonomous driving, where safety is paramount. Through rigorous experimentation across various offpolicy algorithms, SGAWP demonstrates robust generalization and achieves its objectives effectively

Ключевые слова

Risk assessment , Exploration , Off-policy , Safe reinforcement learning constraint

Цитирование

AGHBOLAGH, Mohsen Abdollahzadeh. ENSURING SAFETY WHILE ENHANCING PERFORMANCE: ENCOURAGING REINFORCEMENT LEARNING BY ADDRESSING CONSTRAINTS AND UNCERTAINTY. IT Security (Russia), [S.l.], v. 31, no. 2, p. 90–110, 2024. ISSN 2074-7136. URL: https://bit.spels.ru/index.php/bit/article/view/1635. DOI: http://dx.doi.org/10.26583/bit.2024.2.06.

URI

https://openrepository.mephi.ru/handle/123456789/15495
https://bit.spels.ru/index.php/bit/article/view/1635
http://dx.doi.org/10.26583/bit.2024.2.06

Полная страница элемента

Publication:
ENSURING SAFETY WHILE ENHANCING PERFORMANCE: ENCOURAGING REINFORCEMENT LEARNING BY ADDRESSING CONSTRAINTS AND UNCERTAINTY

Файлы

Дата

Авторы

Journal Title

Journal ISSN

Volume Title

Издатель

Научные группы

Организационные подразделения

Выпуск журнала

Аннотация

Описание

Ключевые слова

Цитирование

URI

Коллекции

Publication: ENSURING SAFETY WHILE ENHANCING PERFORMANCE: ENCOURAGING REINFORCEMENT LEARNING BY ADDRESSING CONSTRAINTS AND UNCERTAINTY

Файлы

Дата

Авторы

Journal Title

Journal ISSN

Volume Title

Издатель

Научные группы

Организационные подразделения

Выпуск журнала

Аннотация

Описание

Ключевые слова

Цитирование

URI

Коллекции

Publication:
ENSURING SAFETY WHILE ENHANCING PERFORMANCE: ENCOURAGING REINFORCEMENT LEARNING BY ADDRESSING CONSTRAINTS AND UNCERTAINTY