Publication:
Применение инструментов компьютерного зрения PyTorch3D и NERF для построения облака точек трехмерной модели и определения положения камеры фотоснимков в пространстве

Научные группы
Организационные подразделения
Организационная единица
Институт ядерной физики и технологий
Цель ИЯФиТ и стратегия развития - создание и развитие научно-образовательного центра мирового уровня в области ядерной физики и технологий, радиационного материаловедения, физики элементарных частиц, астрофизики и космофизики.
Выпуск журнала
Выпуск журнала
Научная визуализация
2025-17 - 1
Аннотация
В последнее время компьютерная графика играет ключевую роль в решении задач компьютерного зрения. Проблема преобразования 2D изображений в 3D модели продолжает оставаться актуальной, так как требует точного определения положения камеры и построения точных трёхмерных моделей объектов. Традиционные методы зачастую ограничены в применении и не предлагают комплексного решения. В данном исследовании рассматривается использование библиотек PyTorch3D и NERF для определения положения камеры в 3D пространстве и создания трёхмерной модели объекта по одному 2D изображению. В качестве метода подготовки данных был использован аппаратно-программный комплекс, включающий устройство для управления шаговым двигателем, обеспечивающее ручное и последовательное позиционирование камеры и её возврат в исходное положение, систему управления съёмкой для формирования комплексного набора фотоснимков на каждой позиции камеры, и механизм отправки данных на удалённый компьютер для дальнейшей обработки. В ходе исследования была выбрана библиотека PyTorch3D для изучения возможностей преобразования 2D изображений в 3D модели или определения положения объекта на фотоснимках. Процесс обработки включал в себя несколько шагов: построение облака точек для генерации объёмной 3D модели объекта, определение положения камеры в 3D пространстве по одному 2D изображению с использованием алгоритмов обратной задачи, а также построение 3D объекта с помощью дифференцируемой отрисовки, создание 3D вокселей и 3D мешей. Результаты исследования показали успешное определение положения камеры в 3D пространстве и построение трёхмерной модели объекта по одному 2D изображению, что демонстрирует преимущества использования библиотеки PyTorch3D по сравнению с другими существующими моделями. Эти данные могут быть применены в разработке программных и аппаратных систем для создания трёхмерных изображений на основе 2D фотографий. Исследование подтвердило актуальность и эффективность применения библиотеки PyTorch3D для решения задач преобразования 2D изображений в 3D модели. В дальнейшем работа будет направлена на расширение функциональных возможностей системы и её использование в различных областях компьютерного зрения.
Описание
Ключевые слова
3D-реконструкция , Глубокое обучение , Облако точек , Позиционирование камеры , 3D-моделирование , NERF , PyTorch3D , Компьютерное зрение , Дифференцированный рендеринг
Цитирование
В.В. Коньков, А.Б. Замчалов. Применение инструментов компьютерного зрения PyTorch3D и NERF для построения облака точек трехмерной модели и определения положения камеры фотоснимков в пространстве (2025). Научная визуализация 17.1: 65 - 85, DOI: 10.26583/sv.17.1.06
Коллекции