일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 멀티모달
- javascript
- 생성형 AI
- OpenAI
- ChatGPT
- PYTHON
- 오블완
- 아두이노
- tts
- LORA
- 뉴럴링크
- 일론 머스크
- ubuntu
- AI
- 서보모터
- ControlNet
- AI 기술
- 확산 모델
- 우분투
- 인공지능
- 시간적 일관성
- 가상환경
- TRANSFORMER
- 딥마인드
- 이미지 편집
- 오픈AI
- LLM
- 메타
- 티스토리챌린지
- 트랜스포머
- Today
- Total
AI 탐구노트
OmniRe : 동적 객체 포함된 도시 장면 재구성 프레임워크 본문
다양한 동적 객체를 포함한 고해상도 도시 장면 재구성을 위한 통합 3DGS 프레임워크
OmniRe는 다양한 동적 객체를 포함한 고해상도 도시 장면을 효율적으로 재구성하는 통합적인 3DGS(3D Gaussian Splatting) 프레임워크입니다.
기존의 도로 주행 장면 재구성 방법들은 주로 차량에만 초점을 맞추고, 보행자 및 자전거 이용자와 같은 비차량 동적 객체를 간과하여 장면 재구성의 완성도를 떨어뜨렸습니다. 이는 특히 복잡한 도시 환경에서 다양한 객체와 동작을 정확히 모델링하는 데 어려움을 야기했습니다.
OmniRe는 Gaussian 표현에 기반한 동적 신경 장면 그래프를 사용하여, 차량뿐만 아니라 보행자, 자전거 이용자 등 다양한 동적 객체를 포괄적으로 재구성합니다. 이를 위해 각 객체의 동적 움직임을 표현하기 위한 로컬 기준 공간을 구성하여 정확한 재구성과 실시간 시뮬레이션이 가능하도록 하였습니다.
OmniRe 모델의 특징은 다음과 같습니다.
- 다양한 동적 객체 재구성
차량, 보행자, 자전거 이용자 등 다양한 동적 객체를 각각의 로컬 기준 공간에서 모델링합니다. - 실시간 시뮬레이션 가능
재구성된 장면에서 모든 객체가 실시간으로 (~60 Hz) 시뮬레이션에 참여할 수 있습니다. - 높은 정확도
Waymo 데이터셋에서 기존 방법들보다 정성적, 정량적으로 뛰어난 성능을 보였습니다. 특히 동적 객체인 보행자와 차량에서 큰 성능 향상을 달성했습니다.
OmniRe의 주요 아키텍처는 다양한 동적 객체를 효과적으로 처리할 수 있도록 설계된 Gaussian Scene Graph입니다. 이 그래프는 다음과 장면에서 하늘을 표현하는 '하늘노드', 건물이나 도로 등 정적 배경을 표현하는 '배경노드', 차량 등의 강체 객체를 표현하는 '강체노드', 보행자나 자전거 이용자 등 비강체 객체를 표현하는 '비강체 노드'로 구성됩니다. 각 객체는 각자의 로컬 공간에서 모델링되며, 이들은 시간의 흐름에 따라 변형되거나 이동됩니다. 그리고나서 이들은 세계 좌표계로 변환되어 하나의 장면을 구성하게 되는데 이후 실시간 렌더링 및 전체 장면 재구성과 움직임의 정확한 조정 등의 최적화가 이뤄집니다.
'AI 기술' 카테고리의 다른 글
Qwen2-VL : 이미지와 영상, 다국어 지원을 잘 하는 비전 언어 모델 (0) | 2024.09.08 |
---|---|
LayerPano3D : 3D 파노라마 장면을 생성하는 프레임워크 (0) | 2024.09.08 |
ComA : 3D 객체의 포괄적인 인간-객체 상호작용을 학습하는 방법 (0) | 2024.09.07 |
칼로 (Karlo) 2.0 : 카카오의 이미지 생성 모델 (1) | 2024.09.07 |
WhisperX : 긴 오디오, 단어 수준 지원 음성 인식 시스템 (0) | 2024.09.06 |