Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- LORA
- TRANSFORMER
- AI 기술
- 우분투
- ubuntu
- 메타
- 딥마인드
- 티스토리챌린지
- 뉴럴링크
- OpenAI
- 인공지능
- AI
- 멀티모달
- 시간적 일관성
- LLM
- 서보모터
- ChatGPT
- 트랜스포머
- 일론 머스크
- javascript
- 생성형 AI
- ControlNet
- 이미지 편집
- 확산 모델
- 가상환경
- 아두이노
- PYTHON
- tts
- 오픈AI
- 오블완
Archives
- Today
- Total
AI 탐구노트
LayerPano3D : 3D 파노라마 장면을 생성하는 프레임워크 본문
텍스트 프롬프트로 3D 파노라마 장면을 생성하는 프레임워크
LayerPano3D는 텍스트 프롬프트를 통해 몰입감 높은 3D 파노라마 장면을 생성하는 새로운 프레임워크입니다.
기존 3D 장면 생성 방법은 연속적인 장면 확장 시 의미적 일관성이 떨어지거나, 복잡한 계층 구조를 제대로 처리하지 못하고 시야각의 제한을 받는 문제가 있었습니다.
LAYERPANO3D는 2D 파노라마를 여러 깊이 계층으로 분해하고, 각 계층에서 숨겨진 공간을 생성하여 복잡한 장면 구조를 처리합니다. 이 방식은 텍스트 지시 기반의 앵커 뷰 생성과 다층 3D 파노라마를 결합해 360도 전방위적 시야와 자유로운 탐색을 제공합니다.
LayerPano3 프레임워크의 특징은 다음과 같습니다.
- 텍스트 지시 앵커 뷰 생성
텍스트 프롬프트를 기반으로 4개의 앵커 뷰를 생성하여, 일관된 수평선과 고품질의 파노라마를 보장 - 다층 3D 파노라마
여러 깊이의 계층을 만들어 복잡한 장면의 계층 구조와 가려진 부분을 처리하고, 3D Gaussian으로 변환해 자유로운 탐색이 가능 - 전방위적 일관성
360도 시야각 내에서 일관된 모습과 몰입감 있는 탐색 경험을 제공 - 자동화된 파이프라인
특정 장면에 맞는 탐색 경로 없이도 자동으로 장면을 생성하여 사용자 친화적인 인터페이스를 제공
파이프라인은 다음의 3단계로 구성됩니다.
- 참조 파노라마 생성: 텍스트 프롬프트로 4개의 앵커 뷰를 생성하고, 이를 기반으로 360도 파노라마 이미지를 확장합니다.
- 다층 파노라마 구성: 생성된 참조 파노라마를 다양한 깊이의 계층으로 분해하고, 각 계층에서 가려진 영역을 복원합니다.
- 3D Gaussian 최적화: 다층 파노라마를 3D Gaussian으로 변환하여, 사용자가 자유롭게 3D 공간을 탐색할 수 있도록 장면을 최적화합니다.
'AI 기술' 카테고리의 다른 글
Loopy : 오디오 입력으로 초상화 아바타 영상 생성 모델 (0) | 2024.09.08 |
---|---|
Qwen2-VL : 이미지와 영상, 다국어 지원을 잘 하는 비전 언어 모델 (0) | 2024.09.08 |
OmniRe : 동적 객체 포함된 도시 장면 재구성 프레임워크 (0) | 2024.09.08 |
ComA : 3D 객체의 포괄적인 인간-객체 상호작용을 학습하는 방법 (0) | 2024.09.07 |
칼로 (Karlo) 2.0 : 카카오의 이미지 생성 모델 (1) | 2024.09.07 |