LayerPano3D : 3D 파노라마 장면을 생성하는 프레임워크

Notice

Recent Posts

Tags more

Archives

관리 메뉴

AI 탐구노트

AI 기술

42morrow 2024. 9. 8. 12:12

텍스트 프롬프트로 3D 파노라마 장면을 생성하는 프레임워크

LayerPano3D는 텍스트 프롬프트를 통해 몰입감 높은 3D 파노라마 장면을 생성하는 새로운 프레임워크입니다.

기존 3D 장면 생성 방법은 연속적인 장면 확장 시 의미적 일관성이 떨어지거나, 복잡한 계층 구조를 제대로 처리하지 못하고 시야각의 제한을 받는 문제가 있었습니다.

LAYERPANO3D는 2D 파노라마를 여러 깊이 계층으로 분해하고, 각 계층에서 숨겨진 공간을 생성하여 복잡한 장면 구조를 처리합니다. 이 방식은 텍스트 지시 기반의 앵커 뷰 생성과 다층 3D 파노라마를 결합해 360도 전방위적 시야와 자유로운 탐색을 제공합니다.

LayerPano3 프레임워크의 특징은 다음과 같습니다.

텍스트 지시 앵커 뷰 생성
텍스트 프롬프트를 기반으로 4개의 앵커 뷰를 생성하여, 일관된 수평선과 고품질의 파노라마를 보장
다층 3D 파노라마
여러 깊이의 계층을 만들어 복잡한 장면의 계층 구조와 가려진 부분을 처리하고, 3D Gaussian으로 변환해 자유로운 탐색이 가능
전방위적 일관성
360도 시야각 내에서 일관된 모습과 몰입감 있는 탐색 경험을 제공
자동화된 파이프라인
특정 장면에 맞는 탐색 경로 없이도 자동으로 장면을 생성하여 사용자 친화적인 인터페이스를 제공

파이프라인은 다음의 3단계로 구성됩니다.

참조 파노라마 생성: 텍스트 프롬프트로 4개의 앵커 뷰를 생성하고, 이를 기반으로 360도 파노라마 이미지를 확장합니다.
다층 파노라마 구성: 생성된 참조 파노라마를 다양한 깊이의 계층으로 분해하고, 각 계층에서 가려진 영역을 복원합니다.
3D Gaussian 최적화: 다층 파노라마를 3D Gaussian으로 변환하여, 사용자가 자유롭게 3D 공간을 탐색할 수 있도록 장면을 최적화합니다.

Loopy : 오디오 입력으로 초상화 아바타 영상 생성 모델 (0)	2024.09.08
Qwen2-VL : 이미지와 영상, 다국어 지원을 잘 하는 비전 언어 모델 (0)	2024.09.08
OmniRe : 동적 객체 포함된 도시 장면 재구성 프레임워크 (0)	2024.09.08
ComA : 3D 객체의 포괄적인 인간-객체 상호작용을 학습하는 방법 (0)	2024.09.07
칼로 (Karlo) 2.0 : 카카오의 이미지 생성 모델 (1)	2024.09.07

'AI 기술' Related Articles

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`