일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 오픈AI
- 티스토리챌린지
- 확산 모델
- 강화 학습
- 실시간 렌더링
- 코딩
- PYTHON
- 오픈소스
- 메타
- 딥러닝
- 우분투
- 시간적 일관성
- 오블완
- ubuntu
- Stable Diffusion
- 일론 머스크
- 3d 재구성
- 생성형 AI
- AI 기술
- AI
- tts
- 트랜스포머
- 생성형AI
- LLM
- LORA
- OpenCV
- 휴머노이드 로봇
- OpenAI
- 인공지능
- 다국어 지원
- Today
- Total
목록단일 이미지 (4)
AI 탐구노트

현대 사회에서 메타버스와 같은 가상 공간은 점점 더 중요한 산업으로 자리잡고 있습니다. 특히 증강현실(AR), 가상현실(VR), 게임, 영화 산업에서는 현실과 유사한 인간 아바타를 빠르게 생성하고 이를 애니메이션화하는 기술이 핵심입니다. 과거에는 이와 같은 작업을 위해 다각도의 촬영, 정밀한 센서, 오랜 후처리 시간이 필요했지만, 최근 AI 기술의 급속한 발전은 단 한 장의 이미지로 3D 아바타를 생성하려는 시도를 가능하게 만들고 있습니다. 하지만 단일 이미지로 3D 아바타를 생성하는 것은 여전히 큰 도전입니다. 사람의 형태, 옷의 주름, 얼굴의 정밀한 표정까지 재현하려면 높은 수준의 공간적 추론과 표현력이 필요하기 때문입니다. LHM(Large Animatable Human Reconstruction ..

3D 장면 생성 기술은 가상 현실(VR), 게임, 건축 및 로봇 공학 등 다양한 분야에서 중요한 역할을 합니다. 특히, 단일 이미지에서 3D 장면을 추론하는 기술은 한정된 입력 정보로부터 공간적 관계를 재구성해야 하는 어려움이 있습니다. 기존의 방법들은 대체로 3D 모델을 데이터베이스에서 검색하는 방식이나, 개별 객체를 하나씩 생성하여 조합하는 방식으로 발전해왔습니다. 하지만 이러한 기존 방식들은 다음과 같은 문제를 갖고 있습니다.재구성 방식 : 신경망을 이용하여 3D 장면을 직접 복원하지만, 학습 데이터가 부족하면 일반화 성능이 떨어짐검색 기반 방식 : 기존 3D 모델을 검색하여 결합하지만, 적절한 모델을 찾기가 어렵고 정확한 정렬이 어려움다단계 객체 생성 방식 : 객체별로 개별적인 생성 과정을 거쳐야..

1. 서론 단일 이미지를 보고 그 안에 있는 물체와 환경의 3D 깊이를 알아내는 기술은 요즘 다양한 분야에서 중요한 역할을 하고 있습니다. 이 기술은 가상현실, 영화 제작, 게임 디자인뿐 아니라 자율 주행 차량, 로봇 공학 등에서도 활용됩니다. 하지만 이 기술을 제대로 구현하려면 기존에는 특정 데이터나 카메라 정보가 꼭 필요했기 때문에 일반적으로 사용하기 어려운 경우가 많았습니다. 이런 한계를 극복하기 위해 나온 모델이 Depth Pro입니다. Depth Pro는 이미지를 찍은 카메라의 정보 없이도 단일 이미지에서 정확하고 세밀한 깊이 정보를 빠르게 추출할 수 있습니다. 특히, 카메라 초점 거리 등의 메타데이터 없이도 2.25메가픽셀(약 200만 화소)의 고화질 깊이 맵을 단 0.3초 만에 생성할 수 있..

인공지능과 컴퓨터 비전의 발달은 단일 이미지로부터 3D 객체를 재구성하는 기술에 새로운 가능성을 열었습니다. 이 기술은 영화 제작, 증강현실(AR), 제조업 등 다양한 산업에서 활용될 수 있습니다. 하지만 단일 이미지 기반 3D 복원은 본질적으로 불완전한 문제입니다. 입력 이미지에서 보이는 표면 정보는 비교적 쉽게 추출되지만, 가려진 영역의 재구성을 위해서는 강력한 3D 사전 지식이 필요합니다. 최근의 연구는 회귀 기반 방법과 생성 모델 기반 방법으로 나뉩니다. 회귀 방식은 빠르게 가시적 표면을 복원하지만, 가려진 영역에서 불확실성을 처리하는 데 한계가 있습니다. 반면, 생성 모델은 이러한 불확실성을 더 잘 처리하지만 계산 비용이 크고 입력 이미지와의 정렬이 부족한 경우가 많습니다. 이러한 상황에서 SP..