| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
| 29 | 30 | 31 |
- 생성형AI
- OpenAI
- 오픈AI
- gaussian splatting
- 확산 모델
- 음성합성
- 트랜스포머
- 자동화
- 인공지능
- 우분투
- 이미지 편집
- 감정 표현
- LLM
- 일론 머스크
- ChatGPT
- 음성 인식
- AI
- 오블완
- 딥러닝
- 바이브코딩
- PYTHON
- 티스토리챌린지
- tts
- 강화학습
- 메타
- 오픈소스
- 멀티모달
- AI 기술
- 이미지 생성
- XAI
- Today
- Total
목록VR (2)
AI 탐구노트
자연스러운 3D 세계를 한 장의 이미지나 짧은 텍스트에서 바로 펼쳐 보이는 능력은 공간지능의 핵심입니다. 최근 생성형 비디오 모델이 장면의 다양한 관점을 만들어내는 데 강점을 보이며, 자율주행 시뮬레이션이나 로보틱스·VR 같은 응용에서 활용되고 있죠. 하지만 대부분의 기법은 좁은 시야의 투영 이미지를 중심으로 동작하여, 카메라를 크게 돌리거나 이동하면 경계가 깨지고 몰입감이 떨어지는 문제가 있었습니다. 이 한계를 넘어설 수 있는 새로운 발상은 '처음부터 수평 360도 / 수직 180도를 모두 담는 파노라마'를 중간 표현으로 삼는 것입니다. Matrix-3D는 바로 이 선택을 통해, 조건부 비디오 생성과 파노라마 3D 재구성을 결합하여 어디로든(상하좌우 전방위) 탐사 가능한 3D 세계를 만들어냅니다. ..
최근 3D 기술이 발전하면서, 사진 몇 장만으로도 새로운 시점을 만들어내는 기술이 주목받고 있습니다. 특히, 뉴럴 레디언스 필드(NeRF)와 3D 가우시안 스플래팅(3DGS) 같은 방법이 많이 사용됩니다. NeRF는 장면을 신경망으로 학습하여 새로운 시점을 만들어내는 기술이고, 3DGS는 수많은 가우시안 점을 배치하여 장면을 표현하는 방식입니다. 3DGS는 NeRF보다 빠르게 장면을 생성할 수 있다는 장점이 있어 최근 많은 연구가 진행되고 있습니다. 하지만, 기존의 방법들은 보통 여러 장의 사진이 있어야만 정확한 3D 장면을 만들 수 있습니다. 만약 사진이 몇 장밖에 없다면, 보이지 않는 부분을 제대로 채우지 못해 장면이 엉성하게 복원되거나, 보이지 않는 부분을 자연스럽게 채우는 것이 어렵습니다. 이런 ..
