Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- ControlNet
- tts
- ubuntu
- ChatGPT
- 생성형 AI
- AI
- 오픈AI
- 우분투
- 딥마인드
- OpenAI
- 딥러닝
- 메타
- PYTHON
- AI 기술
- 멀티모달
- LORA
- LLM
- 아두이노
- 인공지능
- 확산 모델
- 뉴럴링크
- 시간적 일관성
- 트랜스포머
- 가상환경
- 티스토리챌린지
- TRANSFORMER
- 휴머노이드 로봇
- 오블완
- 일론 머스크
- 서보모터
Archives
- Today
- Total
목록다중 뷰 일관성 (1)
AI 탐구노트
FiT3D : 3D 정보에 기반한 2D 모델 미세조정 기법
2D 이미지 모델의 성능을 향상시키기 위해 3D 정보에 기반한 미세조정 기법 FiT3D는 2D 비전 모델의 성능을 향상시키기 위해 3D 정보를 활용한 미세 조정 기법입니다. 대부분의 2D 비전 모델은 순수하게 2D 이미지 데이터로 학습되며 이로 인해 물체와 장면의 3D 구조를 제대로 이해하지 못합니다.즉, 다양한 각도에서 찍힌 이미지들 사이에서 공통된 정보를 잘 찾아내기 어렵고, 한 장의 이미지로는 물체나 장면의 정확한 모양을 파악하기 힘든 경우가 많죠. FiT3D 기법에서는, 먼저 2D 이미지 특징을 3D Gaussian 표현으로 변환해, 여러 뷰에서 일관된 3D 특징을 학습한 후, 이 3D 인지 특징을 활용하여 2D 비전 모델을 미세 조정(fine-tuning)합니다. 이렇게 생성된 3D 인지 ..
AI 기술
2024. 9. 30. 10:21