Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 딥마인드
- LLM
- ChatGPT
- 시간적 일관성
- 서보모터
- OpenAI
- 생성형 AI
- 휴머노이드 로봇
- AI
- tts
- LORA
- 트랜스포머
- 딥러닝
- 멀티모달
- ubuntu
- ControlNet
- TRANSFORMER
- PYTHON
- 뉴럴링크
- AI 기술
- 오픈AI
- 우분투
- 오블완
- 확산 모델
- 가상환경
- 인공지능
- 티스토리챌린지
- 메타
- 일론 머스크
- 아두이노
Archives
- Today
- Total
AI 탐구노트
Procigen : 인간-사물 상호작용 합성 데이터셋 본문
상호작용하는 사물과 인간 이미지가 있는 합성 인간-사물 상호작용 데이터셋
3D 인간-물체 상호작용을 재구성하는 것은 어려운 일입니다. 세상에 존재하는 다양한 물체들이 다 3D 상호작용 데이터셋 내에 존재하는 것은 아니고 상호작용 또한 모든 것을 다 포함하기는 힘들기 때문에 물체, 사람, 상호작용에 대한 일반화가 되어야 하기 때문입니다. 아무래도 많은 실제 데이터가 있다면 좋겠지만 그걸 캡처하고 데이터로 만드는 작업은 많은 비용이 들기 마련이죠.
ProciGen (Procedural Interaction Generation)은 21,000개의 다양한 사물과 상호작용하는 인간 이미지가 있는 합성 인간-사물 상호작용 데이터 세트입니다.
가능한 사람과 물체 간의 상호작용과 다양한 물체 변형을 갖는 데이터셋을 절차적으로 생성하고, 이 데이터를 사용해 현실적인 상호작용과 인간 및 물체 모양을 학습하는 이미지 조건부 확산 모델인 HDM(Hierachical Diffusion Model)을 훈련시킵니다.
핵심적인 아이디어는 3개의 네트워크를 통해 인간, 물체를 개별 모양 공간으로 학습하고 Cross Attention을 통해 상호 작용을 학습하는 것입니다. 이 방식을 이용하면 정의된 템플릿 없이 다양한 카메라 시점과 조명 조건, 폐색 중인 상태라도 인간과 물체를 재구성할 수 있다는 장점을 얻을 수 있다고 합니다.
'AI 기술' 카테고리의 다른 글
MusicHiFi : 모노 음원을 스테레오로, 저음질을 고음질로 변환 (0) | 2024.08.26 |
---|---|
MindEye2 : 뇌활동 분석해서 시각정보로 재구성하는 기술 (0) | 2024.08.25 |
StreamMultiDiffusion : 실시간 영역 기반 텍스트-이미지 생성 모델 (0) | 2024.08.25 |
LATTE3D : 텍스트-3D 생성 모델 (0) | 2024.08.24 |
Wear-Any-Way : 패션 가상 피팅 기술 (0) | 2024.08.24 |