Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- javascript
- OpenAI
- LORA
- 딥마인드
- ubuntu
- 멀티모달
- 뉴럴링크
- 메타
- 일론 머스크
- 가상환경
- 생성형 AI
- 서보모터
- tts
- LLM
- 오픈AI
- 우분투
- 이미지 편집
- PYTHON
- 트랜스포머
- 인공지능
- ControlNet
- AI
- 티스토리챌린지
- AI 기술
- TRANSFORMER
- 확산 모델
- 시간적 일관성
- 오블완
- ChatGPT
- 아두이노
Archives
- Today
- Total
목록portraitvideogeneration (1)
AI 탐구노트
Loopy : 오디오 입력으로 초상화 아바타 영상 생성 모델
오디오 입력만으로 자연스러운 초상화 아바타 영상을 생성하는 오디오 기반 영상 합성 모델 Loopy는 오디오 입력만으로 자연스러운 초상화 아바타 영상을 생성하는 새로운 오디오 기반 영상 합성 모델입니다. 기존 오디오 기반 초상화 영상 합성 방법들은 자연스럽지 않은 움직임을 보이거나, 머리 움직임과 표정을 제한하는 공간적 조건(예: 얼굴 위치나 속도 등)을 추가하여 제한된 움직임을 만들어내는데 이는 움직임의 자유로움과 다양성이 떨어지는 결과를 만듭니다. Loopy는 오디오 신호만으로 영상을 생성하며, 공간적 템플릿 없이도 자연스러운 움직임을 학습합니다. 이를 위해 긴 시간의 모션 의존성을 학습할 수 있는 inter-clip 및 intra-clip 시간적 모듈을 도입하고, 오디오 정보를 잠재공간(latent..
AI 기술
2024. 9. 8. 15:21