Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 트랜스포머
- 생성형 AI
- LLM
- AI 기술
- 인공지능
- ubuntu
- AI
- tts
- 딥러닝
- 메타
- 오픈AI
- 확산 모델
- OpenAI
- PYTHON
- 멀티모달
- TRANSFORMER
- 휴머노이드 로봇
- 서보모터
- 가상환경
- 티스토리챌린지
- 뉴럴링크
- LORA
- ChatGPT
- 아두이노
- 일론 머스크
- 딥마인드
- 시간적 일관성
- 오블완
- ControlNet
- 우분투
Archives
- Today
- Total
목록portraitvideogeneration (1)
AI 탐구노트
Loopy : 오디오 입력으로 초상화 아바타 영상 생성 모델
오디오 입력만으로 자연스러운 초상화 아바타 영상을 생성하는 오디오 기반 영상 합성 모델 Loopy는 오디오 입력만으로 자연스러운 초상화 아바타 영상을 생성하는 새로운 오디오 기반 영상 합성 모델입니다. 기존 오디오 기반 초상화 영상 합성 방법들은 자연스럽지 않은 움직임을 보이거나, 머리 움직임과 표정을 제한하는 공간적 조건(예: 얼굴 위치나 속도 등)을 추가하여 제한된 움직임을 만들어내는데 이는 움직임의 자유로움과 다양성이 떨어지는 결과를 만듭니다. Loopy는 오디오 신호만으로 영상을 생성하며, 공간적 템플릿 없이도 자연스러운 움직임을 학습합니다. 이를 위해 긴 시간의 모션 의존성을 학습할 수 있는 inter-clip 및 intra-clip 시간적 모듈을 도입하고, 오디오 정보를 잠재공간(latent..
AI 기술
2024. 9. 8. 15:21