Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- PYTHON
- 아두이노
- 티스토리챌린지
- 확산 모델
- LORA
- 우분투
- 딥러닝
- ubuntu
- ControlNet
- 멀티모달
- tts
- 가상환경
- 생성형 AI
- 딥마인드
- ChatGPT
- 트랜스포머
- TRANSFORMER
- 일론 머스크
- 시간적 일관성
- OpenAI
- 뉴럴링크
- AI 기술
- 오픈AI
- 메타
- 오블완
- 인공지능
- AI
- LLM
- 휴머노이드 로봇
- 서보모터
Archives
- Today
- Total
목록오디오 to 비디오 (1)
AI 탐구노트
EMO : 오디오 기반 초상화 비디오 생성
알리바바 그룹이 공개한 오디오 기반 초상화(portrait) 비디오 생성 프레임워크 EMO (Emote Portrait Alive)는 알리바바 그룹이 공개한 오디오 기반 초상화(portrait) 비디오 생성 프레임워크입니다. 참조 이미지 한장과 보컬 오디오 클립을 입력하면 오디오가 입혀진, 그것도 입모양과 안면 움직임 등이 자연스럽게 반영된 비디오 영상을 생성하는데, 250시간 이상의 영상과 1억 5천만 개 이상의 이미지를 학습 데이터셋으로 사용했다고 합니다. 공개된 데모 영상이 너무 자연스러워서 깃헙 게시판에는 실행 코드를 공개하기 전까지는 못 믿겠다는 반응도 일부 있었습니다. ^^; 이 경우처럼, 모델 공개 때 깃헙 링크를 함께 공개하면서 실행코드가 없는 경우들을 가끔 볼 수 있죠. 하지만 대부분 언..
AI 기술
2024. 8. 28. 09:55