Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 가상환경
- 시간적 일관성
- 트랜스포머
- 멀티모달
- 생성형 AI
- 인공지능
- AI 기술
- 오픈AI
- LLM
- 아두이노
- 딥마인드
- 티스토리챌린지
- ControlNet
- tts
- 이미지 편집
- TRANSFORMER
- ubuntu
- 뉴럴링크
- ChatGPT
- AI
- OpenAI
- 우분투
- 오블완
- 메타
- PYTHON
- 확산 모델
- 일론 머스크
- LORA
- javascript
- 서보모터
Archives
- Today
- Total
목록referencenet (1)
AI 탐구노트
EMO : 오디오 기반 초상화 비디오 생성
알리바바 그룹이 공개한 오디오 기반 초상화(portrait) 비디오 생성 프레임워크 EMO (Emote Portrait Alive)는 알리바바 그룹이 공개한 오디오 기반 초상화(portrait) 비디오 생성 프레임워크입니다. 참조 이미지 한장과 보컬 오디오 클립을 입력하면 오디오가 입혀진, 그것도 입모양과 안면 움직임 등이 자연스럽게 반영된 비디오 영상을 생성하는데, 250시간 이상의 영상과 1억 5천만 개 이상의 이미지를 학습 데이터셋으로 사용했다고 합니다. 공개된 데모 영상이 너무 자연스러워서 깃헙 게시판에는 실행 코드를 공개하기 전까지는 못 믿겠다는 반응도 일부 있었습니다. ^^; 이 경우처럼, 모델 공개 때 깃헙 링크를 함께 공개하면서 실행코드가 없는 경우들을 가끔 볼 수 있죠. 하지만 대부분 언..
AI 기술
2024. 8. 28. 09:55