Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- LLM
- tts
- 시간적 일관성
- TRANSFORMER
- ubuntu
- 생성형 AI
- 오픈AI
- 아두이노
- OpenAI
- LORA
- 멀티모달
- 딥마인드
- 트랜스포머
- 오블완
- 메타
- ControlNet
- 확산 모델
- ChatGPT
- PYTHON
- 이미지 편집
- 뉴럴링크
- 인공지능
- 서보모터
- AI 기술
- AI
- 일론 머스크
- 가상환경
- 우분투
- javascript
- 티스토리챌린지
Archives
- Today
- Total
AI 탐구노트
TokenFlow : 시간적 일관성있는 자연스런 영상 생성 모델 본문
생성AI를 이용한 영상 편집에서의 시간적인 일관성 문제를 해결하는 기술
생성AI 모델을 이용해서 주어진 prompt나 입력 이미지에서 영상을 만들어내는 모델들이 속속 소개되고 있습니다. 이미지 생성에서 이제는 비디오 영상 생성으로 발전하고 있죠. 하지만 대부분 생성되는 비디오 영상은 각 프레임 별로 이전과 이후 간의 일관성이 보존되지 않는 경우가 많고 결과적으로 중간중간 튀어 버리거나 전혀 시간이 지나면서 점점 이전과는 전혀 다른 영상으로 바뀌게 되죠.
TokenFlow는 이렇게 생성AI를 이용한 영상 편집에서의 시간적인 일관성 문제를 해결하는 기술입니다. 즉, 입력 영상을 기반으로 주어진 텍스트 프롬프트를 적용해서 비디오 영상이 만들어질 때, 그 전의 다른 모델들 대비해서 훨씬 자연스런 영상을 얻을 수 있습니다. 게다가 별도의 추가 학습이나 미세조정이 필요치 않다는 장점도 있으며 기존의 Text2Image 방식들과 함께 이용될 수 있다고 합니다.
'AI 기술' 카테고리의 다른 글
InterTrack : 인간-객체 상호작용을 추적하는 방법 (0) | 2024.08.30 |
---|---|
CogVideoX : 길이가 긴 일관된 동영상 생성 모델 (0) | 2024.08.29 |
ProPainter : 비디오 영상에서 Inpainting을 제공하는 프레임워크 (0) | 2024.08.29 |
Pop2Piano : 피아노 연주용 미디 파일 생성 모델 (1) | 2024.08.29 |
TinyLlama : 저사양 장비에서 동작되는 소형 언어 모델 (sLM) (0) | 2024.08.29 |