Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- AI
- 오블완
- 메타
- 멀티모달
- AI 기술
- LLM
- 아두이노
- 트랜스포머
- 티스토리챌린지
- 서보모터
- javascript
- tts
- 뉴럴링크
- ControlNet
- 확산 모델
- 시간적 일관성
- 인공지능
- 이미지 편집
- PYTHON
- OpenAI
- ChatGPT
- 우분투
- LORA
- 가상환경
- 생성형 AI
- TRANSFORMER
- ubuntu
- 일론 머스크
- 딥마인드
- 오픈AI
Archives
- Today
- Total
AI 탐구노트
MagicTime : 타임랩스 영상을 생성하는 모델 본문
시간이 지남에 따라 변화하는 비디오 (타임랩스 영상)를 생성하는 모델
MagicTime은 시간이 지남에 따라 변화하는 비디오 (타임랩스 영상)를 생성하는 모델입니다.
별의 움직임이나 밀물과 썰물 현상, 꽃의 개화나 나비의 우화 과정 등을 담기 위해 카메라 혹은 카메라 보조장치에서 제공하는 타임랩스 기능을 이용하는 경우가 많이 있는데 그런 영상을 만들어 주는 모델이라고 보면 됩니다.
기존의 영상 생성 모델들이 물리적인 지식이 반영되지 못해 움직임이 제한되고 다양성이 부족했던 것에 반해 MagicTime은 그런 부분들을 해결하고 있습니다. 제대로 된 영상 하나를 생성하기 위해 많은 시간과 노력, 시행착오가 필요했던 분야였는데... 물론 실제 느낌이 어느 정도까지 나올지는 모르겠지만 그런 작업들을 대체할 수 있는 기술이 나왔다는 것이 놀랍습니다.
이를 위해 MagicTime에서는 아래와 같은 기술요소를 도입했다고 합니다.
- MagicAdapter Plan : 공간적, 시간적 훈련을 분리하고, 영상에서 더 많은 물리적 지식을 인코딩하고 사전 훈련된 텍스트를 이용하여 메타모픽 영상을 생성하도록 텍스트-비디오 모델을 변환
- 동적 프레임 추출 (Dynamic Frame Extraction) 전략 : 보다 폭넓은 변화 범위와 급격한 물체의 변형 과정을 다뤄 일반 비디오보다 더 많은 물리적 지식을 포함하게 함
- Magic Text-Encoder : 메타모픽 비디오 프롬프트에 대한 이해를 향상시킴
- ChronoMagic : 특별히 큐레이팅된 타임랩스 비디오-텍스트 데이터셋
'AI 기술' 카테고리의 다른 글
DWPose : 전신 자세 예측 모델 (3) | 2024.08.23 |
---|---|
AudioCraft : 음악 생성 도구 (0) | 2024.08.23 |
Phi-3 : 성능 좋은 경량 언어모델 (0) | 2024.08.22 |
ScreenAI : 사용자 UI와 인포그래픽을 이해하는 비전 언어 모델 (0) | 2024.08.22 |
Surya : 90여개 다국어를 지원하는 OCR 툴킷 (0) | 2024.08.21 |