일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 가상환경
- 우분투
- 딥마인드
- LORA
- 메타
- ChatGPT
- AI
- 이미지 편집
- TRANSFORMER
- 아두이노
- PYTHON
- 티스토리챌린지
- LLM
- 서보모터
- 생성형 AI
- 확산 모델
- 트랜스포머
- ubuntu
- AI 기술
- 오픈AI
- 뉴럴링크
- ControlNet
- 인공지능
- OpenAI
- 멀티모달
- 시간적 일관성
- javascript
- 일론 머스크
- 오블완
- tts
- Today
- Total
목록생성AI (2)
AI 탐구노트

이번에는 AudioCraft를 이용해서 효과음을 생성해 보려고 합니다.목표로 하는 것은 카운트다운에 사용될 초시계의 효과음을 만들어 보는 것입니다. 지난 번에 퀴즈 때문에 다운받은 것이 있긴 한데...마음에 드는 것은 다 유료 라이선스이고, 대충 기계음을 이용하니 영 듣기 거슬리고...고민하던 중에 AI로 만들기로 했습니다.지금은 DIY 시대니까요. ^^ 모델 및 도구 선택 제가 사용할 것은 Meta에서 공개한 AudioCraft라는 도구입니다.해당 모델은 이전에 소개글로 작성한 바가 있죠. AudioCraft : 음악 생성 도구AudioCraft는 메타에서 발표한 오디오, 음악 생성 도구입니다. 입력된 텍스트를 바탕으로 음악이나 효과음 등을 생성할 수 있죠. 얼마전에도 비슷한 게 발표되지 않았었..

생성AI를 이용한 영상 편집에서의 시간적인 일관성 문제를 해결하는 기술 생성AI 모델을 이용해서 주어진 prompt나 입력 이미지에서 영상을 만들어내는 모델들이 속속 소개되고 있습니다. 이미지 생성에서 이제는 비디오 영상 생성으로 발전하고 있죠. 하지만 대부분 생성되는 비디오 영상은 각 프레임 별로 이전과 이후 간의 일관성이 보존되지 않는 경우가 많고 결과적으로 중간중간 튀어 버리거나 전혀 시간이 지나면서 점점 이전과는 전혀 다른 영상으로 바뀌게 되죠. TokenFlow는 이렇게 생성AI를 이용한 영상 편집에서의 시간적인 일관성 문제를 해결하는 기술입니다. 즉, 입력 영상을 기반으로 주어진 텍스트 프롬프트를 적용해서 비디오 영상이 만들어질 때, 그 전의 다른 모델들 대비해서 훨씬 자연스런 영상을 얻을 수..