Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
| 29 | 30 | 31 |
Tags
- XAI
- 음성 인식
- PYTHON
- 음성합성
- AI
- 트랜스포머
- 이미지 생성
- 딥러닝
- LLM
- 오픈소스
- 감정 표현
- 티스토리챌린지
- 메타
- 생성형AI
- 우분투
- 바이브코딩
- 멀티모달
- 오블완
- 오픈AI
- 일론 머스크
- 인공지능
- gaussian splatting
- ChatGPT
- OpenAI
- 확산 모델
- AI 기술
- 강화학습
- 이미지 편집
- 자동화
- tts
Archives
- Today
- Total
목록Paper2Video (1)
AI 탐구노트
학회에 논문을 내면 요즘 거의 필수로 따라오는 게 있습니다. 바로 2~10분짜리 발표 영상입니다. 슬라이드 만들고, 대본 쓰고, 여러 번 다시 찍어서 편집까지 하면 짧은 영상 하나를 만드는데도 상당한 시간이 소요됩니다. 연구자는 연구도 바쁜데, 영상 제작까지 전문가처럼 하기는 쉽지 않죠. (유튜브에 올라오는 영상 가운데는 발표자는 없고, 목소리만 혹은 그것도 AI를 이용해서 만든 것도 있었던 것 같습니다)최근엔 텍스트에서 바로 영상을 만들어주는 생성형 AI가 빠르게 발전하고 있습니다. 하지만 일반적인 영상과 달리 학술 발표 영상은 구조가 훨씬 복잡합니다. 논문 전체를 이해해야 하고, 슬라이드, 자막, 음성, 발표자의 얼굴, 마우스 커서가 서로 딱 맞게 움직여야 합니다. Paper2Video 데이터셋과 멀..
AI 기술
2025. 12. 1. 11:11
