Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
| 29 | 30 | 31 |
Tags
- 이미지 편집
- AI
- 우분투
- 감정 표현
- 확산 모델
- 티스토리챌린지
- 인공지능
- 멀티모달
- 음성 인식
- tts
- 트랜스포머
- 음성합성
- 일론 머스크
- 메타
- PYTHON
- 이미지 생성
- AI 기술
- 오블완
- 강화학습
- gaussian splatting
- 생성형AI
- OpenAI
- 자동화
- 딥러닝
- ChatGPT
- XAI
- 오픈AI
- 오픈소스
- LLM
- 바이브코딩
Archives
- Today
- Total
목록Music Codec (1)
AI 탐구노트
요즘 AI로 노래까지 만들 수 있다는 말이 자연스럽게 들립니다. 이미지나 글 생성이 대중화된 뒤, 이제는 보컬이 들어간 완성형 곡을 텍스트로 만들려는 시도가 빠르게 늘었죠. 하지만 막상 결과물을 들어보면 음질은 괜찮은데 보컬과 반주가 따로 노는 느낌이 나거나, 반대로 곡의 흐름은 좋은데 소리가 뭉개지는 경우가 많습니다. 연구자들은 그 어긋남이 어디서 생기는지에 집중했습니다. 노래는 멜로디·리듬·템포 같은 큰 흐름과, 보컬 발음·악기 질감 같은 디테일이 동시에 맞아야 합니다. 게다가 학습 데이터는 품질이 들쭉날쭉하고, 가사/장르/분위기 같은 설명도 정확하지 않은 경우가 많습니다. 결국 모델이 ‘사람이 듣기 좋은 음악’과 ‘지시를 잘 따르는 음악’을 동시에 배우기 어렵다는 거죠. 이 문제를 풀기 위해 LeV..
AI 기술
2026. 1. 4. 16:23
