Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
| 29 | 30 | 31 |
Tags
- 메타
- 일론 머스크
- AI 기술
- 딥러닝
- 이미지 편집
- ChatGPT
- 이미지 생성
- OpenAI
- XAI
- 음성 인식
- 오블완
- AI
- 우분투
- 음성합성
- 강화학습
- 트랜스포머
- tts
- 티스토리챌린지
- 자동화
- 감정 표현
- LLM
- 바이브코딩
- gaussian splatting
- PYTHON
- 확산 모델
- 생성형AI
- 멀티모달
- 인공지능
- 오픈소스
- 오픈AI
Archives
- Today
- Total
목록HeartCodec (1)
AI 탐구노트
요즘 생성형 AI는 '텍스트를 이미지로', '텍스트를 영상으로'처럼 영역을 빠르게 넓혀왔습니다. 음악도 예외가 아니죠. 그런데 음악은 문장보다 훨씬 복잡합니다. 멜로디, 리듬, 악기, 보컬, 그리고 곡의 구조(인트로-벌스-후렴)가 동시에 맞아떨어져야 그제서야 제대로 노래처럼 들립니다. 그래서 막상 만들어보면, 분위기는 맞는데 곡이 길게 이어지지 않거나, 보컬과 반주가 서로 방해하는 경우가 많습니다. 또 하나의 현실적인 벽은 재현 가능성입니다. 상용 서비스는 결과가 좋아도 내부가 공개되지 않는 경우가 많고, 연구용 모델도 데이터나 파이프라인이 닫혀 있으면 따라 해보기가 어렵습니다. HeartMuLa는 그런 문제에 대해 음악-텍스트 정렬, 가사 인식, 음악 토큰화, 그리고 조건부 음악 생성까지를 한 덩어리로..
AI 기술
2026. 1. 27. 14:51
