'FSQ' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2026/03 »
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록FSQ (1)

AI 탐구노트

VoxCPM : 토크나이저 없이 더 자연스러운 문맥형 음성 생성 및 복제

요즘 음성 AI는 단순히 말을 읽어 주는 기계가 아니라 사람처럼 말하는 파트너로 기대치가 바뀌고 있습니다. 같은 문장이라도 뉴스처럼 또박또박, 친구처럼 가볍게, 혹은 위로하듯 천천히 말하는 게 다르니까요. 그래서 최근 TTS(Text-to-Speech)는 발음 정확도 뿐 아니라 감정, 억양, 분위기 같은 표현력이 더 중요해졌습니다. 하지만 표현력을 높이려다 보면 시스템이 불안정해지는 문제가 자주 생깁니다. 특히 기존 방식은 음성을 잘게 쪼개 토큰으로 만든 뒤이를 예측하는 구조가 대부분인데, 이 과정에서 미세한 음색·숨결 같은 디테일이 사라지기도 합니다. 반대로 토큰 없이 연속값(연속적인 음성 신호)을 직접 만들면 디테일은 살지만, 긴 문장에서 오류가 누적돼 말이 제대로 구성되지 않는 경우가 발생됩니다. ..

AI 기술 2026. 1. 22. 12:02

이전 Prev 1 Next 다음

목록FSQ (1)

AI 탐구노트

티스토리툴바