Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
| 29 | 30 | 31 |
Tags
- tts
- 멀티모달
- PYTHON
- 자동화
- 일론 머스크
- ChatGPT
- 이미지 생성
- 강화학습
- 인공지능
- 오픈소스
- LLM
- 감정 표현
- 메타
- AI 기술
- 딥러닝
- 음성 인식
- 우분투
- OpenAI
- 이미지 편집
- 트랜스포머
- 티스토리챌린지
- 오블완
- 음성합성
- gaussian splatting
- XAI
- 확산 모델
- AI
- 바이브코딩
- 오픈AI
- 생성형AI
Archives
- Today
- Total
목록Voice-Pro (1)
AI 탐구노트
최근 ASR, TTS 모델들을 이용해 몇 가지 샘플 콘텐츠를 만들었었습니다. 그런데 이들 각각을 위한 환경 구성이 제각각 다른 경우들이 있어서 손이 많이 가고 통합적으로 관리하기 힘들어 불편하다고 느꼈었습니다. 그러다 우연히 X에 올라온 글에 Voice-Pro라는, 앞서의 문제를 올인원으로 패키징한 도구가 있어서 소개하려고 합니다. 비록 직접 설치해서 사용하진 않지만 그래도 미리 알았더라면 하는 아쉬움에 간단히 기록을 해 두고 넘어가겠습니다. Voice-Pro 1) 개요Gradio 기반 WebUI 형태의 올인원 음성/자막/더빙 제작 도구유튜브 다운로드 → 음성 분리 → 음성 인식(STT) → 번역 → 음성 합성(TTS)/보이스 클로닝까지 한 흐름으로 묶어 크리에이터/개발자/다국어 작업자용 워크플로를 제..
AI 기술
2026. 1. 25. 12:03
