Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 오픈AI
- 아두이노
- 시간적 일관성
- ubuntu
- 우분투
- 가상환경
- LORA
- ControlNet
- 생성형 AI
- TRANSFORMER
- AI
- 뉴럴링크
- 확산 모델
- PYTHON
- tts
- OpenAI
- javascript
- 일론 머스크
- 멀티모달
- 딥마인드
- ChatGPT
- 트랜스포머
- 인공지능
- AI 기술
- 메타
- 서보모터
- 티스토리챌린지
- LLM
- 이미지 편집
- 오블완
Archives
- Today
- Total
목록자막 생성 (1)
AI 탐구노트
Voice-Pro : 음성 관련 통합 서비스를 제공하는 오픈소스 웹 솔루션
Voice-Pro는 AI 기반 음성 인식, 번역, 자막 생성, 보컬 제거 등을 통합 제공하는 그라디오 웹 UI 솔루션입니다. Voice-Pro가 제공하는 주요 기능은 다음과 같습니다. YouTube 동영상 다운로드 및 오디오 변환보컬 제거 및 잡음 제거다국어 자막 생성 및 번역 (100개 이상의 언어 지원)음성 합성(TTS) 기능으로 다국어 음성 생성실시간 음성 인식 및 번역배치 처리를 통해 대용량 파일 처리사용자 맞춤형 TTS 속도, 음량, 음정 조절MIT 라이선스 위에 소개한 기능들을 보면 오디오, 특히 음성 오디오 처리에서 꼭 필요하다 싶은 것들을 다 나열하고 있는 것 같습니다. 어떻게 이런 기능들을 다 구현했을까 의아했는데 뒤에 설명된 내용을 보고 고개를 끄덕일 수 있었습니다. 이미 있는..
AI 기술
2024. 10. 7. 21:32