Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
Tags
- 인공지능
- PYTHON
- tts
- OpenAI
- 강화학습
- 음성합성
- 이미지 편집
- gaussian splatting
- 생성형AI
- 자동화
- 오픈AI
- 바이브코딩
- ChatGPT
- LLM
- 오블완
- 감정 표현
- XAI
- 확산 모델
- AI 기술
- 트랜스포머
- 멀티모달
- 메타
- AI
- 음성 인식
- 이미지 생성
- 티스토리챌린지
- 일론 머스크
- 딥러닝
- 우분투
- 오픈소스
Archives
- Today
- Total
목록function calling (1)
AI 탐구노트
Voxtral 이란? 지난 몇 년간 OpenAI의 Whisper는 오픈소스 음성 인식 분야에서 사실상 챔피언이었습니다. 복잡한 발음이나 다양한 억양을 높은 정확도로 인식하며, 많은 개발자와 연구자, 심지어 유튜브 자막 제작자까지 폭넓게 활용해왔습니다. 그리고 상당 수의 오픈소스 기반 ASR (음성인식) 솔루션이 이것을 이용하기도 했습니다. 하지만 Whisper는 어디까지나 ‘전사(transcribe)’에 강한 모델이었습니다. 즉, 말을 글로 옮기는 일에는 탁월했지만, 그 ‘의미’를 이해하지는 못했습니다. 이제 새로운 주자가 등장했습니다. Mistral AI의 Voxtral, 그것도 오픈소스로요! 😍 Whisper의 강력한 대안이면서, 진정한 차세대 음성 AI의 기준점으로 등장한 이 기술은, 전사에서 멈..
AI 관련 소식
2025. 7. 16. 17:41
