Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
Tags
- 일론 머스크
- 인공지능
- Stable Diffusion
- ubuntu
- 다국어 지원
- OpenCV
- 확산 모델
- 생성형 AI
- AI 기술
- 오블완
- PYTHON
- 딥러닝
- ChatGPT
- 아두이노
- 티스토리챌린지
- 우분투
- AI
- 오픈소스
- 메타
- TRANSFORMER
- LORA
- 트랜스포머
- 시간적 일관성
- 오픈AI
- tts
- 강화 학습
- OpenAI
- 멀티모달
- 휴머노이드 로봇
- LLM
Archives
- Today
- Total
목록가변 길이 인코딩 (1)
AI 탐구노트

1. 서론현대 사회에서 실시간 음성 인식 기술은 빠르게 발전하고 있으며, 발표 중 실시간 자막 제공, 청각 장애인을 위한 접근성 도구, 스마트 기기 및 웨어러블의 음성 명령 처리 등 다양한 영역에서 필수적입니다. 그러나 이러한 기술이 저비용 하드웨어에서 원활히 작동하려면 높은 정확성과 낮은 지연 시간이 필요합니다. 특히, 인터넷 연결 없이 동작하는 장치에서는 연산 자원의 한계로 인해 더욱 도전적입니다. 최근 OpenAI의 Whisper는 일반적인 음성 인식 정확도를 크게 향상시켰으나, 고정된 길이의 입력을 요구하여 저지연 환경에서는 한계가 있었습니다. 이에 대한 해결책으로 소개된 Moonshine은 Whisper의 장점을 유지하면서도 실시간 처리에 최적화된 모델입니다. 이 글에서는 Moonshine의 구..
AI 기술
2024. 11. 17. 10:07