일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 생성형 AI
- TRANSFORMER
- OpenCV
- 휴머노이드 로봇
- 이미지 생성
- 메타
- AI
- 티스토리챌린지
- tts
- 딥러닝
- 확산 모델
- 인공지능
- OpenAI
- 오블완
- 다국어 지원
- 실시간 렌더링
- LORA
- 멀티모달
- 우분투
- 일론 머스크
- 강화 학습
- 트랜스포머
- 시간적 일관성
- LLM
- 오픈AI
- PYTHON
- ChatGPT
- 아두이노
- 오픈소스
- AI 기술
- Today
- Total
목록ROPE (2)
AI 탐구노트

1. 서론현대 사회에서 실시간 음성 인식 기술은 빠르게 발전하고 있으며, 발표 중 실시간 자막 제공, 청각 장애인을 위한 접근성 도구, 스마트 기기 및 웨어러블의 음성 명령 처리 등 다양한 영역에서 필수적입니다. 그러나 이러한 기술이 저비용 하드웨어에서 원활히 작동하려면 높은 정확성과 낮은 지연 시간이 필요합니다. 특히, 인터넷 연결 없이 동작하는 장치에서는 연산 자원의 한계로 인해 더욱 도전적입니다. 최근 OpenAI의 Whisper는 일반적인 음성 인식 정확도를 크게 향상시켰으나, 고정된 길이의 입력을 요구하여 저지연 환경에서는 한계가 있었습니다. 이에 대한 해결책으로 소개된 Moonshine은 Whisper의 장점을 유지하면서도 실시간 처리에 최적화된 모델입니다. 이 글에서는 Moonshine의 구..

Mochi 1은 Genmo라는 곳에서 만든 SOTA 오픈소스 비디오 생성 모델로 지시어에 충실한 모션과 영상 재현을 특징으로 하고 있습니다. Mochi 1는 일본어로 찹쌀떡이죠. 흠... AI 모델에 동물이름을 주로 사용하는가 싶었는데 이제는 음식이름도 등장하네요. ^^Genmo라는 곳은 소개에 따르면 전직 구글러들이 창업한 곳이라고 하며 아직은 소수에 펀딩과 채용을 진행 중이라고 합니다. Mochi 1의 특징 1.라이선스 정책Mochi 1의 가장 큰 특징으로 꼽으라면 Apache 2.0 라이선스를 따른다는 것입니다. 개인 및 기업이 상업적으로 사용할 수 있게 풀어놓은 것이죠. 흠... 이 정도 고품질 영상을 만들어 낼 수 있는 모델을 이렇게 푼 사례가 언제 있었더라... 개인 크리에이터 입장에선 복 ..