일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 3d 재구성
- 오픈AI
- 확산 모델
- 코딩
- 일론 머스크
- PYTHON
- 트랜스포머
- LLM
- OpenCV
- 오픈소스
- 시간적 일관성
- 티스토리챌린지
- 딥러닝
- XAI
- 우분투
- 인공지능
- ubuntu
- 실시간 렌더링
- AI 기술
- tts
- ai 챗봇
- OpenAI
- AI
- 메타
- 다국어 지원
- ChatGPT
- LORA
- 휴머노이드 로봇
- 강화 학습
- 오블완
- Today
- Total
목록websocket (2)
AI 탐구노트

최근 인공지능 기술의 발전과 함께 실시간 음성 및 영상 처리에 대한 수요가 급격히 증가하고 있습니다. 다양한 산업 분야에서 실시간 데이터 처리는 사용자 경험을 향상시키고, 보다 즉각적인 피드백을 제공하는 데 중요한 역할을 합니다. 그러나 이러한 실시간 애플리케이션을 구축하는 것은 여전히 많은 개발자들에게 도전 과제로 남아 있습니다. 특히, 머신러닝 엔지니어들은 WebRTC와 같은 실시간 통신 기술에 대한 경험이 부족한 경우가 많으며 Python에서 실시간 오디오/비디오 애플리케이션을 지원하는 코드를 작성하는 데 어려움을 겪을 수 있습니다. 이러한 문제를 해결하기 위해, Python 개발자들이 손쉽게 실시간 오디오 및 비디오 AI 애플리케이션을 구축할 수 있도록 설계된 라이브러리인 FastRTC가 등장하였..

배경 최근 아이폰을 사용하다보니 시리가 예전 대비해서는 많이 좋아졌다는 느낌을 받게 되었습니다. 제대로 말귀를 못 알아듣던 녀석이었는데 오호라... 하지만, 아직도 구글 어시스턴트나 ChatGPT와 같은 다른 서비스에 비하면 영 멀었다는 생각이 드는 건 어쩔 수 없습니다. 최근 나오는 ASR (Auto Speech Recognition) 혹은 STT (Speech to Text) 기능을 이용하면 실시간 번역 혹은 통역이 가능할 것 같고, 최신 휴대전화에는 온디바이스 AI 기능으로 이런 것이 소개되기도 합니다. 장비 자체의 연산 자원의 제약으로 아주 훌륭한 통번역은 좀 더 지나야 나올 수 있을 것 같긴 하지만, 그래도 간단한 문장들은 쉽게 처리해 주고 있어 언치(언어치 -_-;)인 저한테는 큰 기대가 되..