Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
| 29 | 30 | 31 |
Tags
- 이미지 생성
- 티스토리챌린지
- 인공지능
- 자동화
- XAI
- 메타
- 트랜스포머
- 확산 모델
- AI
- 우분투
- gaussian splatting
- 바이브코딩
- tts
- 오픈AI
- 음성합성
- PYTHON
- 딥러닝
- 멀티모달
- 생성형AI
- 오픈소스
- LLM
- 음성 인식
- AI 기술
- OpenAI
- 이미지 편집
- 일론 머스크
- 강화학습
- 감정 표현
- ChatGPT
- 오블완
Archives
- Today
- Total
목록ild (1)
AI 탐구노트
한 사람이 여러 명의 외국인과 동시에 대화해야 하는 상황을 상상해 보세요. 각기 다른 언어로 말하는 사람들 사이에서 원하는 사람의 말을 실시간으로 이해하려면, 단순히 번역만으로는 부족합니다. 누가 어디서 말하고 있는지를 파악하는 능력, 그리고 그 사람의 감정이나 억양까지 보존하면서 번역할 수 있는 기술이 필요합니다. 최근 인공지능 기술의 발전은 기존의 언어 번역과 음성 처리 분야에 새로운 가능성을 열어주고 있습니다. 특히 ‘공간 인식 음성 번역(Spatial Speech Translation)’ 기술은 기존의 번역 모델과 달리, 화자의 위치(누가, 어디서 말했는지), 억양, 감정 표현(어떻게 말했는지)을 그대로 보존하면서 실시간으로 다중 화자의 음성을 번역하는 것을 목표로 합니다. 이 기술은 단순한 기계..
AI 기술
2025. 5. 5. 14:54
