일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 다국어 지원
- 티스토리챌린지
- PYTHON
- 메타
- 오블완
- OpenCV
- 생성형 AI
- AI
- 실시간 렌더링
- 오픈AI
- 트랜스포머
- 아두이노
- 오픈소스
- LORA
- LLM
- ChatGPT
- 이미지 생성
- 인공지능
- 멀티모달
- 우분투
- 휴머노이드 로봇
- 시간적 일관성
- AI 기술
- TRANSFORMER
- 확산 모델
- tts
- 강화 학습
- OpenAI
- 딥러닝
- 일론 머스크
- Today
- Total
목록멀티모달 입력 (2)
AI 탐구노트

최근 Google이 발표한 Gemini 2.0의 Stream Realtime 기능은 AI와의 상호작용 방식을 혁신적으로 변화시키고 있습니다. 이 기능을 통해 사용자는 텍스트 입력을 넘어 음성 대화, 화면 공유, 웹캠 공유 등 다양한 방법으로 AI와 실시간 소통이 가능합니다. 이번 글에서는 Stream Realtime 기능을 실생활에서 어떻게 활용할 수 있는지 구체적인 사례를 통해 살펴보겠습니다.지원되는 기능실시간 화면 공유 : 사용자는 자신의 화면을 AI와 실시간으로 공유할 수 있어, 마치 옆자리 동료와 소통하는 것처럼 즉각적인 도움을 받을 수 있습니다음성 대화 : 사용자는 음성으로 AI와 직접 대화할 수 있습니다.웹캠 공유 : 실시간 웹캠 영상을 AI에게 보여주며 질문하고 답변을 받을 수 있습니다.멀티..

고품질 음악 생성과 정교한 스타일 컨트롤을 가능하게 하는 음악 생성 및 편집 시스템 Seed-Music는 고품질 음악 생성과 정교한 스타일 컨트롤을 가능하게 하는 음악 생성 및 편집 시스템입니다. 음악 도메인은 신호의 복잡성으로 인해 참 어려운 영역입니다. 특히 보컬 같은 경우는 다양한 주파수 대역이 겹치는 소리를 포함하고 있어 더 그렇죠. 게다가 아무래도 전문적인 도메인 지식이 필요한 영역이다 보니 더 그런 것 같습니다. 음악을 만드는 것에는 멜롣, 화음 진행, 구조적 일관성 등에 대한 전문 지식도 필요하고 이를 AI를 이용하려고 할 때 가사, 쟝르, 악기 구성, 노래 구조와 같은 주석이 포하모딘 데이터를 이용해 학습해야 합니다. 하지만, 그런 데이터를 수집하는 것은 매우 어렵죠. Seed-Musi..