일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- ai 챗봇
- AI
- 일론 머스크
- LLM
- 휴머노이드 로봇
- 오블완
- 메타
- OpenAI
- OpenCV
- 확산 모델
- 딥페이크
- 자연어 처리
- 멀티모달
- 오픈소스
- AI 기술
- 딥러닝
- 실시간 렌더링
- 인공지능
- ChatGPT
- tts
- 티스토리챌린지
- 우분투
- 강화 학습
- LORA
- PYTHON
- 생성형AI
- XAI
- 시간적 일관성
- 오픈AI
- 트랜스포머
- Today
- Total
목록2025/05/23 (2)
AI 탐구노트

구글 I/O 2025가 성황리에 막을 내렸습니다. 이번 행사에서 워낙 많은 기술과 제품이 소개되었는데 그 가운데 제 관심을 많이 끈 제품 중 하나는 구글의 스마트 글래스였습니다. 세련된 디자인과 최첨단 AI 기술이 결합된 이 스마트 글래스는 단순한 안경을 넘어, 우리의 일상을 완전히 바꿀 가능성을 보여줬기 때문입니다. 물론 아주 가까운 미래는 아닐 겁니다. 이번 글에서는 구글 스마트 글래스의 주요 특징과 경쟁 제품들과의 비교를 통해 이 혁신적인 기기가 가진 매력에 대해 정리해 보겠습니다. 구글 스마트 글래스: 어떤 특징이 있을까?구글은 이번 I/O에서 Android XR 플랫폼을 기반으로 한 스마트 글래스를 공개하며, 기술과 스타일의 완벽한 조화를 선보였습니다. 특히, 유명 안경 브랜드들과의 협업으로 기..

전화통화 내용이나 회의 중 녹음한 내용을 다시 텍스트로 전환하는 것을 해 보겠습니다. 복수의 사람들이 말하는 것을 각각 구분할 수 있어야 하므로 '화자 분리'라는 기술이 사용됩니다. 대략적으로 구현하려는 기능은 다음과 같습니다. 1️⃣ 목표 기능 1.입력오디오 파일 (mp3 또는 wav 파일)2.처리 과정화자 분리 (diarization) : 허깅페이스에 공개된 pyannote/speaker-diarization-3.1 를 이용음성 텍스트 변환 (STT) : WhisperX 이용3.추후 확장 (언제가 될까? -_-;)화자 별 오디오 시각화채팅창 형식의 Gradio 앱에 내용 표시다국어 지원 (언어 자동 감지)자동 번역 (EasyNMT, m2m100, opus-mt 또는 경량 LLM 이용) 2️⃣ ..