Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
| 29 | 30 | 31 |
Tags
- 트랜스포머
- 멀티모달
- 자동화
- 이미지 편집
- ChatGPT
- XAI
- AI
- 강화학습
- 메타
- LLM
- 감정 표현
- OpenAI
- 딥러닝
- 음성 인식
- gaussian splatting
- 오픈AI
- 오픈소스
- 우분투
- 바이브코딩
- 오블완
- 인공지능
- 일론 머스크
- 음성합성
- 이미지 생성
- tts
- AI 기술
- PYTHON
- 확산 모델
- 티스토리챌린지
- 생성형AI
Archives
- Today
- Total
목록Live Caption (1)
AI 탐구노트
최근 실시간 자막이 필요한 상황이 있어서 바이브 코딩으로, 일반 PC에서 사용할 수 있도록 한번 만들어 봤습니다. 그 과정을 간단하게 정리해 보겠습니다. 실시간 자막 오버레이 1.개요 '실시간 자막' 기능은 크롬을 이용해 인터넷을 돌아다니다 보면 한번쯤은 경험할 수 있습니다. 제 경우도 구글 크롬의 'Live Caption' 기능을 자주 활용하는 편인데, 비단 웹 사이트 뿐만 아니라 마이크 입력이나 다른 주변 소리에도 적용할 수 있어서 가끔은 활용합니다. 이번에 개발하려고 하는 것에 대한 개요는 다음과 같습니다. 목표 : 컴퓨터 마이크 음성을 실시간으로 받아 자막을 생성하고, 어떤 앱 위에도 하단 오버레이로 표시활용 : 강의나 발표, 실시간 통역 보조, 접근성 향상(청각 지원) 등 다양한 분야에 적..
DIY 테스트
2025. 11. 1. 10:19
