일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 확산 모델
- 메타
- 티스토리챌린지
- AI
- 오블완
- AI 기술
- 일론 머스크
- 인공지능
- LORA
- LLM
- PYTHON
- 이미지 편집
- 아두이노
- tts
- javascript
- ubuntu
- 트랜스포머
- 생성형 AI
- TRANSFORMER
- ControlNet
- 딥마인드
- 오픈AI
- 서보모터
- 가상환경
- ChatGPT
- 시간적 일관성
- 멀티모달
- OpenAI
- 우분투
- 뉴럴링크
- Today
- Total
목록다국어 지원 (2)
AI 탐구노트
Voice-Pro는 AI 기반 음성 인식, 번역, 자막 생성, 보컬 제거 등을 통합 제공하는 그라디오 웹 UI 솔루션입니다. Voice-Pro가 제공하는 주요 기능은 다음과 같습니다. YouTube 동영상 다운로드 및 오디오 변환보컬 제거 및 잡음 제거다국어 자막 생성 및 번역 (100개 이상의 언어 지원)음성 합성(TTS) 기능으로 다국어 음성 생성실시간 음성 인식 및 번역배치 처리를 통해 대용량 파일 처리사용자 맞춤형 TTS 속도, 음량, 음정 조절MIT 라이선스 위에 소개한 기능들을 보면 오디오, 특히 음성 오디오 처리에서 꼭 필요하다 싶은 것들을 다 나열하고 있는 것 같습니다. 어떻게 이런 기능들을 다 구현했을까 의아했는데 뒤에 설명된 내용을 보고 고개를 끄덕일 수 있었습니다. 이미 있는..
베리어 프리 키오스크 (Barrier Free Kiosk) 베리어 프리 키오스크란 장애인이나 고령자, 임산부 등 다양한 사용자들이 쉽게 접근하고 사용할 수 있도록 설계된 무인 정보 단말기를 의미하면 다음과 같은 특징을 가지고 있습니다. 물리적 접근성 측면높이, 위치, 조작부 크기와 배열 등이 휠체어나 키 작은 사람들도 쉽게 접근할 수 있도록, 그리고 입력 방식도 터치스크린 외에 버튼, 레버, 음성 인식, 동작 인식 등 다양하게 지원되도록 설계됩니다. 시각적 접근성 측면시각 장애인을 위해 화면의 텍스트 크기를 조절하거나 음성 안내를 하거나 점자 디스플레이/키보드 등을 제공합니다. 청각적 접근성 측면청각 장애인을 위해 시각적인 안내를 강화하거나 자막이나 화면 내용을 텍스트로 변환하거나 수화 표현 또는 동작 ..