일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 오픈AI
- 메타
- AI 기술
- ChatGPT
- PYTHON
- 이미지 생성
- 인공지능
- 다국어 지원
- 아두이노
- 일론 머스크
- 휴머노이드 로봇
- 멀티모달
- 강화 학습
- LLM
- 티스토리챌린지
- 오블완
- OpenAI
- 실시간 렌더링
- 생성형 AI
- 시간적 일관성
- 우분투
- TRANSFORMER
- LORA
- 딥러닝
- 오픈소스
- 확산 모델
- OpenCV
- tts
- AI
- 트랜스포머
- Today
- Total
목록onnx (2)
AI 탐구노트

텍스트-음성 변환(TTS)은 현대 인공지능 기술의 핵심적인 응용 중 하나로, 음성 인터페이스, 오디오북, 팟캐스트 제작 등 다양한 영역에서 중요한 역할을 담당하고 있습니다. 이 분야에서 새롭게 등장한 Kokoro-82M은 8,200만 개의 매개변수만으로 대형 모델을 능가하는 성능을 제공하며, 컴팩트한 크기와 효율성을 자랑합니다. 이러한 특징은 TTS 기술의 상용화를 위한 게임 체인저로 주목받고 있습니다. 특히 Kokoro-82M은 StyleTTS 2와 ISTFTNet 아키텍처를 기반으로 하여 기존 모델의 복잡한 디퓨전 메커니즘 없이 효율성을 극대화한 디코더 중심의 설계를 채택했습니다. 현 시점의 최신 버전인 0.23에서는 영어, 프랑스어, 일본어, 한국어, 중국어가 지원되고 있습니다. 전세계 지원 언어 ..

딥러닝 모델의 가중치 파일은 프레임워크나 용도에 맞춰 최적화되어 있습니다. 주요 가중치 파일의 형식과 특징을 정리해 보고 가겠습니다. HDF5 (.h5, .hdf5)Hierachical Data Format의 약자, 대용량 데이터 저장에 적합모델의 구조와 가중치를 동시에 저장Keras, Tensorflow에서 사용 PyTorch (.pt, .pth)Pytorch에서 사용모델의 상태(dict 형태)를 저장가중치와 옵티마이저 상태 정보를 포함할 수 있음 TensorFlow SavedModel:Tensorflow에서 사용모델의 가중치, 구조, 서명, 메타데이터 포함디렉토리 구조로 저장되며 saved_model.pb 파일과 가중치 파일들이 함께 저장됨Tensorflow Serving, Tensorflow L..