일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- PYTHON
- 생성형 AI
- ubuntu
- 우분투
- 가상환경
- 오블완
- 뉴럴링크
- OpenAI
- ChatGPT
- AI 기술
- 이미지 편집
- 오픈AI
- javascript
- ControlNet
- 서보모터
- LORA
- 일론 머스크
- tts
- LLM
- 딥마인드
- 시간적 일관성
- 트랜스포머
- 인공지능
- 아두이노
- 메타
- 확산 모델
- 티스토리챌린지
- AI
- 멀티모달
- TRANSFORMER
- Today
- Total
목록2024/10/07 (5)
AI 탐구노트
Voice-Pro는 AI 기반 음성 인식, 번역, 자막 생성, 보컬 제거 등을 통합 제공하는 그라디오 웹 UI 솔루션입니다. Voice-Pro가 제공하는 주요 기능은 다음과 같습니다. YouTube 동영상 다운로드 및 오디오 변환보컬 제거 및 잡음 제거다국어 자막 생성 및 번역 (100개 이상의 언어 지원)음성 합성(TTS) 기능으로 다국어 음성 생성실시간 음성 인식 및 번역배치 처리를 통해 대용량 파일 처리사용자 맞춤형 TTS 속도, 음량, 음정 조절MIT 라이선스 위에 소개한 기능들을 보면 오디오, 특히 음성 오디오 처리에서 꼭 필요하다 싶은 것들을 다 나열하고 있는 것 같습니다. 어떻게 이런 기능들을 다 구현했을까 의아했는데 뒤에 설명된 내용을 보고 고개를 끄덕일 수 있었습니다. 이미 있는..
gradio-client-lite란 gradio-client-lite는 다른 패키지나 플랫폼에 대한 의존성이 전혀 없는 경량 Gradio 클라이언트입니다. 공개된 페이지 상의 특징을 보면 다음과 같습니다. 다른 패키지 의존성 없음플랫폼 독립적임서버리스 플랫폼에서도 작동 복제 친화 매커니즘(Replica affinity mechanism)Typescript로 개발 주) 1.언급된 복제 친화 매커니즘은 Gradio 앱을 쉽게 복제하고 배포할 수 있도록 하는 기능으로 보입니다. 동일한 Gradio 인터페이스 유지하면서 여러 환경에서 앱 실행 가능하게 하는거죠.2.서버리스 플랫폼에서 작동이라고 되어 있는데, 서버 자체 관리를 불필요하나 Node.js 같은 런타임 환경은 필요합니다. 참고) Node.J..
Invoke는 Invoke AI에서 개발한 전문 크리에이터를 위한 AI 편집 도구입니다. 이미지 생성 및 편집 전문 도구 컨텐츠를 만들기 위해 이미지가 필요할 때가 있습니다.이 경우, Unsplash, Pixabay, Freepik 등과 같이 이미지 제공 사이트를 이용하거나 하죠.최근에는 생성형 AI의 등장으로 자신이 원하는 이미지를 직접 생성하는 것이 추세가 되고 있습니다. MidJourney, Stable Diffusion 등 다양한 서비스가 있는데요... 그런 AI를 이용해서 이미지를 생성하고 나서도 완전히 자기 입맛에 맞는 이미지를 구하기는 힘듭니다.그래서, 다시 편집 전문 도구를 이용해서 부분을 잘라내고 바꾸고 하는 작업들을 하게 되죠.돌고 돌아 다시 Adobe의 제품으로 갑니다.Adobe는 ..
딥러닝 모델의 가중치 파일은 프레임워크나 용도에 맞춰 최적화되어 있습니다. 주요 가중치 파일의 형식과 특징을 정리해 보고 가겠습니다. HDF5 (.h5, .hdf5)Hierachical Data Format의 약자, 대용량 데이터 저장에 적합모델의 구조와 가중치를 동시에 저장Keras, Tensorflow에서 사용 PyTorch (.pt, .pth)Pytorch에서 사용모델의 상태(dict 형태)를 저장가중치와 옵티마이저 상태 정보를 포함할 수 있음 TensorFlow SavedModel:Tensorflow에서 사용모델의 가중치, 구조, 서명, 메타데이터 포함디렉토리 구조로 저장되며 saved_model.pb 파일과 가중치 파일들이 함께 저장됨Tensorflow Serving, Tensorflow L..
얼마 전 Crawling을 전문으로 하는 FireCrawl이라는 솔루션을 소개한 바 있습니다. Firecrawl : 웹사이트 데이터 크롤링 API 서비스URL 내용을 크롤링해서 LLM을 위한 마크다운 또는 구조화된 데이터로 변환하는 API 서비스 Firecrawl은 웹 사이트 URL 상의 내용을 크롤링해서 정돈된 마크다운 형태나 LLM에 적합한 구조화된 데이터42morrow.tistory.com 그랬는데 바로 또 다른 Crawler를 알게 되어 간단한 소개와 실행 테스트를 진행해 봅니다. Crawl4AI는 비동기 아키텍처를 채용해 웹 데이터를 효율적으로 수집하고 정제하는 자동화된 솔루션으로, 대규모 데이터 크롤링과 고속 처리에 특히 유리합니다. Crawl4AI의 특징 Crawl4AI의 특징들 가..