| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
- AI
- 우분투
- 오블완
- 오픈소스
- 딥러닝
- 일론 머스크
- ChatGPT
- 감정 표현
- 이미지 생성
- 자동화
- 이미지 편집
- PYTHON
- 메타
- 확산 모델
- XAI
- 바이브코딩
- gaussian splatting
- AI 기술
- tts
- 생성형AI
- 인공지능
- 오픈AI
- 음성합성
- 음성 인식
- LLM
- 멀티모달
- 트랜스포머
- 티스토리챌린지
- OpenAI
- 강화학습
- Today
- Total
목록latent diffusion (2)
AI 탐구노트
최근 인공지능 기술의 발전은 놀라운 수준의 이미지 생성과 텍스트 생성 능력을 보여주고 있습니다. 이제 그 영역은 3차원 공간까지 확장되고 있으며, 단순한 물체 생성 수준을 넘어 복잡한 도시, 자연 지형, 건축물 등을 통합한 장면(scene) 생성이 가능해지고 있습니다. 이러한 3D 생성 기술은 게임, 영화, 메타버스, 자율주행 등 다양한 산업에서 핵심 인프라로 떠오르고 있습니다. 하지만, 지금까지의 3D 생성 기술은 대부분 한정된 공간, 예를 들면 건물 내부나 도시 일부 구역에만 적용 가능했습니다. 실제 지구처럼 수천 제곱킬로미터에 이르는 광범위한 지형을 효율적으로 생성하는 것은 여전히 어려운 문제로 남아있습니다. 이 문제를 해결하기 위해 'EarthCrafter'라는 기술이 제안되었는데 이는 대규모 항..
음악 생성 기술은 최근 몇 년간 급격한 발전을 이루었으며, 인공지능(AI) 기반의 음악 생성 모델들은 새로운 창작 방식의 가능성을 열어가고 있습니다. 기존의 음악 생성 시스템은 보컬과 반주 트랙을 개별적으로 생성하거나, 다단계의 복잡한 아키텍처를 거쳐야만 고품질의 음악을 만들 수 있었으나 이러한 방식은 확장성이 부족하고, 짧은 음악 조각만을 생성하는 경우가 많아 실질적인 음악 창작 도구로 사용하기에는 한계가 존재했죠. 특히, 최근까지 대부분의 음악 생성 모델들은 자연어 처리에서 사용되는 언어 모델(Language Model) 기반의 접근 방식을 차용해 왔습니다. 하지만 이러한 모델들은 연산 비용이 높고, 추론 속도가 느려 실시간 응용에는 적합하지 않았고 이에 따라 빠르고 간결하면서도 고품질의 곡을 생성할..
