일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 뉴럴링크
- 이미지 편집
- 티스토리챌린지
- 우분투
- ControlNet
- 시간적 일관성
- AI
- OpenAI
- ChatGPT
- 생성형 AI
- 트랜스포머
- 오픈AI
- PYTHON
- 일론 머스크
- 확산 모델
- tts
- 가상환경
- ubuntu
- javascript
- LORA
- 메타
- 딥마인드
- 아두이노
- 서보모터
- LLM
- AI 기술
- 오블완
- TRANSFORMER
- 멀티모달
- 인공지능
- Today
- Total
목록2024/10/06 (2)
AI 탐구노트
FLEX3D는 다수의 시각적 입력을 활용해 텍스트 또는 이미지로부터 고품질의 3D 콘텐츠를 생성하는 모델입니다. 기존 다중 뷰 확산 모델은 다중 뷰 이미지를 합성하되 적은 수의 뷰만을 사용하고 이후 다시 3D 재구성을 위한 피드포워드 프로세스르 사용합니다. 이로 인해 생성된 시점들의 품질이 낮을 경우엔 최종 3D 재구성 결과물의 품질이 떨어지는 문제가 있었습니다. FLEX3D는 이런 문제를 후보 뷰 생성 및 큐레이션 파이프라인 소개, 유연한 FlexRM 아키텍처 설계, 모델의 견고성을 향상시키기 위해 불완전한 입력 뷰를 시뮬레이션하는 새로운 교육 전략 등을 적용해 해결하고 있습니다. 위 그림을 보면 FLEX3D는 두 단계로 나누어 동작합니다. 첫 번째 단계에서는 후보 시점 생성 및 선별 과정으로..
이미지 생성 모델하면 떠 오르는 것들이 있을 겁니다. 최근에는 워낙 많이 생겨서 다 나열하기 힘들지만 그래도 떠오르는 이름 말입니다. Stable Diffusion, DALL-E, MidJourney, Flux.1 등등... 그 가운데 하나가 Black Forest Labs에서 공개한 Flux.1 입니다. MidJourney의 아성에 도전하듯 혜성같이 나타났다고 해도 과언이 아니죠. 사실 Flux.1을 개발한 연구진은 예전 Stable Diffusion을 개발했던 연구자들이기도 합니다. 그 연구자들이 나와서 만든 회사가 The Forest labs거든요. Flux.1의 경우, 3가지 버전 가운데 Schnell (가장 경량)은 Apache 2.0 라이선스로 상용으로 활용할 수도 있습니다. 그 위의 De..