Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- OpenAI
- 일론 머스크
- 가상환경
- 티스토리챌린지
- LLM
- LORA
- 이미지 편집
- tts
- javascript
- 트랜스포머
- 뉴럴링크
- 오블완
- 아두이노
- 우분투
- 딥마인드
- 인공지능
- 확산 모델
- TRANSFORMER
- 오픈AI
- AI 기술
- ubuntu
- 서보모터
- 시간적 일관성
- PYTHON
- ChatGPT
- 메타
- 생성형 AI
- 멀티모달
- AI
- ControlNet
Archives
- Today
- Total
AI 탐구노트
STYLEGANEX : StyleGAN의 제약을 해결한 모델 본문
StyleGAN의 제약사항을 해결한 새로운 생성 아키텍처 모델
StyleGAN은 베이스가 되는 PGGAN 모델에 Style Transfer 개념을 도입해서 새로운 G(generator) 아키텍처를 만든 것입니다.
이 모델이 처음 발표되었을 때 충격이 상당했습니다. 지금이야 MidJourney나 DALL-E 등 diffusion 계열 생성 모델을 이용해서 실물같은 사진을 만들어내는 것이 다반사가 되었지만, 다양한 특징들이 적용된 실물같은 고화질 안면사진이 쉽게 만들어진다는 것은 당시로는 신기하는 일이었거든요.
StyleGANEX은 StyleGAN이 가지는 제약사항을 해결해서 가변크기 이미지를 처리하고, 정열되지 않은 각도의 얼굴 이미지와 비디오에 대한 조작을 지원합니다.
StyleGANEX가 지원하는 기능들은 다음과 같습니다.
- Style Mixing, Domain Transfer (스타일), Facial Attribute 편집 (예:자세, 나이 등)
- Super Resolution, 스케치/마스크를 이용한 얼굴 생성
- Video 얼굴 속성 편집, 카툰화 등
'AI 기술' 카테고리의 다른 글
FLUXMusic : 텍스트-음악 생성 모델 (1) | 2024.09.05 |
---|---|
PDFA-ENG-WDS : 영어 위주의 대규모 OCR 데이터셋 (2) | 2024.09.04 |
VIMA : 로봇팔을 제어하는 에이전트 (0) | 2024.09.03 |
SAM2Point : 3D 분할 수행 모델 (0) | 2024.09.03 |
StreamingT2V : 일관되고 역동적인 긴 영상 생성 기법 (0) | 2024.09.02 |