AI 탐구노트

STYLEGANEX : StyleGAN의 제약을 해결한 모델 본문

AI 기술

STYLEGANEX : StyleGAN의 제약을 해결한 모델

42morrow 2024. 9. 3. 13:43
StyleGAN의 제약사항을 해결한 새로운 생성 아키텍처 모델

 

StyleGAN은 베이스가 되는 PGGAN 모델에 Style Transfer 개념을 도입해서 새로운 G(generator) 아키텍처를 만든 것입니다. 

 

이 모델이 처음 발표되었을 때 충격이 상당했습니다. 지금이야 MidJourney나 DALL-E 등 diffusion 계열 생성 모델을 이용해서 실물같은 사진을 만들어내는 것이 다반사가 되었지만, 다양한 특징들이 적용된 실물같은 고화질 안면사진이 쉽게 만들어진다는 것은 당시로는 신기하는 일이었거든요.

 

StyleGANEX은 StyleGAN이 가지는 제약사항을 해결해서 가변크기 이미지를 처리하고, 정열되지 않은 각도의 얼굴 이미지와 비디오에 대한 조작을 지원합니다.

 

StyleGANEX가 지원하는 기능들은 다음과 같습니다.

  • Style Mixing, Domain Transfer (스타일), Facial Attribute 편집 (예:자세, 나이 등)
  • Super Resolution, 스케치/마스크를 이용한 얼굴 생성
  • Video 얼굴 속성 편집, 카툰화 등

 

사진 : StyleGANEX와 StyleGAN 간의 차이 설명 (초기 H,W 값 가변 지원)

 

 

 

 

 

참고) 프로젝트깃헙논문영상데모(허깅페이스)