일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 생성형AI
- OpenAI
- PYTHON
- 다국어 지원
- AI 기술
- 시간적 일관성
- 오픈소스
- 코딩
- OpenCV
- 3d 재구성
- 오블완
- 우분투
- 휴머노이드 로봇
- 오픈AI
- 인공지능
- AI
- 실시간 렌더링
- LLM
- 티스토리챌린지
- 트랜스포머
- LORA
- 강화 학습
- 메타
- Stable Diffusion
- ubuntu
- 딥러닝
- 생성형 AI
- 확산 모델
- tts
- 일론 머스크
- Today
- Total
목록정체성 보존 (2)
AI 탐구노트

디지털 아바타 기술의 발전은 가상 인간, 메타버스, 그리고 디지털 휴먼 분야의 핵심을 이루고 있습니다. 특히, 사람의 음성이나 얼굴 표정을 입력으로 자연스러운 영상 속 얼굴 움직임을 생성하는 '토킹 헤드(Talking Head)' 생성 기술은 인터페이스와 콘텐츠 제작에서 중요한 역할을 하고 있습니다. 기존에는 음성이나 모션 중 하나의 입력만을 기반으로 얼굴 움직임을 제어하는 것이 일반적이었지만, 실제 환경에서는 이 두 가지가 동시에 작용합니다. 예를 들어, 사람은 말을 하면서 고개를 움직이고, 감정을 드러냅니다. 따라서 보다 실감 나는 아바타를 만들기 위해서는 오디오와 시각적 모션을 동시에 제어할 수 있는 기술이 요구됩니다. 최근 확산 모델(diffusion model)이 이미지와 영상 생성에서 우수한 ..

요즘 SNS에서 '셀카를 디즈니 공주처럼 바꿔주는 필터'나 '내 얼굴로 영화 속 장면을 재현해주는 앱'들이 인기를 끌고 있습니다. 이처럼 사용자의 얼굴을 유지하면서도 다양한 스타일이나 배경으로 이미지를 바꾸는 기술을 '정체성 보존 이미지 생성(Identity-preserved Image Generation)'이라고 합니다. 하지만, 이 기술은 생각보다 쉽지 않습니다. 얼굴은 그대로인데 옷, 배경, 포즈 등은 자유롭게 바꾸려면 AI에게 꽤나 어려운 주문이기 때문이죠. 최근에는 이미지 생성 기술 중에서도 특히 '디퓨전 트랜스포머(Diffusion Transformers, DiTs)'라는 강력한 모델들이 떠오르고 있습니다. 이 모델들은 매우 정밀하고 아름다운 이미지를 만들어낼 수 있어서 예술, 디자인, 광고 ..