VGGHeads : 합성 데이터로 구현한 3D 머리 감지의 혁신

Notice

Recent Posts

Recent Comments

Link

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

AI 탐구노트

VGGHeads : 합성 데이터로 구현한 3D 머리 감지의 혁신 본문

AI 기술

VGGHeads : 합성 데이터로 구현한 3D 머리 감지의 혁신

42morrow 2024. 8. 12. 23:03

VGGHeads는 3D 인간 머리 감지 및 메시 추정을 위한 대규모 합성 데이터셋과 이를 활용한 새로운 모델입니다. 기존 데이터셋은 편향, 개인 정보 보호 및 윤리적 문제로 인해 사용이 제한되고 대부분 데이터 수집 자체가 배우나 특별한 실험실 환경에서 만들어지는 경우가 많아 모델의 일반화가 어렵다는 문제가 있었습니다. VGGHeads는 이런 문제를 대규모 합성 데이터셋을 사용하고 다양한 장면과 포즈에서 적용할 수 있도록 새로운 모델 아키텍처를 도입함으로써 해결하고 있습니다.

VGGHeads 모델의 특징으로는 다음과 같은 것이 있습니다.

대규모 합성 데이터셋 사용
3D 인간 머리 감지 및 메시 추정을 위해 100만 개 이상의 이미지로 구성된 대규모 합성 데이터셋을 사용했습니다.
이 데이터셋은 라틴 확산 모델을 사용하여 생성되며, 다양한 장면에서의 3D 머리 메시와 얼굴 랜드마크를 포함하고 있습니다.
단일 단계의 다중 머리 감지 및 복원
단일 이미지에서 사진 상의 다수의 인물의 얼굴들을 동시에 감지하고 3D 메시를 복원할 수 있는 모델 아키텍처를 도입했습니다.
다양한 장면에 대한 일반화 가능성
다양한 포즈와 장면을 모델링할 수 있어, 실제 이미지에 대한 강력한 일반화 성능을 제공합니다.
FLAME 모델 사용
FLAME 모델을 사용하여 3D 머리 메시를 표현하며, 이는 5023개의 정점으로 구성되어 있어 다양한 작업에 기초 표현으로 사용될 수 있고 또한 전체 머리 모양, 표정, 포즈를 포함한 종합적인 3D 표현을 제공합니다
안전 및 개인 정보 보호
합성된 데이터셋을 사용하여, 개인정보 보호, 윤리적 문제를 피할 수 있고 민감한 콘텐츠를 포함할 가능성을 최소화합니다.

참고) 프로젝트, 논문, 코드, 데모

'AI 기술' 카테고리의 다른 글

DoubleTake : 기하학적 정보를 이용한 실시간 깊이 추정 (0)	2024.08.28
구글 딥마인드, 사람 수준의 탁구 로봇 에이전트 공개 (0)	2024.08.14
CLASI : LLM 기반 동시통역의 새로운 표준 (0)	2024.08.09
SF3D : 단일 이미지로 0.5초 만에 3D 모델 생성 (0)	2024.08.08
TAPTR : 트랜스포머로 구현한 임의 지점 실시간 추적의 혁신 (0)	2024.08.08

'AI 기술' Related Articles

AI 탐구노트

VGGHeads : 합성 데이터로 구현한 3D 머리 감지의 혁신 본문

VGGHeads : 합성 데이터로 구현한 3D 머리 감지의 혁신

'AI 기술' 카테고리의 다른 글

티스토리툴바