Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 확산 모델
- 트랜스포머
- 일론 머스크
- 딥러닝
- 우분투
- 티스토리챌린지
- 가상환경
- ControlNet
- ubuntu
- LLM
- 휴머노이드 로봇
- OpenAI
- 시간적 일관성
- AI
- 인공지능
- ChatGPT
- 뉴럴링크
- 아두이노
- 멀티모달
- PYTHON
- 오블완
- 오픈AI
- TRANSFORMER
- 메타
- LORA
- tts
- 생성형 AI
- AI 기술
- 서보모터
- 딥마인드
Archives
- Today
- Total
목록포즈추정 (1)
AI 탐구노트
Sapiens : 4가지 비전 작업을 지원하는 시각 모델
사람의 2D 포즈 추정, 신체 부위 분할, 깊이 예측, 표면 법선 예측을 수행하는 단일 모델 Sapiens는 인간 중심의 4가지 주요 비전 작업(2D 포즈 추정, 신체 부위 분할, 깊이 예측, 표면 법선 예측)을 위한 고성능 비전 트랜스포머 모델입니다. 기존 모델들은 인간 중심의 비전 작업에서 일반화 성능이 낮고, 다양한 작업을 일관되게 수행하기 어렵다는 한계가 있었습니다. 또한, 현실 세계의 데이터를 충분히 반영하지 못하거나, 고해상도 출력을 지원하지 못해 세부적인 표현이 부족했습니다. Sapiens는 3억 장 이상의 인간 이미지 데이터셋(Human-300M)로 MAE(Masked AutoEncoder) 접근 방식을 사용하여 사전 학습된 비전 트랜스포머 모델(ViT)을 활용하여 2D 포즈 추정, 신체..
AI 기술
2024. 9. 27. 10:58