Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 가상환경
- ubuntu
- 메타
- 일론 머스크
- 오픈AI
- 서보모터
- 인공지능
- 티스토리챌린지
- javascript
- 이미지 편집
- 시간적 일관성
- 트랜스포머
- TRANSFORMER
- ChatGPT
- OpenAI
- 멀티모달
- 확산 모델
- PYTHON
- ControlNet
- 뉴럴링크
- tts
- LORA
- 생성형 AI
- 오블완
- 딥마인드
- AI
- AI 기술
- LLM
- 아두이노
- 우분투
Archives
- Today
- Total
목록인간중심비전 (1)
AI 탐구노트
Sapiens : 4가지 비전 작업을 지원하는 시각 모델
사람의 2D 포즈 추정, 신체 부위 분할, 깊이 예측, 표면 법선 예측을 수행하는 단일 모델 Sapiens는 인간 중심의 4가지 주요 비전 작업(2D 포즈 추정, 신체 부위 분할, 깊이 예측, 표면 법선 예측)을 위한 고성능 비전 트랜스포머 모델입니다. 기존 모델들은 인간 중심의 비전 작업에서 일반화 성능이 낮고, 다양한 작업을 일관되게 수행하기 어렵다는 한계가 있었습니다. 또한, 현실 세계의 데이터를 충분히 반영하지 못하거나, 고해상도 출력을 지원하지 못해 세부적인 표현이 부족했습니다. Sapiens는 3억 장 이상의 인간 이미지 데이터셋(Human-300M)로 MAE(Masked AutoEncoder) 접근 방식을 사용하여 사전 학습된 비전 트랜스포머 모델(ViT)을 활용하여 2D 포즈 추정, 신체..
AI 기술
2024. 9. 27. 10:58