Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- ubuntu
- ControlNet
- 아두이노
- 오블완
- LLM
- 확산 모델
- 일론 머스크
- AI
- LORA
- javascript
- 인공지능
- 생성형 AI
- PYTHON
- 멀티모달
- 뉴럴링크
- 이미지 편집
- 오픈AI
- TRANSFORMER
- 우분투
- 가상환경
- 시간적 일관성
- 서보모터
- ChatGPT
- tts
- 티스토리챌린지
- 메타
- 딥마인드
- OpenAI
- 트랜스포머
- AI 기술
Archives
- Today
- Total
목록Sapiens (1)
AI 탐구노트
Sapiens : 4가지 비전 작업을 지원하는 시각 모델
사람의 2D 포즈 추정, 신체 부위 분할, 깊이 예측, 표면 법선 예측을 수행하는 단일 모델 Sapiens는 인간 중심의 4가지 주요 비전 작업(2D 포즈 추정, 신체 부위 분할, 깊이 예측, 표면 법선 예측)을 위한 고성능 비전 트랜스포머 모델입니다. 기존 모델들은 인간 중심의 비전 작업에서 일반화 성능이 낮고, 다양한 작업을 일관되게 수행하기 어렵다는 한계가 있었습니다. 또한, 현실 세계의 데이터를 충분히 반영하지 못하거나, 고해상도 출력을 지원하지 못해 세부적인 표현이 부족했습니다. Sapiens는 3억 장 이상의 인간 이미지 데이터셋(Human-300M)로 MAE(Masked AutoEncoder) 접근 방식을 사용하여 사전 학습된 비전 트랜스포머 모델(ViT)을 활용하여 2D 포즈 추정, 신체..
AI 기술
2024. 9. 27. 10:58