Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 멀티모달
- ubuntu
- LLM
- AI 기술
- 아두이노
- 뉴럴링크
- 오픈AI
- 메타
- 딥러닝
- tts
- AI
- 휴머노이드 로봇
- LORA
- 트랜스포머
- 티스토리챌린지
- 서보모터
- 오블완
- 시간적 일관성
- 우분투
- 일론 머스크
- 딥마인드
- TRANSFORMER
- 인공지능
- OpenAI
- 생성형 AI
- ControlNet
- PYTHON
- 확산 모델
- 가상환경
- ChatGPT
Archives
- Today
- Total
목록비전트랜스포머 (1)
AI 탐구노트
Sapiens : 4가지 비전 작업을 지원하는 시각 모델
사람의 2D 포즈 추정, 신체 부위 분할, 깊이 예측, 표면 법선 예측을 수행하는 단일 모델 Sapiens는 인간 중심의 4가지 주요 비전 작업(2D 포즈 추정, 신체 부위 분할, 깊이 예측, 표면 법선 예측)을 위한 고성능 비전 트랜스포머 모델입니다. 기존 모델들은 인간 중심의 비전 작업에서 일반화 성능이 낮고, 다양한 작업을 일관되게 수행하기 어렵다는 한계가 있었습니다. 또한, 현실 세계의 데이터를 충분히 반영하지 못하거나, 고해상도 출력을 지원하지 못해 세부적인 표현이 부족했습니다. Sapiens는 3억 장 이상의 인간 이미지 데이터셋(Human-300M)로 MAE(Masked AutoEncoder) 접근 방식을 사용하여 사전 학습된 비전 트랜스포머 모델(ViT)을 활용하여 2D 포즈 추정, 신체..
AI 기술
2024. 9. 27. 10:58