Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 딥마인드
- OpenAI
- 뉴럴링크
- 생성형 AI
- ChatGPT
- 멀티모달
- TRANSFORMER
- AI 기술
- ControlNet
- javascript
- 서보모터
- 일론 머스크
- 가상환경
- LORA
- 오픈AI
- tts
- PYTHON
- 이미지 편집
- 오블완
- 티스토리챌린지
- 시간적 일관성
- 아두이노
- 트랜스포머
- 메타
- 인공지능
- LLM
- 우분투
- AI
- ubuntu
- 확산 모델
Archives
- Today
- Total
AI 탐구노트
Tender 본문
Tender는 텍스트 기반 2D 전신 인간 동작 생성을 위한 모델로 Holistic-Motion2D 데이터셋과 함께 공개되었습니다. 2D 동작데이터는 수집이나 데이터 처리가 3D 데이터에 비해 상대적으로 용이하기 때문에 더 확장 가능하고 다양한 형태로 제공될 수 있습니다. 2D 동작 데이터는 신체 부위의 키포인트들로 구성되는데 이것과 텍스트 설명을 결합해서 동작을 생성하면 2D 신체 부위 키포인트들의 동작 시퀀스가 생성됩니다.
Tender 프레임워크는 PA-VAE(부위 인식 변이 오토인코더)와 트랜스포머 기반 확산 모델, CAG(신뢰 인식 생성)을 갖춘 전신 부위 인식 주의 메커니즘으로 구성되어 있습니다. 사람의 행동이 기록된 비디오 클립이 있고, 신체의 키포인트 데이터와 행동에 대한 설명 텍스트 데이터가 있다고 할 때, PA-VAE는 신체 움직임을 작은 부분(팔 움직임, 다리 움직임 등)으로 나누고 모델이 처리할 수 있는 형태로 인코딩합니다. 트랜스포머 기반 확산 모델은 인코딩된 부분을 사용하여 텍스트 설명을 조건으로 동작 시퀀스를 생성하고 CAG는 신체 부위 간의 공간적 관계를 모델링해서 신체의 모든 부분의 현실적이고 일관된 움직임을 보장하는 역할을 수행합니다.
'AI 기술' 카테고리의 다른 글
Octopus v2 (0) | 2024.08.14 |
---|---|
V-Express : 다양한 제어신호가 반영된 초상화 영상 생성 모델 (0) | 2024.08.14 |
구글 딥마인드, 사람 수준의 탁구 로봇 에이전트 공개 (0) | 2024.08.14 |
Florence-2 (0) | 2024.08.14 |
StyleShot: A SnapShot on Any Style (0) | 2024.08.14 |