Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- PYTHON
- 인공지능
- 오블완
- AI
- 서보모터
- tts
- ChatGPT
- ControlNet
- 뉴럴링크
- LORA
- javascript
- 오픈AI
- 시간적 일관성
- OpenAI
- 멀티모달
- LLM
- 티스토리챌린지
- 일론 머스크
- 딥마인드
- 가상환경
- 트랜스포머
- 이미지 편집
- ubuntu
- AI 기술
- 아두이노
- 확산 모델
- 메타
- 생성형 AI
- TRANSFORMER
- 우분투
Archives
- Today
- Total
목록웹 데이터 (1)
AI 탐구노트
Robotics Transformer 2 (RT-2) : 비전-언어-액션 모델
웹 데이터로 훈련된 비전-언어 모델을 로봇 제어에 통합하여, 일반화와 의미적 추론 능력을 크게 향상시킨 비전-언어-액션(VLA) 모델 RT-2는 구글 딥마인드가 다양한 일상 환경에서의 로봇 제어를 위해 만든 인공지능 모델입니다. 기존 로봇 제어 모델은 주로 고정된 시나리오에서 훈련되어 일상의 다양한 환경에 적용되기에는 어려움이 있었습니다. RT-2는 이런 문제를 해결하기 위해 웹 데이터로 훈련된 비전-언어 모델(VLM)을 로봇 제어에 통합하여, 일반화와 의미적 추론 능력을 크게 향상시켰습니다. 로봇의 행동을 텍스트 토큰으로 표현하고, 비전-언어 모델을 로봇 제어 데이터와 웹 스케일의 비전-언어 태스크로 공동 미세 조정(co-fine-tuning)하여 일반화 성능을 향상시켰죠. 예전에 구글 내에서 음료..
AI 기술
2024. 9. 2. 19:25