Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 휴머노이드 로봇
- 딥마인드
- 확산 모델
- ubuntu
- 아두이노
- ChatGPT
- LORA
- 뉴럴링크
- 생성형 AI
- TRANSFORMER
- 시간적 일관성
- 인공지능
- LLM
- 멀티모달
- ControlNet
- 트랜스포머
- 오픈AI
- PYTHON
- AI 기술
- 우분투
- 메타
- 딥러닝
- 서보모터
- 가상환경
- 일론 머스크
- tts
- 오블완
- 티스토리챌린지
- AI
- OpenAI
Archives
- Today
- Total
목록u-net 인코딩 (1)
AI 탐구노트
Transfusion : 단일 Transformer 기반의 멀티모달 모델
Transfusion은 텍스트와 이미지를 하나의 멀티모달 모델로 통합하여 예측하고 생성할 수 있는 모델입니다. 기존의 방식은 텍스트와 이미지와 같은 이산적(텍스트) 및 연속적(이미지) 데이터를 통합하여 생성하는 데 어려움이 있었으며, 각각의 생성 모델을 독립적으로 사용해야 했기 때문에 비효율적이었습니다. Transfusion은 하나의 Transformer 모델을 사용해 텍스트와 이미지를 동시에 처리합니다. 텍스트는 언어 모델링 손실, 이미지는 확산 모델링 손실을 적용하며, 양쪽에 서로 다른 경량화된 모듈을 추가하여 효율성을 높였습니다. 또한 텍스트와 이미지를 처리하는 데 있어 각각 인과적 주의(Causal Attention)와 양방향 주의(Bidirectional Attention)를 결합한 Trans..
AI 기술
2024. 10. 10. 10:33