Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
| 29 | 30 | 31 |
Tags
- 딥러닝
- 티스토리챌린지
- 오픈소스
- 이미지 편집
- 자동화
- AI
- tts
- 트랜스포머
- 우분투
- 오픈AI
- gaussian splatting
- 바이브코딩
- LLM
- 음성합성
- OpenAI
- 확산 모델
- 음성 인식
- AI 기술
- 감정 표현
- 멀티모달
- 이미지 생성
- XAI
- 메타
- 생성형AI
- 오블완
- 강화학습
- 일론 머스크
- 인공지능
- ChatGPT
- PYTHON
Archives
- Today
- Total
목록representation subspace (1)
AI 탐구노트
인간의 시각은 복잡한 화면 속에서도 자연스럽게 하나의 사물을 통째로 인식합니다. 예를 들어, 책상 위에 있는 커피잔을 보면 둥근 모양, 하얀 색, 손잡이 같은 여러 특징이 흩어진 정보로 느껴지지 않고 하나의 커피잔으로 묶어서 보는거죠. 이런 능력을 객체 바인딩(Object Binding)이라고 부릅니다. 객체 바인딩은 우리가 사물을 추적하거나, 비슷한 물체를 헷갈리지 않고 구분하는 데 꼭 필요합니다. 하지만 이런 자연스러운 과정이 AI에게도 당연히 생기는 걸까요?요즘 AI 비전 분야에서 가장 강력한 모델은 비전 트랜스포머(Vision Transformer, 이하 ViT)입니다. ViT는 이미 다양한 이미지 분류/세그멘테이션/비전-언어 모델의 핵심이 되었지만, 한 가지 오해가 늘 따라붙습니다. 'ViT는 ..
AI 기술
2025. 12. 9. 14:19
