Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
| 29 | 30 | 31 |
Tags
- 트랜스포머
- 오픈소스
- 이미지 편집
- 인공지능
- gaussian splatting
- tts
- 이미지 생성
- 생성형AI
- 음성합성
- OpenAI
- ChatGPT
- 확산 모델
- 일론 머스크
- 감정 표현
- 우분투
- 음성 인식
- 티스토리챌린지
- 자동화
- 바이브코딩
- AI 기술
- 메타
- 오픈AI
- 멀티모달
- PYTHON
- XAI
- AI
- 강화학습
- LLM
- 딥러닝
- 오블완
Archives
- Today
- Total
목록IsSameObject (1)
AI 탐구노트
인간의 시각은 복잡한 화면 속에서도 자연스럽게 하나의 사물을 통째로 인식합니다. 예를 들어, 책상 위에 있는 커피잔을 보면 둥근 모양, 하얀 색, 손잡이 같은 여러 특징이 흩어진 정보로 느껴지지 않고 하나의 커피잔으로 묶어서 보는거죠. 이런 능력을 객체 바인딩(Object Binding)이라고 부릅니다. 객체 바인딩은 우리가 사물을 추적하거나, 비슷한 물체를 헷갈리지 않고 구분하는 데 꼭 필요합니다. 하지만 이런 자연스러운 과정이 AI에게도 당연히 생기는 걸까요?요즘 AI 비전 분야에서 가장 강력한 모델은 비전 트랜스포머(Vision Transformer, 이하 ViT)입니다. ViT는 이미 다양한 이미지 분류/세그멘테이션/비전-언어 모델의 핵심이 되었지만, 한 가지 오해가 늘 따라붙습니다. 'ViT는 ..
AI 기술
2025. 12. 9. 14:19
