'representation subspace' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2026/03 »
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록representation subspace (1)

AI 탐구노트

대규모 비전 트랜스포머(ViT)는 정말 '객체를 묶어 인식'할 수 있을까?

인간의 시각은 복잡한 화면 속에서도 자연스럽게 하나의 사물을 통째로 인식합니다. 예를 들어, 책상 위에 있는 커피잔을 보면 둥근 모양, 하얀 색, 손잡이 같은 여러 특징이 흩어진 정보로 느껴지지 않고 하나의 커피잔으로 묶어서 보는거죠. 이런 능력을 객체 바인딩(Object Binding)이라고 부릅니다. 객체 바인딩은 우리가 사물을 추적하거나, 비슷한 물체를 헷갈리지 않고 구분하는 데 꼭 필요합니다. 하지만 이런 자연스러운 과정이 AI에게도 당연히 생기는 걸까요?요즘 AI 비전 분야에서 가장 강력한 모델은 비전 트랜스포머(Vision Transformer, 이하 ViT)입니다. ViT는 이미 다양한 이미지 분류/세그멘테이션/비전-언어 모델의 핵심이 되었지만, 한 가지 오해가 늘 따라붙습니다. 'ViT는 ..

AI 기술 2025. 12. 9. 14:19

이전 Prev 1 Next 다음

목록representation subspace (1)

AI 탐구노트

티스토리툴바