'Embodied Manipulation' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2026/03 »
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록Embodied Manipulation (1)

AI 탐구노트

Emu3.5 : '다음 상태'를 예측하는 네이티브 멀티모달 월드 모델

최근 생성형 AI는 텍스트만 잘 생성하는 것이 아니라, 이미지나 영상까지 다루기 시작했습니다. 하지만 현실 세계는 '멈춰 있는 한 장면'이 아니라 '시간에 따라 변하는 연속된 흐름'이기 때문에 생성형 AI에서 사람이 물건을 잡고 움직이고, 그 다음 문을 여는 과정을 자연스럽게 이어서 만들어내는 것은 쉽지 않습니다. 그렇다면 짧은 미디어 클립에서 멈추지 않고, 긴 맥락을 따라가며 장면이 어떻게 변하는지, 사람이 어떤 행동을 할지까지 자연스럽게 이어서 만들어내려면 무엇이 필요할까요?BAAI의 Emu3.5는 바로 이 지점을 파고듭니다. 이 모델은 텍스트와 비전을 한 줄로 섞어 넣고(인터리브드 입력), 같은 방식으로 한 줄로 섞어 내보내는(인터리브드 출력) 구조를 택합니다. 더 나아가, 이미지도 토큰으로 보고 ..

AI 기술 2025. 11. 2. 14:55

이전 Prev 1 Next 다음

목록Embodied Manipulation (1)

AI 탐구노트

티스토리툴바