3D-LLM : 다양한 3D 작업을 수행하는 모델

Notice

Recent Posts

Recent Comments

Link

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

AI 탐구노트

3D-LLM : 다양한 3D 작업을 수행하는 모델 본문

AI 기술

3D-LLM : 다양한 3D 작업을 수행하는 모델

42morrow 2024. 9. 6. 11:50

3D 포인트 클라우드와 그 특징을 입력으로 받아 영상에 대한 다양한 3D 관련 작업을 수행하는 모델

3D-LLM은 3D 포인트 클라우드와 그 특징을 입력으로 받아 영상에 대한 다양한 3D 관련 작업을 수행할 수 있도록 해 줍니다. 소개 영상에서는, 마치 메타포트사(Matterport)의 스캔 카메라로 촬영된 듯한 3차원 방 객체(인형의집(dollhouse)라 불리기도 함)에서 특정한 물체를 찾도록 시키거나, 영상 속 공간 의 특정한 위치로 가상으로 이동시킨 다음 거기서 주어지는 임무를 수행하게 하는 예시를 볼 수 있습니다. 즉, 3차원 공간 정보를 주고 그 속에서 LLM을 이용해서 대화 형태로 임무를 지시해서 수행시키는 것이죠.

지원되는 세부 기능은 다음과 같습니다.

3D Grounding, 3D Captioning
3D Question Answering , Task Decomposition
3D Assisted Dialog, 3D Dense Captioning
Object navigation, Vision-Language Navigation, Embodied QA

참고) 논문, 깃헙, 프로젝트

'AI 기술' 카테고리의 다른 글

칼로 (Karlo) 2.0 : 카카오의 이미지 생성 모델 (1)	2024.09.07
WhisperX : 긴 오디오, 단어 수준 지원 음성 인식 시스템 (0)	2024.09.06
HivisionIDPhotos : ID사진(증명사진)을 생성해 주는 도구 (0)	2024.09.06
FLUXMusic : 텍스트-음악 생성 모델 (1)	2024.09.05
PDFA-ENG-WDS : 영어 위주의 대규모 OCR 데이터셋 (2)	2024.09.04

'AI 기술' Related Articles

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

AI 탐구노트

AI 탐구노트

3D-LLM : 다양한 3D 작업을 수행하는 모델 본문

3D-LLM : 다양한 3D 작업을 수행하는 모델

'AI 기술' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역