'FineVision' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2026/03 »
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록FineVision (1)

AI 탐구노트

FineVision : VLM을 위한 오픈소스 대규모 멀티모달 데이터셋

X를 보니 FineVision이라는 VLM 학습용 대규모 멀티모달 데이터셋이 오픈소스로 공개됐다는 내용이 있었습니다. 해당 내용을 간단히 요약해서 정리해 보겠습니다. FineVision 개요HuggingFaceM4 팀이 공개200여 개 이상의 서로 다른 데이터셋을 모아 구성된 큐레이션 데이터대규모 멀티모달(Vision–Language) 데이터셋 시각적 입력(이미지)과 텍스트 기반 질문, 답변 데이터를 결합함데이터 스펙이미지 약 1,730만 장샘플 총 2,430만 개다이얼로그 턴 수 8,890만 회정답 토큰 총합 95억 개카테고리 별 분포 설명Answer Tokens : 답변 텍스트 토큰의 양 기준으로 OCR QA(32.4%), Science (23.7%) 순Number of Samples : 샘플 ..

AI 관련 소식 2025. 9. 5. 16:02

이전 Prev 1 Next 다음

목록FineVision (1)

AI 탐구노트

티스토리툴바