Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
Tags
- 확산 모델
- ChatGPT
- 아두이노
- LLM
- 시간적 일관성
- 휴머노이드 로봇
- OpenCV
- tts
- OpenAI
- 멀티모달
- PYTHON
- 오픈소스
- 우분투
- TRANSFORMER
- Stable Diffusion
- 인공지능
- 메타
- 티스토리챌린지
- 생성형 AI
- LORA
- 다국어 지원
- 오블완
- AI
- ubuntu
- 트랜스포머
- 일론 머스크
- 오픈AI
- 딥러닝
- 강화 학습
- AI 기술
Archives
- Today
- Total
목록경량 멀티모달 ai 모델 (1)
AI 탐구노트

Microsoft가 개발한 최첨단 경량 멀티 모달 AI 모델 Phi-3.5-vision은 Microsoft가 개발한 멀티모달 AI 모델입니다. Phi-3.5-vision은 텍스트와 이미지를 동시에 처리할 수 있어 이미지 인식, 비디오 요약, OCR(광학 문자 인식), 시각적 질문 응답 등의 다양한 작업을 수행할 수 있고 문서 분석과 과학적 차트 해석에서도 강점을 보이며 자원을 효율적으로 사용하여 훨씬 더 큰 규모의 모델에 필적하는 성능을 보여줍니다. 이 모델은 GPU 환경에서 최적의 성능을 발휘하도록 설계되었으며, 특히 데이터 세트 기반 학습과 인간의 피드백을 통한 강화 학습 방식을 사용합니다. 확장성과 효율성 문제를 해결하기 위해 MoE(Mixture of Experts) 아키텍처를 도입했습니다. 기존..
AI 기술
2024. 9. 9. 12:20