Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- AI 기술
- 딥마인드
- 뉴럴링크
- 생성형 AI
- 멀티모달
- 시간적 일관성
- 인공지능
- ChatGPT
- LORA
- ubuntu
- 트랜스포머
- TRANSFORMER
- 메타
- 서보모터
- javascript
- 이미지 편집
- 우분투
- 가상환경
- 일론 머스크
- ControlNet
- AI
- LLM
- 확산 모델
- 티스토리챌린지
- 아두이노
- PYTHON
- 오블완
- 오픈AI
- tts
- OpenAI
Archives
- Today
- Total
목록phi-3.5-vision (1)
AI 탐구노트
Phi-3.5 : 온디바이스 용 멀티 모달 모델
Microsoft가 개발한 최첨단 경량 멀티 모달 AI 모델 Phi-3.5-vision은 Microsoft가 개발한 멀티모달 AI 모델입니다. Phi-3.5-vision은 텍스트와 이미지를 동시에 처리할 수 있어 이미지 인식, 비디오 요약, OCR(광학 문자 인식), 시각적 질문 응답 등의 다양한 작업을 수행할 수 있고 문서 분석과 과학적 차트 해석에서도 강점을 보이며 자원을 효율적으로 사용하여 훨씬 더 큰 규모의 모델에 필적하는 성능을 보여줍니다. 이 모델은 GPU 환경에서 최적의 성능을 발휘하도록 설계되었으며, 특히 데이터 세트 기반 학습과 인간의 피드백을 통한 강화 학습 방식을 사용합니다. 확장성과 효율성 문제를 해결하기 위해 MoE(Mixture of Experts) 아키텍처를 도입했습니다. 기존..
AI 기술
2024. 9. 9. 12:20