| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
| 29 | 30 | 31 |
- tts
- gaussian splatting
- 강화학습
- 트랜스포머
- 오픈AI
- 오픈소스
- 오블완
- 딥러닝
- 우분투
- 음성합성
- 음성 인식
- 일론 머스크
- 이미지 생성
- OpenAI
- XAI
- ChatGPT
- 인공지능
- 메타
- AI 기술
- 생성형AI
- 자동화
- 바이브코딩
- 확산 모델
- PYTHON
- 멀티모달
- 티스토리챌린지
- AI
- LLM
- 이미지 편집
- 감정 표현
- Today
- Total
목록gemma3 (2)
AI 탐구노트
Ollama에서 Gemma3 모델을 올려두고 API 호출을 통해 서비스를 받았습니다. 이전 글에서 언급한 것처럼 돌아오는 답변이 원하는 포맷이 아니고 요약도 엉망으로 되는 경우가 많았습니다. ollama 쪽 모델은 원본과는 좀 다른가보다... 자기 고집이 센 녀석인가보다 하면 불편하지만 참으며 사용했고, 요약 결과가 너무 이상하다 싶으면 좀 더 큰 다른 모델을 이용하는 방식으로 넘어갔었습니다. 그런데... 아무리 Ollama 쪽 모델의 특성일 수도 있겠다 생각해도 이 모델이 이렇게까지 헤맬까? 하는 의문이 드는겁니다. 그래서, 일종의 버그 잡기를 시도했고, 그 과정을 기록해 둡니다. 흑역사죠. 1) 문제점 확인 예전에 만들어 둔 Youtube 스크립트 요약기에서 로컬 모델 사용 방식을 LM Stud..
Google DeepMind에서 TranslateGemma라는 모델을 공개했습니다. 이름 그대로 다국어 번역에 특화된 모델입니다. 간단하게 어떤 특징이 있고 어떻게 활용할 수 있는지 정리해 보고 가겠습니다. TranslateGemma 1) 개요TranslateGemma는 Google의 Gemma 3 모델을 기반으로 기계 번역 작업에 특화되도록 미세 조정한 오픈소스 모델Gemini가 생성한 합성 데이터, 지도 미세 조정(SFT), 강화 학습(RL)을 통해 번역 작업에 특화되어 정확하고 자연스러운 번역을 제공 2) 특징공개 모델 : 27B, 12B, 4B 모델12B TranslateGemma 모델이 27B Gemma3 모델보다 성능이 뛰어남4B 모델은 모바일 기기나 엣지(Edge) 환경 등 제한된 자원에..
