| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
| 29 | 30 | 31 |
- XAI
- 확산 모델
- 바이브코딩
- 자동화
- 오픈소스
- gaussian splatting
- 인공지능
- 트랜스포머
- 오블완
- 일론 머스크
- 이미지 생성
- 이미지 편집
- tts
- 우분투
- 오픈AI
- OpenAI
- 감정 표현
- 티스토리챌린지
- PYTHON
- ChatGPT
- 멀티모달
- AI 기술
- 음성 인식
- 음성합성
- AI
- 딥러닝
- 강화학습
- LLM
- 생성형AI
- 메타
- Today
- Total
목록self-consistency (2)
AI 탐구노트
구글 Vertex AI의 Gemini 모델을 중심으로 설명한 'Prompt Engineering Master Class' PDF 파일이 공개되었습니다. 이 문서는 효과적인 프롬프트 작성법과 주요 기법을 설명하고 있습니다. 페이지가 상당히 되기 때문에 이번 글에서는 이 파일 상의 내용을 간략하게만 요약 정리해 두고 가겠습니다. 1️⃣프롬프트 엔지니어링의 개요LLM은 입력 텍스트에 따라 다음 토큰을 예측하는 확률 기반의 생성엔진임프롬프트는 모델의 출력을 유도하고 조절하는 도구라고 할 수 있음프롬프트 엔지니어링은 반복적 실험과 조정이 핵심임 2️⃣ 출력 설정 조정 (LLM Ouptut Confiugration) 프롬프트 외에도 모델의 출력 설정으로 다음의 것들이 사용됩니다. 설정항목설명Output lengt..
인공지능의 진화는 단일 기능을 수행하는 전통적인 시스템을 넘어, 하나의 모델이 다양한 작업을 처리할 수 있는 범용 모델로 확장되고 있습니다. 특히 이미지와 텍스트를 함께 이해하는 **비전-언어 모델(VLM: Vision-Language Model)**이 주목받고 있으며, 이들은 질문 응답(VQA), 문서 이해, OCR 등 여러 작업을 통합적으로 수행할 수 있습니다. 하지만 이러한 발전은 비용이라는 한계도 동반합니다. 이미지 해상도가 높을수록 모델이 처리해야 하는 **시각 토큰(Visual Token)**의 수가 급증하고, 이로 인한 연산량도 비례해 증가합니다. 문제는 모든 문제에 고해상도 이미지가 필요한 것이 아니라는 점입니다. 대부분의 일반적인 작업은 저해상도 이미지로도 충분히 해결할 수 있다는 사실에..
