Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
| 29 | 30 | 31 |
Tags
- LLM
- 오픈소스
- 일론 머스크
- 음성합성
- 오블완
- 음성 인식
- 멀티모달
- 자동화
- OpenAI
- 트랜스포머
- 우분투
- 메타
- 바이브코딩
- gaussian splatting
- AI 기술
- 확산 모델
- 딥러닝
- 감정 표현
- ChatGPT
- AI
- 이미지 생성
- 오픈AI
- 티스토리챌린지
- PYTHON
- XAI
- 강화학습
- 생성형AI
- tts
- 인공지능
- 이미지 편집
Archives
- Today
- Total
목록LLM Judge (1)
AI 탐구노트
회사에서 반복되는 웹 업무를 자동화해 줄 에이전트를 한 번쯤 상상해 본 적 있을 겁니다. 이메일을 정리하고, 사내 시스템에 접속해 보고서를 제출하고, 여러 API를 조합해서 데이터를 모으는 일 같은 것들 말이죠. 요즘 대규모 언어 모델(LLM)이 이런 '디지털 업무 비서' 역할을 꽤 잘해 내면서, 에이전트(Agent)에 대한 연구가 인기를 끌고 있습니다. 문제는, 이런 에이전트를 진짜 실전에서 쓸 수 있게 훈련시키는 과정이 생각보다 엄청 비싸고, 느리고, 비효율적이라는 점입니다.기존 방식은 보통 사람이 일일이 과제를 만들고(예: '이 웹페이지에서 주문 정보를 이렇게 이렇게 정리해라'), 그 과제에 맞춰 강화학습(RL)을 돌리면서 수많은 시도를 시키는 구조입니다. 강화학습은 시도-실패-성공 경험을 많이 쌓..
AI 기술
2025. 11. 19. 11:22
