'LLM Judge' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2026/03 »
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록LLM Judge (1)

AI 탐구노트

AgentEvolver : LLM 에이전트의 자기-진화(Self-Evolving) 학습 프레임워크

회사에서 반복되는 웹 업무를 자동화해 줄 에이전트를 한 번쯤 상상해 본 적 있을 겁니다. 이메일을 정리하고, 사내 시스템에 접속해 보고서를 제출하고, 여러 API를 조합해서 데이터를 모으는 일 같은 것들 말이죠. 요즘 대규모 언어 모델(LLM)이 이런 '디지털 업무 비서' 역할을 꽤 잘해 내면서, 에이전트(Agent)에 대한 연구가 인기를 끌고 있습니다. 문제는, 이런 에이전트를 진짜 실전에서 쓸 수 있게 훈련시키는 과정이 생각보다 엄청 비싸고, 느리고, 비효율적이라는 점입니다.기존 방식은 보통 사람이 일일이 과제를 만들고(예: '이 웹페이지에서 주문 정보를 이렇게 이렇게 정리해라'), 그 과제에 맞춰 강화학습(RL)을 돌리면서 수많은 시도를 시키는 구조입니다. 강화학습은 시도-실패-성공 경험을 많이 쌓..

AI 기술 2025. 11. 19. 11:22

이전 Prev 1 Next 다음

목록LLM Judge (1)

AI 탐구노트

티스토리툴바