AI 탐구노트

GLM(Grounded Language Model) : 정확성 높은 RAG 2.0 기반 언어모델 본문

AI 기술

GLM(Grounded Language Model) : 정확성 높은 RAG 2.0 기반 언어모델

42morrow 2025. 3. 9. 16:22

GLM이란 무엇인가?

 

GLM(Grounded Language Model)은 Contextual AI에서 선보인 언어 모델로, 기업 환경에서의 ‘환각(hallucination)’을 최소화하고, 주어진 외부 지식 소스(문서, 데이터베이스 등)를 최대한 정확히 반영하도록 설계되었습니다.

 

일반적인 범용 목적의 LLM(대규모 언어 모델)은 방대한 사전 학습 데이터를 활용해 높은 수준의 창의적·종합적 답변을 생성할 수 있지만, 때때로 실제 주어진 정보와 무관하거나 모순된 내용을 생성하기도 합니다. 이러한 ‘환각’은 특히 기업 환경에서 치명적일 수 있습니다. 예를 들어, 고객 서비스 챗봇이 존재하지 않는 할인 정책을 안내하거나, 금융 분야에서 잘못된 수치를 제시해 의사결정을 그르치게 만드는 사례가 대표적입니다.

 

GLM은 이러한 문제를 해결하기 위해, 모델이 내부 파라미터 지식(학습 과정에서 얻은 일반 정보)보다 외부에서 주어진 근거 자료에 우선순위를 두도록 설계되었습니다. 또한 모델이 응답을 생성하는 과정에서 ‘인라인 출처 표기(Inline Attribution)’ 기능을 제공하여, 사용자가 각 정보가 어디에서 왔는지 명확히 추적할 수 있도록 돕습니다.


RAG 2.0 기반의 GLM

Contextual AI의 창업팀은 RAG(Retrieval-Augmented Generation) 분야의 선구자 중 하나로, RAG를 통해 “LLM에 검색 결과(혹은 특정 문서)를 추가로 제공하여 답변의 정확도와 근거를 높이는 방식”을 정립했습니다. 이제 한 단계 발전한 RAG 2.0을 기반으로 GLM을 설계함으로써, 단순히 검색 결과를 가져와 답변에 활용하는 수준을 넘어, 할루시네이션을 최소화하고 출처를 명확히 표기하는 새로운 차원의 RAG 경험을 제공합니다.

 

RAG 2.0은 기존 RAG 대비 다음과 같은 강점을 갖습니다.

  1. 정교한 소스 선택 : 단순히 검색된 텍스트를 그대로 모델에 주입하는 것이 아니라, 질의 의도에 부합하는 ‘정확한’ 정보를 선별하고 통합하는 과정을 개선하였습니다.
  2. 긴 문맥 처리 능력 향상 : 복잡한 시나리오나 방대한 문서가 주어졌을 때도 모델이 놓치지 않고 필요한 정보를 추론하도록 업그레이드되었습니다.
  3. 근거 추적 기능 강화 : GLM의 인라인 출처 표기와 결합되어, 모델이 ‘어느 부분을 어떤 문서에서 참조했는지’를 사용자에게 직접 보여줄 수 있습니다.

이를 통해 RAG 2.0 기반의 GLM은 한층 더 신뢰할 수 있는 답변과 높은 정확도를 제공합니다.


FACTS 벤치마크에서 최고 점수 달성

제2의 자료로 제시된 FACTS(Factuality Score) 그라운딩 벤치마크 비교 이미지에 따르면, GLM은 88.0%의 점수로 1위를 차지하였습니다. FACTS는 LLM의 ‘정확성(사실성)’과 ‘근거 충실도’를 평가하는 대표적인 지표로 알려져 있습니다. 같은 자료에 의하면, 구글의 Gemini 2.0 Flash는 85.3%, Anthropic의 Claude 3.5 Sonnet이 80.4%, OpenAI의 GPT-4가 78.2%, Mistral Large 2가 73.4%, DeepSeek v3가 67.8%를 기록했습니다.

 

그림 : GLM과 타 언어모델과의 성능 비교 (FACTS Grounding Benchmark)

 

이처럼 GLM은 동급 최고 수준의 그라운딩 성능을 입증하였으며, 기업이 RAG(특히 RAG 2.0)나 ‘에이전틱(Agentic)’ 시나리오에 언어 모델을 적용할 때 요구되는 높은 정확도와 신뢰도를 충족시킵니다.


GLM이 제공하는 주요 특징

  • 최소화된 할루시네이션
    • 모델이 사전 학습된 내부 지식보다, 사용자가 제공한 문서·데이터를 우선하여 답변하도록 설계되었습니다.
    • 장문의 대화나 복잡한 시나리오에서도 잘못된 내용을 ‘지어내지’ 않도록 강화하였습니다.
  • 인라인 출처 표기(Inline Attribution)
    • GLM은 답변을 생성하는 순간, 해당 정보가 어떤 자료에서 추출되었는지를 함께 표시합니다.
    • 사용자는 모델의 응답이 실제로 근거 자료에 기반하고 있는지 쉽게 확인할 수 있습니다.
  • 기업용 RAG 2.0 및 에이전틱 워크플로우에 최적화
    • Contextual AI의 창업팀은 RAG 연구를 주도한 경험이 있으며, GLM을 통해 RAG 2.0 및 다양한 에이전트 시나리오에서 정확도와 신뢰성을 보장합니다.
  • Meta Llama 3 기반
    • GLM은 Meta Llama 3 모델을 기반으로 구축되었습니다.
  • 유연한 응답 형식
    • 'avoid_commentary' 플래그를 사용하여 답변에 추가 설명(코멘터리)을 넣을지 말지를 제어할 수 있습니다.
    • 사용 사례에 따라, 답변을 짧고 근거만 제시하도록 만들 수도 있고, 이해를 돕는 해설까지 제공하도록 설정할 수도 있습니다.

그림 : Commentary 적용 여부에 따른 차이 예시


 

 

GLM은 기업 환경에서 필요한 정확성, 근거 제시, 신뢰성을 모두 갖춘 새로운 언어 모델입니다. FACTS 벤치마크에서 최고의 점수를 달성했으며, RAG 2.0을 기반으로 한 모델 구조와 인라인 출처 표기 등 독보적인 기능을 갖추어, RAG와 에이전틱 시나리오에 최적화된 결과를 제공합니다.

 

생성형 AI와 LLM의 신뢰도가 중요해지고 있는만큼 RAG 2.0이 적용된 GLM은 다른 서비스 개발에 긍정적인 영향을 줄 것으로 생각됩니다. 

 


 

참고자료

  • 블로그) Introducing the most grounded language model in the world (링크)
  • 블로그) Introducing RAG 2.0 (링크)