AI 탐구노트

Perflexity의 DeepSeek R1 1776 본문

AI 관련 소식

Perflexity의 DeepSeek R1 1776

42morrow 2025. 2. 21. 10:48

 

얼마 전 중국의 한 스타트업이 공개한 DeepSeek R1 소식을 전해 드린 바 있습니다. 

 

 

중국 DeepSeek R1의 등장: AI 개발 패러다임의 변화와 미국 빅테크 위기의식

인공지능 기술의 발전은 기존 산업의 변화를 촉진하고 새로운 경제 질서를 창출해왔습니다. 특히 미국의 빅테크 기업들은 AI 혁신을 선도하며 막대한 자본과 기술력을 바탕으로 글로벌 시장을

42morrow.tistory.com

 

놀라운 엔지니어링의 결과로, 소규모의 GPU와 적은 데이터셋으로도 최고 모델에 버금가는 성능과 기능을 보여줬었죠. 무엇보다도 그 과정을 다 오픈소스로 공개했다는 측면 때문에 AI 비즈니스 영역에는 ChatGPT 출시 때와 비슷한 충격을 줬다고 해도 과언이 아닙니다.

 

DeepSeek R1의 제약사항

그런데, 이 DeepSeek R1이 가지는 가장 큰 제약사항인 보안 이슈와 중국 중심의 주제 필터링(제한) 때문에 또 다른 논쟁을 불러 왔습니다.

  • 보안 이슈 : DeepSeek R1 사이트를 통해 서비스를 이용할 경우, 정보가 중국 쪽으로 유출될 수 있고, 거기에 추가로 틱톡 서비스 업체인 바이트댄스 쪽으로도 흘러간다는 분석 결과
  • 검열 및 정치적 편향 : 중국과 관련된 민감한 주제에 대해서는 답변을 거부하거나 중국의 입장을 대변하는 내용을 답변 (예: 시진핑 주석에 대한 질문이나 대만, 인권 등에 대한 질문)

 

Perflexity의 DeepSeek R1 1776

Perplexity에서 DeepSeek R1의 이러한 제약을 Post-Training을 통해 해결한 버전을 공개했습니다.

 

 

Open-sourcing R1 1776

An unbiased & uncensored reasoning model

www.perplexity.ai

 

이를 위해 중국에서 검열된 주제와 관련된 고품질 데이터를 수집하기 위해 다음과 같은 과정을 거쳤다고 합니다. 

  • 전문가를 고용해 중국 공산당(CCP)에 의해 검열된 것으로 알려진 300개의 주제를 식별하고 다국어 검열 분류기를 개발
  • 분류기를 트리거하는 다양한 사용자 프롬프트 세트(4만개의 다국어 프롬프트 세트)를 수집
  • Nvidia의 NeMo 2.0 프레임워크의 개조된 버전을 사용하여 검열 데이터 세트에서 R1을 사후 훈련

 

결과적으로 기존의 성능 (수리, 논리 추론 영역)은 그대로 유지되면서도 검열 및 정치적 편향 관련 문제가 해결된 것이죠. 이는 Perplexity가 추구하는 목표인 '모든 사용자 질문에 대한 정확한 답변을 제공하는 것'에 따른 것입니다. 

그림 : 모델 별 중국 관련 검열 수준 비교

 

 

R1 1776 공개의 의미는?

이렇게 질문할 수도 있겠습니다.

 

'나는 중국 관련 질문을 거의 하지 않는데 이게 크게 중요한가?'

 

R1이나 R1 1776을 직접 이용하는 사용자 측면에서는 그렇겠네요...

 

하지만, 검열을 걸러낸 새로운 모델에 대한 글이 주는 중요한 시사점은, 공개된 모델 그 자체보다는 이러한 방식을 통해 제약을 넘어서면서 원하는 형태의 새로운 서비스를 생성하는 것이 '가능하다는 예시'를 보여줬다는 것입니다. DeepSeek R1이 빅테크 누구도 못할 기술을 개발했다가 아니라 그런 기술과 과정을 '공개했다'는 것이 진정한 의미이듯 말이죠.

 

앞으로도 R1을 활용한 많은 기술과 서비스가 소개될텐데, 그때마다 그 뒤에 숨은 의미를 찾아보는 재미가 있을 것 같습니다. :-)