AI 탐구노트

META, 대규모 컴퓨팅 클러스터 구축 계획 발표. 난 올인이요! 본문

AI 관련 소식

META, 대규모 컴퓨팅 클러스터 구축 계획 발표. 난 올인이요!

42morrow 2025. 7. 15. 10:27

 

 

 

META CEO 마크 저커버그가 대규모 GPU 컴퓨팅 클러스터 구축에 수천억 달러를 지출할 것이라고 발표했습니다. 여기에는 데이터센터 구축, GPU 구매, 전력,네트워크 인프라, 인재 채용 등을 위한 비용이 포함됩니다. 이번 글에서는 그 내용을 간략하게 소개하겠습니다. 

 


메타의 데이터 센터 로드맵

메타가 계획하고 있는 데이터 센터 구축과 관련된 것만 언급하면 다음과 같습니다. 

 - Prometheus : 1GW 규모, 2026년 가동 예정, 오하이오 주에 조성 중

 - Hyperion : 최대 5GW까지 확장 가능. 루이지애나주에 조성 중 

 - 이외에도 Titan 이라는 대형 클러스터를 복수개 운영할 계획

 

그림 : 최대 5GW까지 확장 가능한 Hyperion의 규모 비교 (배경은 뉴욕 맨허탄)

 

데이터 센터 규모가 너무 큰거 아닌가?

 

공개된 계획 상의 규모가 실로 어마어마합니다. 텍사스 오스틴에 구축된 xAI의 Clossus의 규모도 대단히 크다고 생각했었는데, 그보다 훨씬 더 큰 규모죠. 단순히 GPU 클러스터만을 위한다면 굳이 이렇게까지 클 필요가 있나 싶은 느낌도 없잖아 있습니다. 그렇게 생각한 이유는 Clossus와 비교해 보면 바로 알 수 있습니다. 

 

xAI의 Clossus는 20만개의 GPU 규모이며 최종은 100만개 GPU까지 확장하는 것을 목표로 하고 있습니다. 올해 4월 기준 20만개 GPU에 300MW 전력 소비 구조로 운영된다고 알려져 있는데, 이를 5배해서 100만개로 늘인다고 하더라도 1.5GW 수준이 됩니다. 그에 비해 Hyperion은 5GW 수준이면서 최종은 60만개의 GPU 인프라를 계획하고 있습니다. 전력규모 측면만 보면 뭔가 추가적인 목적이 있을거란 것을 알 수 있습니다. 이런 추측은 터무니없이 넓은 공간적인 규모를 보면 더 설득력이 있습니다. 그게 아니면 메타가 너무너무 땅부자라 그런건지도 모르죠... -_-;

 

현재까지 메타는 24,576개의 GPU 기반 대형 클러스터를 이미 운영 중이라고 알려져 있습니다. (단 연말까지 350,000개의 H100 GPU, 최종적으로는 600,000개 GPU 규모의 인프라를 구축할 계획이라고 합니다) 그래도 솔직히 xAI라는 스타트업이 20만개인데 그의 1/9 수준이라는 것은 회사 규모로 보면 면이 서지 않는다고 할 수 있습니다. 게다가 현재 메타는 AI 오픈소스 진영을 대표하고 있는 주자인데 더 그렇죠. 

 

AI에 올인하는 메타

실제로 메타는 최근 AI에 완전 올인을 했습니다. OpenAI 나 Google, Tesla 등에 있던 핵심 AI 인재들을 블랙홀처럼 빨아 들이고 있고 (엄청난 자금을 투입 중), 데이터 센터 구축에 시간이 많이 소요되니 Prometeus(1GW급) 개발 현장에 임시로 텐트 데이터센터까지 적용하고 있는 실정입니다. AI 경쟁에서 뒤쳐지지 않기 위해 속도와 규모를 동시에 잡고자 모든 것을 걸고 있다고 해도 과언이 아닙니다. 

 

메타의 전력 확보 전략

이를 위해서는 안정적인 대규모 전력 확보가 필요합니다. 그래서 메타는 재생에너지, 대체전력원 구축, 전력 계약 다각화 등의 작업을 진행하고 있습니다. 

 

1.재생에너지 장기공급 계약 (PPAs)

  • Invenergy와 PPA 체결 : 태양광 및 풍력 합산 791 MW 규모의 전력을 공급받는 계약을 체결함
    이는 기존 760 MW 구매에 추가된 규모로, 총 1,800 MW에 달함
  • 지열 에너지 확보 : 뉴멕시코의 XGS Energy와 150 MW 규모의 고급 지열 발전 계약을 체결. 2020년대 말까지 가동 예정이며, 탄소배출 없는 안정적인 전원 공급을 목표로 함

2.핵,지열 등 대체전원 확대

  • 소형 원자력 발전(PPA) : 일리노이주의 클린 에너지 원자로(Clinton Clean Energy Center)와 20년 단위 PPA 계약을 통해 1.1 GW의 핵전력을 확보. 2027년부터 공급 예정이며, 기존 재생 전력과 병행 운용


AI 시대에 돌입하면서 미국의 빅테크 기업들은 어머어마한 투자를 하고 있습니다. 외부에서 보면 거품을 스스로 만드는게 아닌가 싶을 정도죠. 그만큼 향후 개발되어 나올 AI 기술이 가져올 영향이 절대적이라는 것과 '절대반지'를 얻으면 모든 것을 거머쥘 수 있다는 절박감을 느낄 수 있는 대목입니다. 메타 외에도 구글, 아마존, MS 등도 연간 300억 달러 이상을 AI 인프라와 서비스에 투입하고 있습니다. 자금, 클러스터, 인재, 소프트웨어 전 분야에 걸친 초집중 전략을 가져간다고 할 수 있죠. 

 

이제 눈을 돌려 우리나라를 봅니다. 글로벌 전체를 보면 결코 못하고 있는 건 아닌 것 같은데... 경쟁자가 너무 강하다보니 걱정이 앞섭니다. 개별적으로 대항해서는 답이 없고 정말 국가 차원에서 팀 코리아를 잘 결성해서 이 높은 파고를 넘어줬으면 좋겠습니다.