AI 탐구노트

Google DeepMind, Veo2로 AI 영상 제작의 판도를 바꾸다! 본문

AI 관련 소식

Google DeepMind, Veo2로 AI 영상 제작의 판도를 바꾸다!

42morrow 2024. 12. 22. 10:21

 

최근 Google DeepMind가 공개한 Veo2는 AI 기반 영상 생성 기술의 새로운 지평을 열고 있습니다. 데모 영상과 벤치마크 자료에 따르면, Veo2는 기존의 AI 영상 제작 툴을 압도하는 성능을 자랑하며, 그 디테일과 물리적 정확성에서 새로운 기준을 제시하고 있습니다.

 

AI 영상 생성 기술은 초기에는 단순한 영상 합성과 보정에 그쳤지만, 이제는 복잡한 디테일 재현과 물리 법칙의 정확한 이해를 바탕으로 영화와 같은 고품질 콘텐츠 제작까지 가능해지고 있습니다. Veo2가 가져올 변화는 단순히 기술적 진보에 그치지 않을 것입니다. 이는 영상 제작의 프로세스를 근본적으로 혁신할 가능성을 시사합니다.

 

특히, 에미상 수상자인 영상 편집 전문가의 호평(아래 참고자료)까지 받은 Veo2는 그야말로 업계 전문가들조차 놀라게 만들었습니다. Veo2의 등장으로 AI가 영상 제작 전문가를 대체할 수 있을지, 나아가 영화 및 영상 콘텐츠 산업의 미래는 어떻게 변화할지 궁금증이 커지고 있습니다.

그림 : VEO2를 이용해 제작된 영상과 그때 사용된 프롬프트 예시

 


기존 AI 기술들의 한계

기존 AI 영상 생성 기술은 다음과 같은 한계를 가지고 있었습니다.

  • 디테일 부족 : 디테일 표현이 부자연스러워 실제감이 떨어졌습니다. 물론 최신으로 나오는 Kling, SORA, Pika 등은 그런 부분들이 많이 개선되었습니다. 
  • 물리 법칙 이해 부족 : 물체의 움직임과 환경 간 상호작용이 어색했습니다. SORA조차도 처음 소개된 데모 영상에서 갑자기 없던 새끼 늑대들이 나타나거나 하는 경우가 있었습니다. 다른 AI 기술들에서는 그 보다 그런 케이스가 더 많았죠.  
  • 낮은 해상도 지원 : Full HD 이상의 고화질 영상 생성이 어려웠습니다. 그나마 가장 뛰어나다는 SORA가 1080p를 지원하는 수준이니까요. 

구글의 Veo2

Veo2는 이러한 문제점을 해결하기 위해 다음과 같은 특징을 갖도록 개발되었습니다. 물론 소개 영상이 체리피킹일 수도 있지만 일단 그걸 기준으로 하면 다음과 같은 것을 알 수 있습니다. 

  • 고도화된 디테일 재현 : 예를 들어 데모 영상에서는, 강아지의 털, 물결 파장, 빛 굴절 등 디테일한 표현 등이 지원되었습니다. 데모 영상에서 물결의 움직임 등을 보면 다른 경쟁 기술들 대비해도 엄청 자연스럽다는 것을 알 수 있습니다. 
  • 정확한 물리 법칙 구현 : 물체의 움직임과 환경 변화의 자연스러운 상호작용을 반영합니다. 
  • 4K 해상도 지원 : 업계 최초로 4K 화질 영상 생성 지원합니다. 이 부분은 다른 모델과 특히나 차별화되는 부분입니다. 

그림 : 타 모데과의 벤치마킹 비교

 

 

세부 적용 기술

  • 딥러닝 기반 렌더링 기술 : Veo2는 최신 딥러닝 모델을 활용해 복잡한 텍스처와 환경을 실시간으로 렌더링합니다. 덕분에 적용처가 훨씬 늘어날 수 있을 것 같습니다. 
  • 프롬프트 해석 엔진 개선 : 사용자의 텍스트 입력을 정교하게 해석하여 요구 사항을 정확히 반영합니다. 이는 김그륜님의 소개 영상을 보면 나오지만 동일한 프롬프트를 SORA 등에 적용해 봤을 때 나온 결과물의 차이에서 확인할 수 있습니다. 
  • 물리 엔진 통합 : 물리적 법칙을 기반으로 한 시뮬레이션을 통해 움직임과 환경 간의 자연스러운 조화를 구현합니다. 그만큼 현실감을 느낄 수 있다는 얘기가 되겠죠. 

 

적용 가능 산업 영역

  • 영화 산업 : AI가 영화의 CG 작업을 대체, 제작 비용 절감과 시간 단축 효과를 거둘 수 있습니다. 기존의 영화 산업 에코시스템이 상당한 타격을 받을 수도 있을 것입니다. 
  • 광고 제작 : 4K 화질의 고품질 광고 영상 제작에 활용될 수 있습니다. 광고는 길이가 짧고 시청자에게 단시간에 어필할 수 있는 강렬한 인상을 남겨야 하는데 창의력을 무한히 발휘할 수 있는 생성형 AI의 특성은 해당 분야에 아주 적합할 것입니다. 
  • 교육 및 연구 분야 : 가상 시뮬레이션을 통한 학습 자료 제작에도 활용될 수 있을 겁니다. 

 

 제약사항

  • 높은 연산 비용 : 고품질 영상을 생성하기 위한 컴퓨팅 리소스 필요할 수 있습니다.  다만, 이 허들은 고도화, 최적화된 모델들이 등장하고 있어 점차 낮아지고 있는 것 같습니다. 
  • 윤리적 논의 부족 : AI 콘텐츠의 저작권 문제 및 창작자 대체 우려가 있습니다. 이 부분은 여러 직능 단체에서 심각하게 고민해야 할 분야 같습니다. 
  • 사용 접근성 제한 : 일반 사용자들에게는 아직 고가의 서비스로 다가올 가능성이 높습니다. SORA의 경우, 2분 영상에 $2000

개인적인 생각

Veo2는 기존 AI 영상 생성 기술의 한계를 뛰어넘어, 디테일과 물리적 정확성, 그리고 고해상도 영상 생성에서 새로운 기준을 제시했습니다. 이를 통해 영화 및 영상 콘텐츠 제작에 혁신적인 변화를 가져올 가능성이 높습니다. 하지만, Veo2의 성능이 아무리 뛰어나더라도 높은 비용(아직은 정식공개 아님)과 윤리적 문제는 해결이 필요한 과제로 남아 있습니다. 이러한 문제를 극복하고 창작자의 대체가 아닌 보조자로서 기능한다면, Veo2는 영상 제작 분야에서 중요한 도구로 자리 잡게 될 것이며 앞으로도 더 많은 창작과 혁신을 이끌어낼 수 있을 것으로 기대됩니다. 


참고자료

  • Veo2 공식 사이트 링크 (링크)
  • 데모 영상 유튜브 리뷰 (김그륜, 모션 디자이너)

 


Q&A

Q. Veo2는 다른 AI와 비교해 어떤 점이 특별한가요?

Veo2는 디테일 표현, 물리 법칙의 정확한 구현, 4K 해상도 지원에서 다른 AI와 차별화됩니다.

Q2. Veo2가 영상 제작 전문가를 대체할 가능성이 있나요?

전문가를 완전히 대체하기보다는 보조 도구로 활용될 가능성이 높으며 이를 통해 창작 과정의 효율성을 높이는 데 기여할 것으로 보입니다. 하지만, 이 부분은 지켜볼 일입니다. 현재 발전 속도를 보면 충분히 가능성도 있다고 판단되기 때문입니다. 

Q. Veo2를 일반인이 사용할 수 있는 시점은 언제쯤인가요?

아직 공개된 데모 단계로, 상용화까지는 시간이 걸릴 것으로 예상됩니다.