일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- LLM
- 오블완
- 딥러닝
- 트랜스포머
- 생성형 AI
- TRANSFORMER
- 티스토리챌린지
- ubuntu
- 우분투
- LORA
- OpenCV
- 시간적 일관성
- PYTHON
- 오픈AI
- 확산 모델
- tts
- nvidia
- 일론 머스크
- 다국어 지원
- 인공지능
- ChatGPT
- 아두이노
- 강화 학습
- 오픈소스
- AI 기술
- AI
- OpenAI
- 메타
- 이미지 생성
- 휴머노이드 로봇
- Today
- Total
목록AI 기술 (242)
AI 탐구노트

현대의 자율주행 기술은 놀라운 속도로 발전하고 있지만, 여전히 넘어야 할 큰 장벽이 존재합니다. 그 중에서도 가장 중요한 문제 중 하나는 현실적인 운전 시나리오의 시뮬레이션입니다. 현실 세계에서 데이터를 수집하는 것은 시간과 비용이 많이 들 뿐만 아니라, 드물고 위험한 상황을 반복적으로 수집하는 것은 사실상 불가능합니다. 이러한 한계를 극복하기 위해 최근 인공지능 분야에서는 생성형 모델, 특히 비디오 생성 모델을 활용한 가상 세계 시뮬레이션이 주목받고 있습니다. 하지만 일반적인 생성형 비디오 모델은 자율주행의 고유한 요구사항 (예를 들어 다중 에이전트 간의 상호작용, 시간적·공간적 일관성, 그리고 여러 카메라 뷰의 조화 등)을 만족시키기 어렵습니다. 이러한 현실적인 문제를 해결하기 위해 제안된 모델이 바..

현대 사회에서 메타버스와 같은 가상 공간은 점점 더 중요한 산업으로 자리잡고 있습니다. 특히 증강현실(AR), 가상현실(VR), 게임, 영화 산업에서는 현실과 유사한 인간 아바타를 빠르게 생성하고 이를 애니메이션화하는 기술이 핵심입니다. 과거에는 이와 같은 작업을 위해 다각도의 촬영, 정밀한 센서, 오랜 후처리 시간이 필요했지만, 최근 AI 기술의 급속한 발전은 단 한 장의 이미지로 3D 아바타를 생성하려는 시도를 가능하게 만들고 있습니다. 하지만 단일 이미지로 3D 아바타를 생성하는 것은 여전히 큰 도전입니다. 사람의 형태, 옷의 주름, 얼굴의 정밀한 표정까지 재현하려면 높은 수준의 공간적 추론과 표현력이 필요하기 때문입니다. LHM(Large Animatable Human Reconstruction ..

가상현실(VR), 증강현실(AR), 3D 게임 그래픽 등에서 생생하고 사실적인 장면을 실시간으로 구현하는 기술은 날로 중요해지고 있습니다. 이러한 기술들은 대부분 시간에 따라 변하는 장면, 즉 '동적 장면'을 빠르고 정확하게 렌더링(rendering)하는 것을 목표로 합니다. 지금까지는 Neural Radiance Fields(NeRF)라는 기술이 주로 활용되어 왔지만, 이 방식은 처리 속도가 느리고 자원 소모가 커서 현실적인 적용에는 한계가 있었습니다. 최근에는 NeRF의 단점을 보완하기 위한 새로운 방식들이 등장하고 있으며, 그 중 하나가 바로 4D Gaussian Splatting(4DGS)입니다. 이 방식은 수많은 '가우시안 점'을 활용해 4차원(3D 공간 + 시간)의 정보를 표현하는 기술입니다...

최근 몇 년 사이, 영화 제작, 게임, 증강현실(AR), 가상현실(VR), 휴머노이드 로봇 등 다양한 분야에서 사람의 움직임을 디지털로 재현하고 생성하는 기술이 주목받고 있습니다. 특히 인공지능의 발전과 함께 사람의 동작을 텍스트나 음악과 같은 다양한 조건으로부터 생성하는 기술이 현실로 다가오고 있습니다. 이러한 배경 속에서 'Motion Anything'이라는 모델은 한 발 더 나아가, 조건 기반 모션 생성의 새로운 패러다임을 제시하고 있습니다. 지금까지 대부분의 모션 생성 기술은 텍스트나 음악과 같은 한 가지 조건에만 기반해 동작을 만들어왔습니다. 하지만 현실 세계의 움직임은 단순한 단일 조건만으로 설명되기 어렵습니다. 예를 들어, 어떤 사람이 "왼손을 들며 음악 박자에 맞춰 걷는다"라는 행동을 한다..

디지털 콘텐츠 제작 기술이 발전함에 따라, 단 한 장의 사진과 음성만으로 실제 사람처럼 자연스럽게 말하는 얼굴 영상을 생성하는 기술이 주목받고 있습니다. 이 기술은 가상현실(VR), 디지털 휴먼, 영화 및 게임 제작에 활용되며, 콘텐츠의 몰입감을 크게 향상시킬 수 있습니다. 특히 사람의 입 모양이 음성과 정확히 맞아떨어지고, 고개 움직임이나 표정 변화까지 자연스럽다면, 사람들은 인공지능 캐릭터를 실제 인물처럼 느끼게 됩니다. 하지만 지금까지의 연구는 주로 입 모양 동기화(lip-sync)에만 집중해 왔기 때문에, 고개 움직임이 거의 없거나 표정이 단조로운 영상이 생성되기 일쑤였습니다. 최근에는 입 모양뿐 아니라 고개 움직임, 눈동자 방향, 미세한 표정 변화까지 반영된 더 현실적인 얼굴 애니메이션이 요구되..

요즘 가상 인간(디지털 휴먼) 기술이 주목받고 있습니다. 예를 들어, 온라인 쇼핑에서 실제 사람처럼 제품을 소개하는 가상 모델이나, 가상 회의에서 사람처럼 움직이며 말하는 아바타가 점점 많아지고 있죠. 이런 아바타를 만들기 위해서는 사실적인 얼굴 표정, 자연스러운 몸짓, 그리고 다양한 의상을 표현할 수 있어야 합니다. 그런데 이런 기능을 다 넣으면서도 스마트폰이나 AR 안경처럼 성능이 낮은 기기에서 실시간으로 동작하게 만드는 건 쉽지 않은 일이죠. 그러다보니 기존의 기술은 얼굴만 표현하거나, 컴퓨터에서만 작동하는 복잡한 방식이 많았습니다. 이런 문제를 해결하기 ㅜ이해 'TaoAvatar'라는 새로운 방법이 소개되었습니다. 이 방법은 전체 몸을 사실적으로 표현하고, 다양한 표정과 제스처까지 보여줄 수 있으..

요즘 날씨가 점점 극단적으로 변하면서 갑작스런 폭우나 가뭄 같은 문제가 자주 생기고 있습니다. 이런 기후 문제에 잘 대응하려면 강이나 하천의 물 흐름을 빠르게 파악하고 관리하는 기술이 꼭 필요합니다. 그중에서도 '물 위를 흐르는 속도'를 알 수 있는 기술은 특히 중요하죠. 왜냐하면 홍수가 얼마나 빠르게 올지 예측하거나, 하천이 침식되는 걸 막는 데 큰 도움이 되기 때문입니다. 지금까지는 센서를 물에 직접 넣거나 장비를 띄워서 속도를 측정하는 방식이 대부분이었는데, 이건 비용도 많이 들고 측정할 때 위험하기도 합니다. 그래서 요즘엔 '카메라로 찍은 영상'을 분석해서 물의 흐름 속도를 알아내는 기술들이 등장했습니다. RivVideoFlow는 이런 영상 기반 기술 중 하나인데, 복잡한 설정 없이도 빠르고 정..

우리가 사는 세상을 컴퓨터 속에서 그대로 재현하는 기술은 자율주행차, 게임, 로봇 등 다양한 분야에서 꼭 필요합니다. 이때 가장 많이 쓰이는 방법 중 하나가 ‘여러 장의 사진’을 이용해 실제 공간의 모양을 3D로 복원하는 기술입니다. 하지만 이 방식은 계산이 복잡하고, 비슷한 각도에서 찍은 사진이 많아야 잘 작동합니다. 그런데 최근에는 한 장의 사진만으로도 그 안에 담긴 거리(깊이)를 알아내는 '단안 깊이 추정(Monocular Depth Estimation)' 기술이 빠르게 발전하고 있죠. 여기에 'Diffusion Model'이라는 똑똑한 인공지능이 등장하면서, 한 장의 사진만으로도 꽤 정확한 3D 정보를 만들어낼 수 있게 되었습니다. 이러한 최신 기술들을 조합해서 만든 새로운 방법이 'Murre'입..

요즘 SNS에서 '셀카를 디즈니 공주처럼 바꿔주는 필터'나 '내 얼굴로 영화 속 장면을 재현해주는 앱'들이 인기를 끌고 있습니다. 이처럼 사용자의 얼굴을 유지하면서도 다양한 스타일이나 배경으로 이미지를 바꾸는 기술을 '정체성 보존 이미지 생성(Identity-preserved Image Generation)'이라고 합니다. 하지만, 이 기술은 생각보다 쉽지 않습니다. 얼굴은 그대로인데 옷, 배경, 포즈 등은 자유롭게 바꾸려면 AI에게 꽤나 어려운 주문이기 때문이죠. 최근에는 이미지 생성 기술 중에서도 특히 '디퓨전 트랜스포머(Diffusion Transformers, DiTs)'라는 강력한 모델들이 떠오르고 있습니다. 이 모델들은 매우 정밀하고 아름다운 이미지를 만들어낼 수 있어서 예술, 디자인, 광고 ..

최근 인공지능 기술은 단순한 이미지 생성에서 나아가, 3D 객체와 장면까지 자동으로 생성해내는 수준에 도달했습니다. 특히 게임, 메타버스, 시뮬레이션, 영화 특수효과 등에서 고품질 3D 콘텐츠에 대한 수요는 꾸준히 증가하고 있습니다. 그러나 이처럼 정교한 3D 세상을 만드는 일은 여전히 시간과 비용이 많이 드는 작업입니다. 그렇기 때문에 인공지능 기술을 활용해 이를 자동화하고, 창의적인 작업에 더 많은 시간을 쓸 수 있도록 하는 시도가 활발히 이어지고 있습니다. 특히 주목할 만한 점은, 최근에는 텍스트만 입력하면 AI가 상상력을 발휘해 3D 공간을 생성해주는 기술들이 속속 등장하고 있다는 점입니다. 그러나 기존의 많은 기술들은 개별 객체 생성에 머물거나, 생성된 공간이 정적인 '버블'에 가깝다는 한계를 ..