일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 시간적 일관성
- tts
- 확산 모델
- TRANSFORMER
- 일론 머스크
- 강화 학습
- AI 기술
- 우분투
- LLM
- 다국어 지원
- 오블완
- 오픈AI
- ChatGPT
- 메타
- PYTHON
- 오픈소스
- 아두이노
- 실시간 렌더링
- 이미지 생성
- OpenAI
- ubuntu
- 티스토리챌린지
- OpenCV
- 휴머노이드 로봇
- 트랜스포머
- 인공지능
- 딥러닝
- LORA
- 생성형 AI
- AI
- Today
- Total
목록2025/04 (10)
AI 탐구노트

봄이 성큼 다가온 4월입니다. 벚꽃이 만개한 거리를 걷다 보면 문득, 사람마다 제각각 피어나는 사연이 있는 것 같다는 생각이 들어요. 오늘은 그런 ‘각자의 이야기’가 담겨 있는 탄생석에 대해 이야기해보려 합니다.탄생석, 단순한 보석이 아니라 '나를 상징하는 어떤 것'한 달 한 달을 대표하는 보석, 탄생석은 단지 예쁜 보석 그 이상입니다. 각 탄생석은 고유의 상징과 힘, 그리고 문화적인 이야기를 품고 있거든요. 예를 들어 1월의 석류석(Garnet)은 우정과 충성을, 9월의 사파이어(Sapphire)는 지혜와 고귀함을 의미한다고 하죠. 이처럼 탄생석은 오래전부터 사람들에게 ‘나를 상징하는 어떤 것’으로 여겨졌습니다. 탄생석의 유래와 역사그렇다면 이 탄생석은 언제부터 생긴 걸까요? 그 기원은 아주 오래전으로..

요즘 인공지능은 그림이나 영상도 척척 만들어냅니다. 심지어 '사자가 걷는 모습'이라고 글만 써도 사자가 걷는 영상을 뚝딱 만들어내는 시대가 되었죠. 그런데 이렇게 멋져 보이는 기술에도 허점이 있습니다. 예를 들어, 사자의 다리가 갑자기 사라진다든가, 땅을 뚫고 들어간다든가, 아니면 걷는 다리가 이상하게 꼬여서 보인다던지 실제라면 절대 일어나지 않을 이상한 일이 생깁니다. 왜 그럴까요? 기존 기술은 '그림처럼 보이는 장면'을 잘 만들어낼 수 있지만, '진짜 살아있는 듯한 움직임'을 만드는 건 아직 어려운 일이었어요. 그래서 UCLA와 NVIDIA 연구팀은 이 문제를 해결하기 위해 'AKD'라는 새로운 AI 기술을 만들었습니다. AKD는 '영상 속 동작을 배워서 3D 캐릭터에 적용하는 기술'입니다. 예를 들..

스마트폰 하나로도 고퀄리티의 영상 콘텐츠를 만들 수 있는 시대가 열리면서, 사람의 얼굴이나 몸동작을 애니메이션처럼 변환해주는 기술에 대한 관심이 커지고 있습니다. 예를 들어, 한 장의 얼굴 사진만으로 그 사람이 웃거나 말하는 것처럼 보이게 만들거나, 춤을 추게 만드는 기술이 그 예입니다. 이러한 기술은 광고나 영화 제작, 게임뿐 아니라 개인 콘텐츠 제작자들에게도 매우 매력적인 도구가 될 수 있습니다.하지만 이런 애니메이션 기술은 아직 몇 가지 어려운 과제들을 안고 있습니다. 특히 문제는 세 가지로 나눌 수 있습니다. 첫째, 눈 깜빡임이나 입술 떨림 같은 미세한 움직임까지 자연스럽게 재현하기 어렵다는 점입니다. 둘째, 상반신만 있는 이미지부터 전신 이미지까지 다양한 스케일을 하나의 모델로 자연스럽게 다루는..

가상현실(VR)과 증강현실(AR), 그리고 영화·게임 산업의 발전은 사실적인 3D 장면 생성 기술에 대한 수요를 급격히 증가시키고 있습니다. 이러한 요구를 충족시키기 위해 최근 주목받고 있는 기술 중 하나가 바로 Neural Radiance Field(NeRF)입니다. NeRF는 비교적 적은 데이터로도 정밀한 3D 장면을 재현할 수 있어, 학계와 산업계 모두에서 큰 관심을 받고 있습니다. 그러나 NeRF의 핵심 방식인 볼륨 렌더링은 렌더링 속도가 느려 실시간 처리가 필요한 응용 분야에서는 활용이 어려운 문제가 있습니다. 이와 대조적으로 3D Gaussian Splatting(3DGS)은 렌더링 속도 면에서 뛰어난 성능을 보이지만, 수백만 개의 3D 가우시안 데이터를 개별적으로 저장해야 하기 때문에 저장 ..

Anthropic은 최근 고등 교육 기관을 위한 맞춤형 AI 도구인 'Claude for Education'을 출시했습니다. 이 도구는 교육 분야에서 AI를 효과적으로 활용할 수 있도록 다양한 기능과 협력 프로그램을 제공합니다.Claude for Education의 주요 특징학습 모드(Learning mode) : Claude는 학생들에게 직접적인 답변을 제공하는 대신, "이 문제를 어떻게 접근하겠습니까?"와 같은 질문을 통해 사고 과정을 유도하며, "당신의 결론을 뒷받침하는 증거는 무엇인가요?"와 같은 소크라테스식 질문을 통해 비판적 사고 능력을 향상시킵니다.대학과의 협력 : Northeastern University, 런던정경대학(LSE), Champlain College와의 파트너십을 통해, 각 ..

봄꽃이 만개하려고 준비하는(?) 4월입니다. 바람이 살랑이는 요즘, 따뜻한 햇살 아래서 산책이라도 나서고 싶은 기분입니다. 사실 저희 동네에도 벚꽃길이 있지만 아직 꽃들은 꽃망울 터트릴 준비만 잔뜩 하고 있는 모양이라 금주 일요일이나 다음 주 월요일 정도나 되어야 꽃들이 만개하지 않을까 싶습니다. 이번 글에서는 최근 블로그를 운영하면서 스스로에게 던진 질문을 기록해보려고 합니다. 그동안 몇 개월 동안 블로그를 열심히 써왔지만, 찾아오는 사람은 생각보다 적었습니다. 뭐 그러려니 했죠. 메인 주제가 AI에 관한 것인데 일반 사람들은 크게 관심을 가지지도 않고 특히나 최근엔 유튜브 영상을 중심으로 보지, 글을 읽는 사람들이 많지 않으니까요. 그래도 꾸준히 쓰면 그래도 관심을 가지는 사람들이 조금씩은 생기겠지..

지난 번에 바이브 코딩을 통해 청기백기 게임을 만들어 보려고 했었죠. 하지만 DeepSite에서 사용한 DeepSeek가 아마도 청기백기 게임은 경험이 없었는지 상세하게 설명을 달아주지 않으면 생성을 못하는 것 같았습니다. 다른 것들은 정말 아주 짧은 한마디만으로도 멋드러지게 만들어줬는데 말이죠. 그래서, 청기백기 게임을 간단하게 만들어 보기로 했습니다. 먼저 청기백기 게임의 로직을 한번 만들어 봤습니다. 처음에는 깃발 구분, 액션 구분, 둘 간의 연결 등 개별적으로 따로 구조를 만들고 이를 조합하는 방식으로 구현하려고 했었는데 판정하는 것도 번거롭고 굳이 그럴 필요까지는 없을 것 같았습니다. 그래서, 나올 수 있는 지시어를 전부 명시하는 방식으로 접근했습니다. 청기백기 게임의 기본 로직 구현나올 수..

현대의 자율주행 기술은 놀라운 속도로 발전하고 있지만, 여전히 넘어야 할 큰 장벽이 존재합니다. 그 중에서도 가장 중요한 문제 중 하나는 현실적인 운전 시나리오의 시뮬레이션입니다. 현실 세계에서 데이터를 수집하는 것은 시간과 비용이 많이 들 뿐만 아니라, 드물고 위험한 상황을 반복적으로 수집하는 것은 사실상 불가능합니다. 이러한 한계를 극복하기 위해 최근 인공지능 분야에서는 생성형 모델, 특히 비디오 생성 모델을 활용한 가상 세계 시뮬레이션이 주목받고 있습니다. 하지만 일반적인 생성형 비디오 모델은 자율주행의 고유한 요구사항 (예를 들어 다중 에이전트 간의 상호작용, 시간적·공간적 일관성, 그리고 여러 카메라 뷰의 조화 등)을 만족시키기 어렵습니다. 이러한 현실적인 문제를 해결하기 위해 제안된 모델이 바..

지난 번에 아래 글을 작성하면서 조사를 한 터라 바이브 코딩이 어떤 것인지는 대충 알게 됐습니다. 바이브코딩(Vibe Coding) : AI가 바꾸는 개발의 미래와 인간 개발자의 역할최근 실리콘밸리에서 '바이브코딩(Vibe Coding)'이라는 용어가 화제입니다. 이는 생성 인공지능(AI)을 활용한 코딩을 의미하며, 스타트업부터 빅테크까지 산업 전반에 걸쳐 혁신을 예고하고 있습니42morrow.tistory.com 그래도, 아는 것보다 체험해 보는 것이 중요하다 싶더군요. 예전에도 ChatGPT를 이용해서 다양한 게임을 만들어 봤던터라 크게 다르지 않겠지, 작성된 코드를 제대로 동작하도록 만들기 위해서는 그래도 숨은 시행착오가 많이 생길 수 밖에 없겠지 하는 약간은 낮은 기대 수준을 가지고 시작했죠. ..

현대 사회에서 메타버스와 같은 가상 공간은 점점 더 중요한 산업으로 자리잡고 있습니다. 특히 증강현실(AR), 가상현실(VR), 게임, 영화 산업에서는 현실과 유사한 인간 아바타를 빠르게 생성하고 이를 애니메이션화하는 기술이 핵심입니다. 과거에는 이와 같은 작업을 위해 다각도의 촬영, 정밀한 센서, 오랜 후처리 시간이 필요했지만, 최근 AI 기술의 급속한 발전은 단 한 장의 이미지로 3D 아바타를 생성하려는 시도를 가능하게 만들고 있습니다. 하지만 단일 이미지로 3D 아바타를 생성하는 것은 여전히 큰 도전입니다. 사람의 형태, 옷의 주름, 얼굴의 정밀한 표정까지 재현하려면 높은 수준의 공간적 추론과 표현력이 필요하기 때문입니다. LHM(Large Animatable Human Reconstruction ..