일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 아두이노
- 멀티모달
- 휴머노이드 로봇
- LORA
- 우분투
- TRANSFORMER
- 오픈AI
- AI
- 트랜스포머
- 딥러닝
- PYTHON
- 오픈소스
- OpenCV
- OpenAI
- 확산 모델
- ChatGPT
- 생성형 AI
- 실시간 렌더링
- 다국어 지원
- 메타
- 티스토리챌린지
- AI 기술
- 강화 학습
- 이미지 생성
- tts
- 일론 머스크
- 오블완
- LLM
- 시간적 일관성
- 인공지능
- Today
- Total
목록전체 글 (572)
AI 탐구노트

메타(Meta)는 최근 새로운 인공지능(AI) 모델 시리즈인 Llama 4를 발표했습니다. 이 시리즈는 Llama 4 Scout, Llama 4 Maverick, 그리고 아직 훈련 중인 Llama 4 Behemoth로 구성되어 있습니다. 이번 글에서는 간략하게 Llama 4 모델의 출시 소식을 정리해 보겠습니다. Llama 4의 모델 구성모델 이름총 파라미터 수활성 파라미터 수주요 특징Llama 4 Scout109B (1,090억)1.7B (17억)단일 H100 GPU에서 실행 가능, 1,000만 토큰 컨텍스트 윈도우 지원Llama 4 Maverick400B (4,000억)1.7B (17억)고성능 대형 모델, GPT-4o 수준의 성능, 추론 효율성 우수Llama 4 Behemoth2T (2조)288B (..

우분투를 사용하다가 부팅이 되지 않는 오류가 가끔 발생합니다. 정상적으로 사용했을 때가 아니라 이래저래 뭔가를 바꿔보는 시행착오를 하다가 발생하는 경우가 대부분이죠. 제 경우는 특히 그래픽카드 드라이버 관련 사항을 건드리면서 맞딱뜨리게 되는 경우가 많았습니다. AI 사용을 위해 CUDA 환경 구성을 이 버전 저 버전을 막 굴리다 보니 그렇게 되더라구요. 어찌됐건... 그럴 때마다 이유를 모르고 맨땅에 헤딩하며 복구에 전념하기 일쑤였는데, 한번은 정리를 해놓고 가야할 것 같아서 조사를 해 봤습니다. Ubuntu 24.04 부팅 실패 원인워낙 다양한 원인이 가능합니다. 이건 우분투라서 그런 것도 아니고 버전 문제도 아니죠. 윈도우에서도 가끔씩 겪게 되는 일이니 말입니다. 대략적인 부팅 실패 원인은 다음과 ..

봄이 성큼 다가온 4월입니다. 벚꽃이 만개한 거리를 걷다 보면 문득, 사람마다 제각각 피어나는 사연이 있는 것 같다는 생각이 들어요. 오늘은 그런 ‘각자의 이야기’가 담겨 있는 탄생석에 대해 이야기해보려 합니다.탄생석, 단순한 보석이 아니라 '나를 상징하는 어떤 것'한 달 한 달을 대표하는 보석, 탄생석은 단지 예쁜 보석 그 이상입니다. 각 탄생석은 고유의 상징과 힘, 그리고 문화적인 이야기를 품고 있거든요. 예를 들어 1월의 석류석(Garnet)은 우정과 충성을, 9월의 사파이어(Sapphire)는 지혜와 고귀함을 의미한다고 하죠. 이처럼 탄생석은 오래전부터 사람들에게 ‘나를 상징하는 어떤 것’으로 여겨졌습니다. 탄생석의 유래와 역사그렇다면 이 탄생석은 언제부터 생긴 걸까요? 그 기원은 아주 오래전으로..

요즘 인공지능은 그림이나 영상도 척척 만들어냅니다. 심지어 '사자가 걷는 모습'이라고 글만 써도 사자가 걷는 영상을 뚝딱 만들어내는 시대가 되었죠. 그런데 이렇게 멋져 보이는 기술에도 허점이 있습니다. 예를 들어, 사자의 다리가 갑자기 사라진다든가, 땅을 뚫고 들어간다든가, 아니면 걷는 다리가 이상하게 꼬여서 보인다던지 실제라면 절대 일어나지 않을 이상한 일이 생깁니다. 왜 그럴까요? 기존 기술은 '그림처럼 보이는 장면'을 잘 만들어낼 수 있지만, '진짜 살아있는 듯한 움직임'을 만드는 건 아직 어려운 일이었어요. 그래서 UCLA와 NVIDIA 연구팀은 이 문제를 해결하기 위해 'AKD'라는 새로운 AI 기술을 만들었습니다. AKD는 '영상 속 동작을 배워서 3D 캐릭터에 적용하는 기술'입니다. 예를 들..

스마트폰 하나로도 고퀄리티의 영상 콘텐츠를 만들 수 있는 시대가 열리면서, 사람의 얼굴이나 몸동작을 애니메이션처럼 변환해주는 기술에 대한 관심이 커지고 있습니다. 예를 들어, 한 장의 얼굴 사진만으로 그 사람이 웃거나 말하는 것처럼 보이게 만들거나, 춤을 추게 만드는 기술이 그 예입니다. 이러한 기술은 광고나 영화 제작, 게임뿐 아니라 개인 콘텐츠 제작자들에게도 매우 매력적인 도구가 될 수 있습니다.하지만 이런 애니메이션 기술은 아직 몇 가지 어려운 과제들을 안고 있습니다. 특히 문제는 세 가지로 나눌 수 있습니다. 첫째, 눈 깜빡임이나 입술 떨림 같은 미세한 움직임까지 자연스럽게 재현하기 어렵다는 점입니다. 둘째, 상반신만 있는 이미지부터 전신 이미지까지 다양한 스케일을 하나의 모델로 자연스럽게 다루는..

가상현실(VR)과 증강현실(AR), 그리고 영화·게임 산업의 발전은 사실적인 3D 장면 생성 기술에 대한 수요를 급격히 증가시키고 있습니다. 이러한 요구를 충족시키기 위해 최근 주목받고 있는 기술 중 하나가 바로 Neural Radiance Field(NeRF)입니다. NeRF는 비교적 적은 데이터로도 정밀한 3D 장면을 재현할 수 있어, 학계와 산업계 모두에서 큰 관심을 받고 있습니다. 그러나 NeRF의 핵심 방식인 볼륨 렌더링은 렌더링 속도가 느려 실시간 처리가 필요한 응용 분야에서는 활용이 어려운 문제가 있습니다. 이와 대조적으로 3D Gaussian Splatting(3DGS)은 렌더링 속도 면에서 뛰어난 성능을 보이지만, 수백만 개의 3D 가우시안 데이터를 개별적으로 저장해야 하기 때문에 저장 ..

Anthropic은 최근 고등 교육 기관을 위한 맞춤형 AI 도구인 'Claude for Education'을 출시했습니다. 이 도구는 교육 분야에서 AI를 효과적으로 활용할 수 있도록 다양한 기능과 협력 프로그램을 제공합니다.Claude for Education의 주요 특징학습 모드(Learning mode) : Claude는 학생들에게 직접적인 답변을 제공하는 대신, "이 문제를 어떻게 접근하겠습니까?"와 같은 질문을 통해 사고 과정을 유도하며, "당신의 결론을 뒷받침하는 증거는 무엇인가요?"와 같은 소크라테스식 질문을 통해 비판적 사고 능력을 향상시킵니다.대학과의 협력 : Northeastern University, 런던정경대학(LSE), Champlain College와의 파트너십을 통해, 각 ..

봄꽃이 만개하려고 준비하는(?) 4월입니다. 바람이 살랑이는 요즘, 따뜻한 햇살 아래서 산책이라도 나서고 싶은 기분입니다. 사실 저희 동네에도 벚꽃길이 있지만 아직 꽃들은 꽃망울 터트릴 준비만 잔뜩 하고 있는 모양이라 금주 일요일이나 다음 주 월요일 정도나 되어야 꽃들이 만개하지 않을까 싶습니다. 이번 글에서는 최근 블로그를 운영하면서 스스로에게 던진 질문을 기록해보려고 합니다. 그동안 몇 개월 동안 블로그를 열심히 써왔지만, 찾아오는 사람은 생각보다 적었습니다. 뭐 그러려니 했죠. 메인 주제가 AI에 관한 것인데 일반 사람들은 크게 관심을 가지지도 않고 특히나 최근엔 유튜브 영상을 중심으로 보지, 글을 읽는 사람들이 많지 않으니까요. 그래도 꾸준히 쓰면 그래도 관심을 가지는 사람들이 조금씩은 생기겠지..

지난 번에 바이브 코딩을 통해 청기백기 게임을 만들어 보려고 했었죠. 하지만 DeepSite에서 사용한 DeepSeek가 아마도 청기백기 게임은 경험이 없었는지 상세하게 설명을 달아주지 않으면 생성을 못하는 것 같았습니다. 다른 것들은 정말 아주 짧은 한마디만으로도 멋드러지게 만들어줬는데 말이죠. 그래서, 청기백기 게임을 간단하게 만들어 보기로 했습니다. 먼저 청기백기 게임의 로직을 한번 만들어 봤습니다. 처음에는 깃발 구분, 액션 구분, 둘 간의 연결 등 개별적으로 따로 구조를 만들고 이를 조합하는 방식으로 구현하려고 했었는데 판정하는 것도 번거롭고 굳이 그럴 필요까지는 없을 것 같았습니다. 그래서, 나올 수 있는 지시어를 전부 명시하는 방식으로 접근했습니다. 청기백기 게임의 기본 로직 구현나올 수..

현대의 자율주행 기술은 놀라운 속도로 발전하고 있지만, 여전히 넘어야 할 큰 장벽이 존재합니다. 그 중에서도 가장 중요한 문제 중 하나는 현실적인 운전 시나리오의 시뮬레이션입니다. 현실 세계에서 데이터를 수집하는 것은 시간과 비용이 많이 들 뿐만 아니라, 드물고 위험한 상황을 반복적으로 수집하는 것은 사실상 불가능합니다. 이러한 한계를 극복하기 위해 최근 인공지능 분야에서는 생성형 모델, 특히 비디오 생성 모델을 활용한 가상 세계 시뮬레이션이 주목받고 있습니다. 하지만 일반적인 생성형 비디오 모델은 자율주행의 고유한 요구사항 (예를 들어 다중 에이전트 간의 상호작용, 시간적·공간적 일관성, 그리고 여러 카메라 뷰의 조화 등)을 만족시키기 어렵습니다. 이러한 현실적인 문제를 해결하기 위해 제안된 모델이 바..