| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
| 29 | 30 | 31 |
- 이미지 편집
- 음성 인식
- 멀티모달
- 딥러닝
- AI
- 감정 표현
- 자동화
- 오픈AI
- 강화학습
- 우분투
- OpenAI
- XAI
- 티스토리챌린지
- 트랜스포머
- tts
- 인공지능
- 메타
- PYTHON
- 바이브코딩
- ChatGPT
- 생성형AI
- 일론 머스크
- 확산 모델
- gaussian splatting
- AI 기술
- 오블완
- 음성합성
- 오픈소스
- LLM
- 이미지 생성
- Today
- Total
목록2026/03 (15)
AI 탐구노트
우리가 보던 기존의 영상 생성 AI는 꽤 그럴듯한 장면을 만들지만, 대부분은 '상상 속 세계'를 이어 붙이는 방식에 가깝습니다. 시작 장면이 실제 사진이어도, 그다음에 나오는 거리와 건물은 모델이 그럴듯하게 추측해 만든 경우가 많았죠. 그래서 보기에는 자연스러워도, '내가 아는 그 서울 거리'를 그대로 따라간다고 보긴 어려웠습니다. 이 논문은 바로 그 지점을 건드립니다. AI가 상상만 하는 것이 아니라, 실제 존재하는 도시를 바탕으로 영상을 만들 수 있을까를 묻습니다.이 질문은 생각보다 중요합니다. 단순히 멋진 영상을 만드는 수준을 넘어서, 도시 계획을 미리 시각화하거나, 자율주행 테스트 장면을 만들거나, 익숙한 동네를 다른 날씨나 재난 상황으로 가정해 보는 데까지 이어질 수 있기 때문입니다. 논문은 이..
사람이 카메라 앞에서 움직일 때, 컴퓨터가 그 모습을 보고 몸의 자세와 형태를 3차원으로 알아내는 기술은 생각보다 여러 곳에 쓰입니다. 예를 들면 가상현실, 스포츠 자세 분석, 재활, 로봇 원격 조종 같은 분야입니다. 그런데 이런 기술은 보통 정확도를 높이려다 보면 속도가 느려지고, 속도를 높이려다 보면 결과가 거칠어지는 문제가 자주 생깁니다. 결국 실제 서비스나 로봇 제어처럼 '지금 바로 반응해야 하는 상황'에서는 속도와 정확도를 함께 잡는 일이 가장 중요해집니다. 기존의 SAM 3D Body는 한 장의 RGB 이미지로 사람의 전신 3D 메쉬를 매우 잘 복원하지만, 처리 시간이 몇 초 수준이라 실시간 사용이 어렵습니다. Fast SAM 3D Body 모델은 기존 것을 새로 크게 뜯어고치기보다, 기존 파..
라즈베리파이 (Raspberry Pi) 4가 집에 하나 있어서 이를 이용해서 나만의 상시 동작시킬 수 있는 게임서버를 하나 만들어 보려고 합니다. 게임이래봤자 바이브코딩으로 만든 초단순 html 게임이 다이지만 이걸 집 바깥에서 돌리려니 서버가 있어야겠더라구요. 게다가 최근 AI Agent를 라즈베리파이에서도 돌린다는 이야기를 들었는데 이미지만 잘 만들어두면 그 용도로도 활용할 수 있겠다 싶었습니다. 이번 글에서는 라즈베리파이를 SD 카드에 설치하는 과정을 정리해 보겠습니다. 1. 라즈베리파이 개요라즈베리파이는 영국 Raspberry Pi Foundation이 교육용 컴퓨팅 보급을 목표로 시작한 초소형 컴퓨터 플랫폼입니다. 신용카드 크기 정도의 단일 보드 컴퓨터(SBC) 계열과, 별도의 마이크로컨트롤..
X에서 최신 글을 보다가 LightPanda라는 브라우저 소개글을 보게 됐습니다. 기존 크롬 headless의 문제점을 해결하고 AI Agent에 친화적인 브라우저를 개발하겠다는 야심찬 목표로 시작했다고 되어 있었죠. 아! 딱 시의적절한 타이밍에 잘 잡은 방향인 것 같다 싶었습니다. 바야흐로 현재는 AI Agent 시대입니다. AI Agent는 웹 자동화가 필요한데 Chrome headless는 무겁고 서버 비용이 많이 늘고 느리기까지 하죠 그래서, AI용 브라우저 엔진이 등장했습니다. (다만, 당연히 LightPanda가 처음은 아닙니다.) 오늘은 LightPanda에 대해 간략하게 조사한 내용을 정리해 보도록 하겠습니다. 1.LightPanda 개요LightPanda는 AI 에이전트와 자동화 시스템을..
컴퓨터 내의 파일을 찾아봐야 할 필요가 있을 때 사용할 수 있는 팁 하나 올립니다. 요약하면 다음과 같습니다. (이미 리눅스에 익숙한 분들은 다 아실텐데 혹시나 아직도 안 쓰시는 분을 위해... ^^;)find 커맨드를 사용하는 것보다 locate 커맨드를 이용하는 것이 훨씬 빠르고 편리하다 우분투를 사용하면서 가장 편리하다고 생각했던 것이 터미널 사용인데, 그 가운데서도 파일 검색을 할 때가 제일 생각납니다. 오랫동안 한 컴퓨터에서 많은 작업을 하다보면 정리되지 않은 수많은 파일들 때문에 고생할 때가 많습니다. 그런데 어느날 어... 그 파일이 어디에 있더라... 하는 순간 후딱 10~20분이 날아갑니다. 이 폴더 저 폴더 뒤져야만 하기 때문이죠. 예전에는 find를 루트부터 걸어서 검색하곤 했..
최근 인공지능 이미지 생성 기술은 빠르게 발전했습니다. 예전에는 이미지를 생성하는 데 많은 계산 단계가 필요했습니다. 하지만 최근에는 Few-Step Diffusion 모델이라는 방식이 등장하면서 훨씬 빠르게 이미지를 만들 수 있게 됐습니다. 몇 단계만으로도 사진처럼 자연스러운 이미지를 만들 수 있기 때문에 산업에서도 점점 많이 사용되고 있습니다. 하지만 속도가 빨라졌다고 해서 모든 문제가 해결된 것은 아닙니다. 예를 들어 텍스트 설명을 정확히 반영하지 못하거나, 이미지 속 객체의 위치가 틀리거나, 글자를 제대로 생성하지 못하는 문제가 여전히 존재합니다. 이러한 문제를 해결하기 위해 최근에는 강화학습(Reinforcement Learning)을 활용해 생성 모델의 품질을 개선하려는 연구가 진행되고 있습니..
최근 인공지능 기술은 단순히 질문에 답하는 수준을 넘어 실제 행동을 수행하는 단계로 발전하고 있습니다. 특히 LLM 기반 AI 에이전트는 코드 실행, 파일 시스템 접근, 이메일 송수신, 메신저 사용 등 다양한 도구와 연결되면서 점점 더 자율적으로 행동하는 시스템이 되고 있는데, 이런 변화는 업무 자동화나 연구 지원 같은 분야에서 큰 가능성을 보여줍니다. 하지만 자율성이 높아질수록 새로운 위험도 함께 등장하기 마련입니다. 이는 단순한 채팅 모델과 달리, 에이전트는 실제 시스템에 명령을 실행하거나 데이터를 변경할 수 있기 때문입니다. 예를 들어 잘못된 지시를 따르거나 권한을 오해하면 파일을 삭제하거나 민감한 정보를 유출하는 상황이 발생할 수도 있습니다. 이러한 문제는 단순한 모델 오류가 아니라 도구 사용,..
최근 마케팅 업계에서 자주 들리는 말이 있습니다. '이제 블로그 시대는 끝났다', '네이버가 무너지고 있다' 같은 이야기들이죠. 특히 최근 한 인터뷰 영상(참고자료 부분 참조)에서 AI 시대에 기존 블로그 마케팅 방식이 더 이상 통하지 않을 수 있다는 이야기가 나오면서 블로그 마케팅을 하고 있는 사람들의 관심을 끌었습니다. 하지만 그 내용을 조금 더 깊이 들여다보면 단순히 '블로그가 끝났다'는 이야기가 아니라, '블로그 마케팅의 방식이 바뀌고 있다'는 이야기입니다. 그리고 그 변화의 핵심에 있는 개념이 바로 AIO (AI Optimization) 입니다. 오늘 글에서는 AI 시대에 블로그 마케팅이 어떻게 변하고 있는지한국에서의 블로그 마케팅의 특징네이버와 글로벌 플랫폼의 차이그리고 앞으로 중요한 AIO..
최근 AI 에이전트 기술이 빠르게 발전하면서, 단순히 텍스트를 생성하거나 코드를 작성하는 수준을 넘어 실제 작업을 수행하는 방향으로 발전하고 있습니다. 하지만 대부분의 AI 에이전트는 여전히 터미널이나 브라우저 내부에 갇혀 있는 상태입니다. 이 상황에서 새롭게 등장한 해결사가 바로 GhostOS입니다. 엥? 수많은 OpenClaw 유사 솔루션 가운데 하나 아닌가 하며 의아해 할 수도 있을 것 같습니다. 하지만, 약간 차이가 있습니다. (자세한 것은 뒤에...) 이번 글에서는 GhostOS에 대해 간략하게 정리해 보고 가겠습니다. GhostOS1. 개요 GhostOS는 AI 에이전트가 macOS 환경에서 실제 애플리케이션을 직접 조작할 수 있도록 만들어진 오픈소스 프로젝트입니다. 이를 통해 AI는 더..
이번에는 단독 웹앱으로 별자리 보기 프로그램을 만들어 봤습니다. 예전에 스텔라리움에 대해 소개를 한 바 있습니다. 처음에 해당 프로그램을 써보고 우와... 이렇게 멋진~ 하면서 감동을 받은 바 있었죠. 별 관찰, 별자리 보기에 딱 좋은 프로그램이고 제공되는 수많은 기능이 있었기 때문입니다. 하지만, 어디까지나 내 프로그램이 아니기 때문에 원하는 간단한 기능 하나 추가할 수 없습니다. 게다가 너무 많은 기능을 가지고 있다보니 정말 단순한 커스텀 요건을 수용하도록 하기에는 어려움이 많죠. 그래서, 간단한 별자리 보기 프로그램을 만들고 거기에 내가 필요로 하는 기능을 추가할 수 있는 코드를 만들어봐야겠다 싶었습니다. 퀴즈나 아이 학습에 필요할 수도 있으니까요.별자리 보기 웹 프로그램 LLM이라는 도구를 사..
