| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
- 트랜스포머
- 이미지 생성
- AI 기술
- 감정 표현
- 인공지능
- 멀티모달
- 자동화
- 이미지 편집
- 메타
- 일론 머스크
- 음성합성
- 오픈AI
- OpenAI
- 오블완
- 티스토리챌린지
- PYTHON
- 오픈소스
- 우분투
- 강화학습
- ChatGPT
- 확산 모델
- gaussian splatting
- 바이브코딩
- 딥러닝
- LLM
- XAI
- 음성 인식
- tts
- 생성형AI
- AI
- Today
- Total
목록AI (28)
AI 탐구노트
최근 AI 에이전트 기술이 빠르게 발전하면서, 단순히 텍스트를 생성하거나 코드를 작성하는 수준을 넘어 실제 작업을 수행하는 방향으로 발전하고 있습니다. 하지만 대부분의 AI 에이전트는 여전히 터미널이나 브라우저 내부에 갇혀 있는 상태입니다. 이 상황에서 새롭게 등장한 해결사가 바로 GhostOS입니다. 엥? 수많은 OpenClaw 유사 솔루션 가운데 하나 아닌가 하며 의아해 할 수도 있을 것 같습니다. 하지만, 약간 차이가 있습니다. (자세한 것은 뒤에...) 이번 글에서는 GhostOS에 대해 간략하게 정리해 보고 가겠습니다. GhostOS1. 개요 GhostOS는 AI 에이전트가 macOS 환경에서 실제 애플리케이션을 직접 조작할 수 있도록 만들어진 오픈소스 프로젝트입니다. 이를 통해 AI는 더..
지난 번에 Whisper와 Supertone을 이용한 퀴즈 웹앱을 만들어 봤었습니다. 아무래도 동시 사용자가 많아지면 서버 쪽 부하 때문에 신속한 서비스를 하기에는 무리가 있어 보였습니다. 그래서 이번에는 외부 AI 모델을 사용하지 않고 크롬 브라우저에서 자체 지원되는 Speech Recognition API와 내장 TTS 기능을 이용해서, 스마트폰 한 대로 서로 다른 언어를 사용하는 사람들끼리 대화하는 것을 도와주는 웹앱을 만들어봤습니다. 동시 통역 웹앱1.개요두 사람 간의 단독 대화를 위한 초간단 동시 통역(번역!) 서비스입니다.스마트폰(혹은 랩톱)만 있으면 손쉽게 사용할 수 있게 하는 것이 목표입니다.높은 음성 품질, 많은 기능 등은 절대 추구하지 않습니다. 가성비와 적정기술이 최고라 믿습니다!2..
Anthropic이 Claude Code를 공개했습니다. 이전까지만 해도 Claude 모델의 API를 이용하도록 되어 있던 것이었습니다. 최근 비슷한 방식으로 사용할 수 있는 오픈소스 도구가 많이 나오면서 위기를 느끼고 기존의 개발자들이 자기들의 생태계에 계속 머물도록 하려는 의도로 공개한 것으로 판단되고 있습니다. 이번 글에서는 Claude Code가 어떤 것인지 짧게 정리해보고 넘어가겠습니다. 다음 번 글에서는 로컬에 설치해서 이것저것 몇 가지 간단한 것을 만들어보는 것까지 해 보겠습니다. Claude Code 1.개요 최근 AI를 활용한 개발 도구가 많아졌지만 대부분은 웹 화면이나 IDE 플러그인 형태로 제공됩니다. 그런데 Claude Code는 조금 다릅니다. Claude Code는 Anthr..
공개된 모델과 서비스를 이용해 짧은 영상을 한번 만들어 봤습니다. Grok, SORA나 Nano Banana 등을 사용 중이라면 그것을 이용해서 이미지, 영상을 생성하면 되겠죠. 여기서는 그런 것들이 없다고 가정하고 오픈소스로 공개된 모델만 이용하는 것으로 했습니다. 그리고, 이왕이면 생성에 소요되는 시간이 짧은 모델들을 선정했구요. 사용한 모델은 다음과 같습니다. 이미지 생성 : Z-Image Turbo영상 생성 : Wan2-2-i2v (with rCM LoRA) 1.이미지 생성 1) 이미지 생성모델 : Z-Image-Turbo 이용 (데모 링크)프롬프트 : "A dramatic cinematic scene of pirates on a ship in a stormy, wave-tossed ocea..
우연히 생성형 AI 모델을 이용해 예술 작품을 만드는 분의 유튜브 채널을 하나 알게 되었습니다. '우와 신기하네~ 하나만 볼까?' 하다가 순식간에 30여개 영상을 이어서 보게 됐죠. AI로 만든 영상임을 알고 봤지만 색감이나 표현법 등이 너무 멋져서 간단히 사이트 링크만 소개하고 넘어가겠습니다. bandyquantguyI work with LLMs to create, learn, teach, and research. If you'd like to support my work, considering joining my patreon at https://patreon.com/bandyquantguy.www.youtube.com 멋진 작품들이 잔뜩 있는데 의외로 조회수가 너무 적더군요. 왜? 라는 생각..
이번에는 바이브코딩으로 크로스워드 퍼즐 생성기를 만들어 봤습니다. 물론 다른 사례와 비슷하게 컨텐츠 만들 때 써먹기 위한 용도입니다. 기억을 되살려보면, 작년 11월에 수작업으로 십자말풀이 게임이라는 이름으로 만들어 보긴 했었습니다. 아래는 당시 글의 링크입니다. 2024.11.15 - [DIY 테스트] - 십자말풀이 게임 생성 테스트2024.11.15 - [DIY 테스트] - 한글 십자말풀이 게임 도구 만들기 이때는 틀을 자동으로 만들려다가 어려울 것 같아서 단어를 틀에 직접 입력해서 레이아웃을 만들고 여기에 사용된 단어들을 AI가 문제로 만들어서 입력하는 방식으로 개발했었습니다. 실무에서 사용하기에는 이게 더 나을 수도 있겠다 싶었거든요. 이번에는 처음부터 끝까지 AI를 활용해서 자동화하도록 합니다..
한 때 자신만의 손글씨 폰트를 제작하는 열풍이 분 적이 있었습니다. 국내에서는 네이버와 보이저엑스에서 사람들의 신청을 받아서 손글씨를 AI 기술을 이용해 개인 폰트를 만들어주기도 했습니다. 보이저엑스의 경우, 현재는 중단했지만 '온글잎'이라는 이름으로 상용으로 제작 서비스를 제공하고도 했구요. 당시 이런 서비스들을 보면서 저도 '우와, 저런 건 나도 해 보고 싶다' 하는 생각을 가졌었더랬습니다. 하지만, 해 볼 수 있는 장비도 없고 능력치 밖이다 싶어서 관심만 가지고 있었죠. 그러다 몇 년이 지났습니다. 이것저것 평소에 만들어 보고 싶던 것들을 하나씩 해 보면서 정리하다보니 그때 해 봐야지 하며 기록해 둔 목록이 있어 다시 꺼내 봅니다. ^^ 1. 자신만의 폰트 제작1.1.폰트의 중요성폰트는 우리가 ..
VLM (Vision Language Model)이란?VLM은 Vision Language Model의 약자로, 이미지와 텍스트를 동시에 이해하고 처리할 수 있는 인공지능(AI) 모델입니다. 쉽게 말해, 사진을 보고 그 내용을 설명하거나, 텍스트를 바탕으로 이미지를 이해하고 질문에 답할 수 있는 기술이죠. 인간이 눈으로 보고 머리로 이해하는 것처럼, VLM은 시각 정보(이미지)와 언어 정보(텍스트)를 함께 학습해 다재다능하게 작동합니다. VLM 의 주요 특징은? 1️⃣ 이미지와 텍스트를 통합적으로 이해텍스트만 처리하는 언어 모델(예: GPT)과 달리, VLM은 이미지 속 객체, 장면, 행동 등을 분석할 수 있습니다.예) 사진 속 고양이를 보고 "이 동물은 무엇인가요?"라는 질문에 "고양이입니다"라고 답..
봄꽃이 만개하려고 준비하는(?) 4월입니다. 바람이 살랑이는 요즘, 따뜻한 햇살 아래서 산책이라도 나서고 싶은 기분입니다. 사실 저희 동네에도 벚꽃길이 있지만 아직 꽃들은 꽃망울 터트릴 준비만 잔뜩 하고 있는 모양이라 금주 일요일이나 다음 주 월요일 정도나 되어야 꽃들이 만개하지 않을까 싶습니다. 이번 글에서는 최근 블로그를 운영하면서 스스로에게 던진 질문을 기록해보려고 합니다. 그동안 몇 개월 동안 블로그를 열심히 써왔지만, 찾아오는 사람은 생각보다 적었습니다. 뭐 그러려니 했죠. 메인 주제가 AI에 관한 것인데 일반 사람들은 크게 관심을 가지지도 않고 특히나 최근엔 유튜브 영상을 중심으로 보지, 글을 읽는 사람들이 많지 않으니까요. 그래도 꾸준히 쓰면 그래도 관심을 가지는 사람들이 조금씩은 생기겠지..
다음 내용은 경제 분야 유튜브 내용들을 가지고 AI를 이용해 요약 정리한 것입니다. 1. 방산 및 국방 산업방산주 및 국방비 확대방산 대장주들이 국방비 793조 예산 통과와 글로벌 지정학 리스크 속에서 지속적으로 강세를 보일 전망입니다. 한화 에어로스페이스, 현대로템, LIG 넥스원 등 주요 방산주에 대한 투자 의견이 제시되고 있으며, ETF 및 패시브 자금 유입이 섹터 전반의 상승 모멘텀을 이끌 것으로 분석됩니다.2. 글로벌·미국 경제 동향미국 경제의 구조적 변화워렌 버핏의 포트폴리오 조정, 미국의 부채 문제 및 국가 부채 증가, 파산 증가 등 미국 경제의 불안정성이 여러 기사에서 언급됩니다. 동시에 미국 내 인플레이션 우려와 금리 정책, 셧다운 우려 해소, 나스닥 반등 등 단기적 시장 움직임도 주목됩..
