일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- LLM
- 인공지능
- 딥러닝
- 오픈AI
- 휴머노이드 로봇
- AI
- 메타
- 우분투
- PYTHON
- 이미지 생성
- LORA
- 다국어 지원
- OpenAI
- 확산 모델
- 강화 학습
- 트랜스포머
- AI 기술
- 오픈소스
- 멀티모달
- ChatGPT
- 실시간 렌더링
- tts
- 일론 머스크
- 시간적 일관성
- 생성형 AI
- 아두이노
- 티스토리챌린지
- OpenCV
- TRANSFORMER
- 오블완
- Today
- Total
목록DIY 테스트 (66)
AI 탐구노트

지난 번에 바이브 코딩을 통해 청기백기 게임을 만들어 보려고 했었죠. 하지만 DeepSite에서 사용한 DeepSeek가 아마도 청기백기 게임은 경험이 없었는지 상세하게 설명을 달아주지 않으면 생성을 못하는 것 같았습니다. 다른 것들은 정말 아주 짧은 한마디만으로도 멋드러지게 만들어줬는데 말이죠. 그래서, 청기백기 게임을 간단하게 만들어 보기로 했습니다. 먼저 청기백기 게임의 로직을 한번 만들어 봤습니다. 처음에는 깃발 구분, 액션 구분, 둘 간의 연결 등 개별적으로 따로 구조를 만들고 이를 조합하는 방식으로 구현하려고 했었는데 판정하는 것도 번거롭고 굳이 그럴 필요까지는 없을 것 같았습니다. 그래서, 나올 수 있는 지시어를 전부 명시하는 방식으로 접근했습니다. 청기백기 게임의 기본 로직 구현나올 수..

지난 번에 아래 글을 작성하면서 조사를 한 터라 바이브 코딩이 어떤 것인지는 대충 알게 됐습니다. 바이브코딩(Vibe Coding) : AI가 바꾸는 개발의 미래와 인간 개발자의 역할최근 실리콘밸리에서 '바이브코딩(Vibe Coding)'이라는 용어가 화제입니다. 이는 생성 인공지능(AI)을 활용한 코딩을 의미하며, 스타트업부터 빅테크까지 산업 전반에 걸쳐 혁신을 예고하고 있습니42morrow.tistory.com 그래도, 아는 것보다 체험해 보는 것이 중요하다 싶더군요. 예전에도 ChatGPT를 이용해서 다양한 게임을 만들어 봤던터라 크게 다르지 않겠지, 작성된 코드를 제대로 동작하도록 만들기 위해서는 그래도 숨은 시행착오가 많이 생길 수 밖에 없겠지 하는 약간은 낮은 기대 수준을 가지고 시작했죠. ..

3D 프린터를 활용하면 자신만의 굿즈를 직접 제작할 수 있습니다. 하지만 일반적인 3D 모델링 소프트웨어를 사용하려면 전문적인 지식이 필요하고, 처음 시작하는 사람들에게는 진입 장벽이 높습니다. 그렇다면 이미지 한 장만으로 3D 모델을 만들 수 있다면 어떨까요? 최근 MIDI (Multi-Instance Diffusion for Single Image to 3D Scene Generation)라는 강력한 AI 모델이 공개되었습니다. MIDI는 단일 이미지를 입력으로 받아 3D 장면을 자동으로 생성할 수 있으며, 특히 여러 개의 객체가 포함된 복잡한 장면도 자연스럽게 복원할 수 있습니다. 이 기술과 관련된 내용은 이전 글에서 소개된 바 있습니다. 2025.03.12 - [AI 기술] - MIDI: 단일 ..

최근 인공지능 음성 합성 기술이 급속히 발전하면서 자연스러운 음성을 구현하는 다양한 서비스가 등장하고 있습니다. 그 가운데 Zonos TTS는 적은 GPU 메모리를 사용하면서도 한국어도 곧잘 음성 생성을 해 내는 반가운 모델이라고 알려져 있습니다. ZONOS : 다국어, 감정표현도 잘 되는 오픈소스 TTS 모델최근 인공지능 기술의 발전으로 텍스트를 자연스러운 음성으로 변환하는 TTS(Text-to-Speech) 기술이 주목받고 있습니다. 특히, 개인화된 음성 생성과 감정 표현이 가능한 모델에 대한 수요가 증가하42morrow.tistory.com 이 모델은 주어진 텍스트를 음성으로 만드는 것에 그치지 않고 사용자 본인의 음성을 복제하는 기능도 제공합니다. 온라인 사이트에서 음성 생성 서비스를 제공하..

현대 사회에서 정보의 흐름은 그 어느 때보다 빠르게 변화하고 있습니다. 이러한 변화 속에서 사람들의 관심사를 정확하게 파악하는 것은 개인이나 기업 모두에게 중요한 과제가 되었습니다. 특히, 디지털 마케팅, 콘텐츠 제작, 제품 개발 등 다양한 분야에서는 최신 트렌드와 대중의 관심사를 반영하는 것이 성공의 열쇠가 됩니다. 이러한 맥락에서 구글이나 네이버와 같은 검색 플랫폼에서 제공하는 인기 검색어 데이터를 활용하는 방법은 매우 유용한 도구로 자리 잡고 있습니다. 인공지능 기술의 발전과 함께 데이터 분석 능력도 비약적으로 향상되었습니다. 방대한 양의 데이터를 수집하고 분석하여 유의미한 정보를 도출하는 것이 가능해졌으며, 이는 개인화된 콘텐츠 추천, 시장 동향 분석, 사용자 경험 개선 등 다양한 분야에서 활용되..

장기간 집을 비울 일이 있을 때, 어항에 있는 물고기를 돌봐줄 수 없게 되어 문제가 됩니다. 사실 그런 이유로 오랜 기간 집을 비우질 못하는 경우도 있죠. 예전에 사료 급식기를 구입해서 자동화를 했다고 생각했었는데 사실 당시는 실패했었고 (구피를 위한 먹이 급여기였는데 오작동이 있어서 물고기들이 상당기간 굶을 뻔 했습니다 ^^;) 이번에는 딸랑 가오피 비파 1마리만 있는 상태여서 한번에 아주 조금씩 정해진 양을 주는 것이 아닌 기존 급여기는 사용할 수가 없게 되었습니다. 그렇다고 다른 것을 구입하기도 그렇고 해서... 가지고 있는 기기를 이용해서 이번만 쓸 요량으로 만들기로 했습니다. 1.물고기 먹이 급여기의 요구사항제가 필요한 요건은 다음과 같았습니다.원격지에서 필요할 때 구동시킬 수 있어야 합니다...

최근 들어 인공지능 기술은 일상생활 속 다양한 문제를 해결하기 위해 활발히 도입되고 있습니다. 그중 AI 영상 분석 기술은 높은 관심을 받고 있는데, 특히 CCTV를 활용한 분석은 기존의 데이터 활용 방식에 비해 더 직관적이고 실시간 대응이 가능하다는 점에서 주목받고 있습니다. 이런 기술은 단순히 감시 용도를 넘어, 매장의 운영 효율성을 높이거나 고객 경험을 향상시키는 데도 적용될 수 있습니다. 예를 들어 매장을 방문할 때 계산대에서 길게 줄을 서 기다린 경험은 누구나 한 번쯤 있을 것입니다. 이는 고객 만족도를 떨어뜨리는 주요 요인 중 하나로 꼽힙니다. 매장 운영자는 대기열을 줄이고 효율적으로 운영하기 위해 대기자 수와 대기시간을 분석할 수 있는 새로운 도구를 필요로 하고 있습니다. 바로 여기서 AI ..

인공지능 기술의 발전과 함께, 텍스트를 자연스러운 음성으로 변환하는 텍스트-투-스피치(Text-to-Speech, TTS) 시스템의 수요가 급증하고 있습니다. 특히, 다양한 언어를 지원하면서도 경량화된 TTS 모델은 엣지 디바이스나 임베디드 시스템과 같은 제한된 환경에서의 활용 가능성을 높여줍니다. 얼마 전 'Kokoro-82M' 이라는 TTS 모델을 소개한 바 있었습니다. 경량 TTS 모델로 8200만개의 매개변수만으로 아주 좋은 성능과 처리 속도를 보여준다고 말입니다. 게다가 공식 지원 언어에 한국어가 들어가 있다는 장점도 있었죠. 'Local Elevenlabs'라고 불릴 정도로 사람들의 주목을 많이 끌었습니다. Kokoro-82M: 컴팩트하면서 강력한 TTS 솔루션텍스트-음성 변환(TTS)은 ..

RUST로 만들어진 벡터 그래픽 렌더링 소프트웨어로 forma라는 것이 있습니다. 구글이 3년 정도 전에 공식 릴리즈는 아니고 실험실 형태로 개발해서 공개한 것인데 최근에 벡터 이미지 생성과 관련된 기술을 찾아보다가 다시 한번 들여다 보게 되었습니다. 그런데... 정작 보고 Feel이 꽂힌 것은 그 기술이 아니라 해당 github repository에 샘플로 보여주고 있는 애니메이션이었습니다. GitHub - google/forma: An efficient vector-graphics rendererAn efficient vector-graphics renderer. Contribute to google/forma development by creating an account on GitHub.gi..

기술이 우리의 일상을 편리하게 해 주고 있다는 것은 두말할 여지가 없죠. 그렇다면 실제로 다음과 같은 질문을 받는다면 나는 어떤 것을 말할까 라는 생각을 해 봤습니다. '당신의 생활 속에서 정말 편리하게 사용하고 있는 것은 과연 무엇인가' 흠... 약간의 고민을 해 보고선 몇 가지를 떠 올렸습니다. 그 가운데 하나가 '보이저엑스'라는 국내 스타트업이 만든 'vFlat'이라는 앱입니다. 이 앱이 떠오른 이유를 생각해 보면 사용 횟수를 보면 그렇지 않은데 사용할 때의 만족도는 아주 높기 때문인 것 같습니다. vFlat은 종이 문서나 책을 스캔할 때 사용하는 스마트폰 앱입니다. 종이 문서 등이 있는데 스마트폰 카메라로 사진을 찍으면, 대상의 위치가 약간 틀어지거나 하는 경우가 있죠. 책의 경우는 중간이 ..