일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 오픈AI
- 오블완
- 시간적 일관성
- LLM
- 3d 재구성
- PYTHON
- 휴머노이드 로봇
- OpenCV
- tts
- AI 기술
- 생성형 AI
- 코딩
- 다국어 지원
- gradio
- 실시간 렌더링
- 딥러닝
- 인공지능
- 메타
- 티스토리챌린지
- ChatGPT
- 트랜스포머
- 확산 모델
- AI
- ubuntu
- OpenAI
- LORA
- 우분투
- 강화 학습
- 일론 머스크
- 오픈소스
- Today
- Total
목록전체 글 (508)
AI 탐구노트

VSCode를 사용할 때 작성한 html, javascript의 동작 결과를 보고 싶을 때가 있습니다. 즉, 파일의 미리 보기를 하고 싶은건데요, 이럴 때 시도할 수 있는 방법이 몇 가지 있습니다. 다 언급할 것은 아니고 그 중 몇가지 시도를 해 보고 제일 나았던 것에 대한 아주 짧은 결론을 기록해 둡니다. 결론.VSCode Extension 'Live Preview' 설치 다른 것들도 많이 있지만 VSCode 제조인 Microsoft에서 만든 것이고 가장 많이 사용되고 있습니다. Live Preview 사용 방법 미리 보기를 하고자 하는 파일을 연 후 화면 우측 상단에 있는 'Show Preview' 버튼을 클릭합니다. 그러면 아래 화면과 같이 별도 Preview 창이 열립니다. 아주 잘 동작..

디지털 콘텐츠가 점차 고해상도와 다양한 기기에서 활용됨에 따라, 이미지 표현 방식 또한 변화하고 있습니다. 그중에서도 벡터 그래픽(Vector Graphics)은 크기에 상관없이 선명함을 유지하는 특성으로 인해, 웹 아이콘, 앱 UI, 기술 도표 등에서 널리 활용되고 있습니다. 특히 SVG(Scalable Vector Graphics)는 텍스트 기반 코드로 이미지 형태를 정의하기 때문에, 작은 용량으로도 정교한 이미지를 표현할 수 있어 각광받고 있습니다. 하지만 일반적인 비트맵 이미지를 SVG로 자동 변환하는 것은 여전히 어려운 문제로 남아 있습니다.최근에는 인공지능, 특히 멀티모달 대형 언어 모델(Multimodal Large Language Models, MLLMs)의 급속한 발전이 이러한 문제 해결..

OpenAI는 어제(2025.4.16), 새로운 추론 모델인 'o3'와 'o4-미니(mini)'를 공개했습니다. (링크) 이 모델들은 기존 모델들과는 달리, 도구를 활용하는 방식으로 성능 향상과 비용 효율성을 동시에 구현했습니다. 이번 글에서는 짧게 해당 부분을 정리해 보고 넘어가겠습니다. o3와 o4-mini'o3'는 기존 모델을 능가하는 성능을 자랑합니다. 수학, 코딩, 추론, 과학, 시각적 이해 능력 등의 테스트에서 우수한 성과를 보였으며, 특히 강화 학습(RL)을 통해 추론 성능과 컴퓨팅 속도 모두에서 눈에 띄는 발전을 이뤘습니다. 'o4-mini'는 가격, 속도, 성능의 균형을 고려한 모델로, 개발자들에게 매력적인 선택지로 떠오르고 있습니다. 도구 사용을 통한 성능 향상두 모델의 핵심 특징은 바..

ChatGPT나 Claude를 사용하면서 가끔 다음과 같은 생각을 할 때가 있습니다. (다른 분들도 아마 한번쯤은 해 보지 않으셨을까 생각합니다만...)매달 내는 구독 비용이 아깝다. - 최근에는 ChatGPT 구독을 여럿이 나눠서 사용하는 사람들도 늘고 있다고 합니다내 정보가 외부로 공개되는 것이 싫다온라인 서비스인데 어떤 때는 응답이 너무 느리다내가 만든 앱에서 AI 기능을 활용하고 싶은데 API 로 사용하는 것은 챗봇 구독과 별도로 비용이 들더라이럴 때 로컬에서 대형 언어 모델(LLM)을 사용할 수 있다면 하는 쪽으로 생각이 진행되죠. 실제로 그렇게 하고 계신 분들도 많구요. 로컬에서 사용할 수 있는 오픈소스 모델들이 상용 LLM보다 공개 LLM 모델의 성능이 더 낫다고는 할 수는 없습니다. 하지..

디지털 디자인의 세계는 점점 더 복잡하고 정교해지고 있습니다. 특히 스케일러블 벡터 그래픽(SVG)은 해상도에 무관한 품질과 편집 가능성 덕분에 UI/UX 디자인부터 산업 CAD 시스템에 이르기까지 광범위하게 사용되고 있습니다. 하지만 정밀한 SVG 파일을 생성하려면 고도의 전문 지식과 도구가 필요해, 일반 사용자에게는 접근이 쉽지 않은 것이 현실입니다.이러한 흐름 속에서 최근 인공지능 기술의 눈부신 발전은 이미지 생성, 텍스트 생성 등 다양한 분야에서 창작 활동을 지원하고 있습니다. 특히 비전-언어 모델(VLM: Vision-Language Model)의 발전은 텍스트와 이미지 간의 연관성을 이해하고 창작물로 표현하는 데 있어 매우 유용한 기반을 제공합니다. 이러한 기술의 흐름을 바탕으로, OmniSV..

OpenAI에서 GPT 4.1 버전을 공개했습니다. 흠... 이제 또 새로운 서비스, 기술 소개 시즌이 온 건가요? 한번에 몰아치는 OpenAI의 특성 상 이번 한 주는 또 많은 분석글들이 쏟아지겠네요. 저도 간단하게 요약 정리해두고 가렵니다. GPT-4.1 개요GPT-4.1은 GPT-4 Turbo의 차세대 버전GPT-4.1, mini, nano 의 3개 모델을 공개GPT-4.1 mini, nano는 경량화 모델이지만 높은 성능을 제공하며, 저지연 및 저비용 운영이 가능함코딩 능력, 지시 이해 능력, 장문 맥락 처리 성능이 크게 향상됨100만 토큰까지의 문맥 길이 지원 (기존 GPT-4o는 128,000개 지원) -> 오호... 실 업무에서 활용하기에 좋아졌네요. GPT-4.1의 주요 개선 사항 정확도..

🍃 봄바람 따라, 코딩도 vibe 타는 시대 요즘 날씨가 너무 좋죠. 나무엔 새잎이 가득하고, 벚꽃은 이제 지고 있지만 그 자리를 연두빛 초록이 채워갑니다. 이렇게 자연도 계절의 vibe을 타듯, 코딩에도 새로운 흐름이 찾아왔습니다. 이름하여 Vibe Coding. 개발자가 코드를 일일이 짜기보다, '내가 원하는 걸 말하면' AI가 알아서 멋지게 구현해주는, 말 그대로 'vibe'로 개발하는 시대가 열린 거죠.🧠 DeepSite가 불러온 새로운 흐름 이 분위기의 중심에는 단연 DeepSite가 있습니다. 단순히 LLM을 불러다 코딩에 쓰는 게 아니라, 목적 중심으로 동작하는 일종의 에이전트 기반 개발 플랫폼이죠. '이런 기능이 필요해요', '이런 게임을 만들고 싶어요' 혹은 게임의 이름이나 방식 정도..

1.MCP(Model Context Protocol) 모델 컨텍스트 프로토콜(Model Context Protocol, MCP)은 AI 모델과 외부 데이터 소스 및 도구를 표준화된 방식으로 연결해주는 오픈소스 프로토콜입니다. 미국 기업 앤트로픽(Anthropic)이 주도적으로 개발했으며, AI 에이전트가 실시간으로 다양한 시스템(클라우드 저장소, 데이터베이스, 업무 도구 등)과 상호작용할 수 있도록 설계되었습니다. 아래는 MCP의 핵심 개념과 특징을 간략히 정리한 소개입니다. 1️⃣ MCP의 목적MCP는 AI 모델이 고정된 학습 데이터나 단순한 사용자 입력에 의존하지 않고, 동적이고 풍부한 컨텍스트를 활용해 더 지능적인 작업을 수행하도록 돕습니다. 예를 들어, AI가 문서, 이메일, 코드 리포지토리, ..

최근 OpenAI의 SORA가 워낙 좋아졌고, 구글의 ImagenFx도 사용하는데 불편함이 없을 정도입니다. 하지만, SORA는 생성하는데 생각보다 많은 시간이 소요되고, ImagenFx는 빠르고 품질도 좋지만 텍스트 기반만 지원하기 때문에 한계가 있습니다. 그럴 때 로컬에서 ComfyUI로 SDXL이나 Flux.1 Schnell을 이용하게 되죠. 그런데 오랜만에 사용하려다보니 그동안 업데이트도 많이 되었고, 설치된 패키지들 간에 약간씩 충돌하는 부분도 있더군요. 하나씩 원인 분석해가며 버그를 잡아주긴 했는데 마치 전원주택을 관리하는 것처럼 앞으로 연식이 높아지면 더 편해지는 것이 아니라 잔손이 많이 가겠구나 싶었습니다. 그래서, 좀 더 편하게 모델이나 패키지를 관리해줄 수 있는게 없을까 고민하다가 'S..

영상 쇼츠를 만들 일이 생겼습니다. 한번도 해 본 적이 없는 일이라 공부를 해야 하는 상황입니다. 일반적으로 회사원들이 많은 시간을 내기는 어려울테니 짧은 시간에 적당한 품질의 영상을 만들어 내는 방법이 있을지 궁금해 지더군요. 그래서, 다른 사람들, 특히나 유튜버들은 어떤 툴을 많이 사용하나 싶어서 몇 가지를 알아봤습니다. 짧게 그 결과를 기록해 둡니다. 🌎️ 쇼츠 제작에 많이 사용하는 도구들대략 다음과 같았습니다. 최근들어 AI로 무장된 엄청나게 많은 도구들이 최근에도 막 쏟아지고 있었습니다. 흠... 다 알아볼 순 없고... ^^; 조사해 본 것의 개략적인 특징만 정리해 봤습니다. 도구 이름특징장점Canva초보자 친화적인 무료 동영상 편집 도구, 9:16 템플릿 제공, 텍스트/음악/전환 효과 쉬..