일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 시간적 일관성
- 강화 학습
- PYTHON
- 일론 머스크
- 메타
- 다국어 지원
- 오픈AI
- AI 기술
- 실시간 렌더링
- 오블완
- 코딩
- OpenAI
- 티스토리챌린지
- 우분투
- 3d 재구성
- 오픈소스
- AI
- 트랜스포머
- ubuntu
- XAI
- LLM
- 휴머노이드 로봇
- LORA
- ChatGPT
- ai 챗봇
- 딥러닝
- tts
- 확산 모델
- 인공지능
- OpenCV
- Today
- Total
목록전체 글 (521)
AI 탐구노트

인공지능 기술은 이미지 생성에서 시작해 이제는 비디오 생성으로 그 영역을 넓혀가고 있습니다. 특히 현실과 같은 장면을 텍스트나 이미지로부터 자동으로 생성해내는 기술은 영화, 게임, 가상현실 등 다양한 분야에서 큰 관심을 받고 있습니다. 이러한 기술은 단순히 시각적인 만족감을 주는 것을 넘어서, 인간의 상상력과 표현력을 기계가 이해하고 구현하는 방향으로 발전하고 있습니다. 최근에는 ‘자기회귀 방식’을 기반으로 하는 모델들이 주목받고 있습니다. 자기회귀란 시간의 흐름에 따라 순차적으로 데이터를 예측해가는 방식으로, 특히 비디오처럼 시간에 따른 변화가 중요한 데이터에 적합합니다. MAGI-1은 이러한 자기회귀 방식을 기반으로 고화질, 고일관성의 영상을 실시간으로 생성할 수 있는 모델로, 기존의 전통적인 방식이..

며칠 전 쌀쌀한 기온과 함께 찾아왔던 비 때문에 벚꽃은 거의 다 떨어진 것 같습니다. 나름 '벚꽃맛길'을 가진 동네다 했는데 화무십일홍이던가요... 너무 금방 져서 안타까웠습니다. 최근에 퀴즈를 몇 개 만들고 있는데 공개된 지식 기반의 퀴즈 말고 새로운 것을 구상하다보니, 많이 접하는 것이 틀린 그림 찾기나 방탈출 게임과 같은 것들이 있더군요. 그래서, 그 가운데 ChatGPT의 도움을 받으면 만들 수 있을만한 것으로 틀린 그림 찾기와 미로를 선정했고 각각의 결과물을 소개해 보려고 합니다. 이번 글에서는 틀린 그림 찾기~! 🧩 기능을 채우다 – Edit 모드와 Game 모드 기능적으로는 두 가지 모드를 두었습니다. 하나는 유저가 실제로 게임을 플레이하는 Game 모드, 다른 하나는 정답 영역을 설정하..

네이버가 자체 개발한 소버린 AI 모델, 하이퍼클로바X SEED를 상업용으로 사용 가능한 오픈소스로 공개하며 국내 AI 산업에 새로운 바람을 일으키고 있습니다. 이는 단순한 기술 공개를 넘어, 한국의 AI 생태계 구축을 위한 획기적인 발걸음으로 평가됩니다.하이퍼클로바 X SEED란?하이퍼클로바X SEED는 3B, 1.5B, 0.5B 파라미터로 구성된 세 가지 경량 모델로, 특히 한국어와 한국 문화에 특화된 성능을 자랑합니다. 기업과 개발자들이 특정 비즈니스 요구에 맞춰 모델을 튜닝할 수 있도록 설계된 이 AI는 다양한 산업에서 맞춤형 솔루션으로 활용될 가능성을 열었습니다. 특징적인 것으로는 세가지 경량모델이 각각 특화 영역에서 강점을 가지도록 되어 있다는 것입니다. 3B 모델은 이미지 이해에 뛰어나고, ..

Dia-1.6B는 Nari Labs에서 개발한 16억 파라미터 규모의 텍스트-대화(Text-to-Speech, TTS) 모델입니다. Nari 라는 프로젝트 이름을 사용하는 한국 개발자 분들이 만든 모델입니다. X에 올라온 글을 보면 학부생 2명 (한명은 군 복무 중)이 지원금 전혀 없이 개발했다고 합니다. 참고로 'Nari'는 개나리에서 따 온 이름입니다. (사이트의 로고와 꽃잎의 장수를 보면 감 잡히시죠?) 1.모델 특징Dia-1.6B TTS 모델의 주요 특징은 다음과 같습니다. 현실적인 대화 생성 : 텍스트 스크립트를 기반으로 다중 캐릭터 대화를 단일 패스로 생성 -> 자연스럽고 빠른 음성 출력 제공 (기존 TTS 모델처럼 개별 발화를 합치는 방식이 아니라 전체 대화를 한 번에 처리)감정 및 톤 ..

구글의 크롬과 안드로이드 분할 매각 요구는 독점 체제 종말의 신호탄?구글은 오랫동안 검색 시장의 절대 강자로 군림해 왔습니다. 하지만 미국 법무부의 반독점 소송이 본격화되면서 구글의 독점 체제에 균열이 생기고 있습니다. 미 법무부는 구글의 검색 시장 지배력을 약화시키기 위해 크롬 브라우저와 안드로이드 운영체제의 분할 매각을 요구하고 있습니다. 이 요구는 단순한 제재를 넘어, 구글의 비즈니스 모델과 시장 영향력을 근본적으로 재편할 가능성을 내포하고 있습니다. 크롬은 전 세계 브라우저 시장의 약 60% 이상을 점유하며 구글 검색 엔진의 주요 관문 역할을 해왔습니다. 안드로이드는 모바일 운영체제 시장에서 70% 이상의 점유율을 차지하며 구글 서비스의 생태계를 확장하는 핵심 요소입니다. 만약 이 두 자산이 매각..

우리가 보는 세상을 컴퓨터가 3차원으로 다시 그릴 수 있게 하는 기술은 가상현실(VR), 자율주행, 게임, 디지털 영화 제작 등 다양한 분야에서 매우 중요합니다. 최근에는 'NeRF'라는 기술이 큰 인기를 끌었는데요, 이 기술은 2차원 이미지 몇 장만으로도 3차원 장면을 매우 정밀하게 재현할 수 있습니다. 다만, 학습 시간이 오래 걸린다는 단점이 있었습니다. 이를 해결하기 위해 최근에는 '3D 가우시안 스플래팅(3D Gaussian Splatting, 줄여서 3DGS)'이라는 새로운 방식이 나왔습니다. 이 방식은 장면을 여러 개의 작은 점(가우시안 덩어리)으로 구성해 매우 빠르게 3D를 재현할 수 있습니다. 하지만 이 방식도 문제가 있습니다. 처음에는 장면 전체를 표현하지 못해서, 점을 조금씩 추가하고 ..

AI 관련 소식들을 알아보다가 재미난 기사를 하나 봤습니다. AI타임즈의 기사였는데 사람들이 ChatGPT와 대화할 때의 말투와 관련된 것이었죠. "사람들이 챗GPT에 공손하게 군 대가로 수천만달러 날아가" - AI타임스샘 알트먼 오픈AI CEO가 인공지능(AI) 챗봇에 “제발”이나 “고마워요”라고 정중하게 말하는 것이 의외로 막대한 비용을 초래한다는 데 동의했다.알트먼 CEO는 20일(현지시간) X(트위터)에서 챗GPTwww.aitimes.com AI와의 대화 말투 때문에 비용이 발생한다고?기사는 '제발', '고마워요' 등 정중하게 말하는 것이 의외로 막대한 비용을 발생시키고 있다는 것을 전했는데, 이런 대화로 인해 AI가 불필요한 메시지를 생성하기 때문이라고 합니다. 하긴 답변을 한번 생성할 때..

MarkItDown은 Microsoft에서 개발한 오픈소스 Python 라이브러리 및 CLI(커맨드 라인 인터페이스) 도구로, 다양한 파일 형식을 Markdown 형식으로 변환하는 데 사용됩니다.이 도구는 PDF, Word, Excel, PowerPoint, HTML, 이미지, 오디오 등 다양한 파일 형식을 처리하여 텍스트 분석, LLM 학습, 또는 인덱싱과 같은 작업에 적합한 Markdown 출력을 생성합니다. 2024년 말 공개 이후 단 2주 만에 GitHub에서 25,000개 이상의 스타를 획득하며 큰 인기를 끌었습니다. MIT 라이선스 하에 배포되며, 확장 가능한 플러그인 아키텍처를 지원합니다. 게다가 MIT 라이선스를 따르고 있어 자유로운 사용, 수정이 가능합니다. 주요 특징 MarkItDo..

최근 GPT 4o를 이용해 지브리스타일의 이미지를 생성하는 사람들이 많다고 합니다. 그래서인지 다른 이미지 생성을 ChatGPT한테 시켜보면 반응이 너무 느려서 답답할 때가 많습니다. 제 경우엔 이미지 생성을 많이 하는 편이 아닌데도 말이죠. 이번에도 작은 이미지 하나를 만들어 볼 일이 있었습니다. 한번에 결과물이 짠 하고 잘 나오면 모르겠지만 몇번씩 시행착오를 해야하는 상황에서 반응 속도가 느리다는 것은 '용서받지 못할' 일 입니다! (^^;) 그래서 직접 모델을 다운받아 로컬에서 돌려볼 요량으로 지난 번 소개한 바 있는 Stability Matrix를 열었습니다. 마침 CivitAI에서 적당한 모델도 찾았고 말입니다. 거기엔 수많은 창작자들이 공유한 이미지 생성 모델이 있어서 저 같은 크리에이터에겐..

1. 글로벌 거시 환경 전망미국의 ‘약(弱)달러’ 정책 실험트럼프 행정부가 강달러→약달러 전환을 위해 관세 인상, 장기국채 발행 확대 등을 시도 중이나, 재정적자 확대와 GDP 비중 회복이라는 상충 목표를 달성하기는 현실적으로 어려움.달러 인덱스 급락 및 자본 유출 속에서 국채 금리가 상승(美 자산 매도), 스태그플레이션 우려가 동시에 증폭되고 있음.시장 변동성의 고착화S&P500·코스피 급락, 위험자산 전반의 수익성 약화.환율 1,400원 돌파 가능성 제기(원·달러 환율 급등), 채권·주식·통화가 동시 하락하는 ‘삼중고’ 국면.무역 분쟁과 지정학 리스크미·중 무역 갈등 심화에 따른 수출 기반 약화, 공급망 재편으로 인한 비용 상승 압박.미국의 중국 견제용 달러 전략이 장기적으론 중국 외환보유고 축소·위..