일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
- 일론 머스크
- OpenAI
- AI
- 인공지능
- XAI
- AI 기술
- 다국어 지원
- 딥러닝
- ChatGPT
- 실시간 렌더링
- LLM
- 이미지 생성
- 생성형AI
- 강화학습
- 강화 학습
- Stable Diffusion
- 자연어 처리
- 메타
- 확산 모델
- 오픈소스
- 멀티모달
- 휴머노이드 로봇
- tts
- 티스토리챌린지
- PYTHON
- 트랜스포머
- 우분투
- 오픈AI
- 오블완
- 감정 표현
- Today
- Total
목록인공지능 (34)
AI 탐구노트

최근 인공지능 기술의 발전은 이미지 생성 분야에 새로운 가능성을 열어주고 있습니다. 특히 사용자의 입력에 따라 사람 이미지를 생성하거나 옷을 갈아입히는 '가상 피팅(Virtual Try-on)' 기술은 온라인 쇼핑, 메타버스, 게임 산업 등 다양한 분야에서 큰 주목을 받고 있습니다. 이 기술은 기존에는 불가능했던 맞춤형 콘텐츠 제작을 가능하게 하며, 사용자 경험을 혁신적으로 변화시키고 있습니다. 그러나 이런 기술에도 한계가 있게 마련이죠. 기존 방식으로 생성된 이미지는 전체적으로는 훌륭해 보이지만, 가까이서 보면 옷의 무늬나 로고와 같은 디테일이 왜곡되는 문제가 있습니다. 이러한 문제를 해결하기 위해 'Leffa(Learning Flow Fields in Attention)'라는 새로운 기술이 제안되었습..

어제 있었던 미국의 이란 공습 때문에 오랜만에 요약 분석 돌려 봤습니다. 트럼프 정책 및 이란 사태의 경제적 영향1. 주요 요인트럼프 정책: 보호무역(10% 관세, 중국 60%), 약달러·저금리 목표, 스테이블코인 법안으로 달러 패권 강화이란 사태: 핵시설 폭격으로 유가 급등(100달러 전망), 인플레이션 압력, 호르무즈 해협 봉쇄 우려과거 오일쇼크 : 1973년~1979년 오일쇼크로 인플레 폭등, 금리 급등, 증시 폭락(최대 80%)현재 : 미국 자체는 현재 최대 산유국이며 피해 제한적. 다른 나라들은 영향을 받을 가능성 높음금리·환율: 연준의 금리 인하 지연 (인플레발생 시 인상 가능성도 있음), 안전자산 달러 선호 심리 - 원/달러 환율 상승 예상 (단기 1350원 대 가능하나 중장기 1,400~..

바이브 코딩을 이용해 미로퍼즐을 만들어 봤습니다. 영상 콘텐츠를 만들기 위해서였는데 만들면서 시행착오하는 과정에서 재미가 있었기에 그 결과를 글로 남겨 봅니다. ^^; 미로퍼즐, 왜? 그리고 어떻게?네. 퀴즈 영상을 만들어보려고 하다보니 필요했습니다. 실제로 미로퍼즐을 온라인 상에서 제공하고 있는 곳들도 있긴 합니다. 하지만, 영상을 제작하기 위해 매번 이들을 찾아가서 생성한 후 루트를 동일하게 디자인하고 움직임 애니메이션을 넣고... 이런 작업을 하는 것은 너무 번거롭다 생각했죠. 그래서, 생각한 방식은 공개된 미로생성 알고리즘과 바이브 코딩을 이용하는 것이었습니다. 어떤 미로퍼즐을 만들고 싶은지?제가 생각한 미로퍼즐의 요구사항은 다음과 같습니다. 아래의 내용이 처음부터 나와 있었던 것은 아닙니다..

글로벌 사회로의 진입이 가속화되면서, 다양한 언어 간의 원활한 소통은 개인과 기업 모두에게 필수적인 요소가 되었습니다. 이러한 흐름 속에서 다국어 번역 기술은 단순한 언어 변환을 넘어, 문화적 뉘앙스와 문맥을 고려한 정교한 커뮤니케이션 도구로 발전하고 있습니다. 초기의 다국어 번역 기술은 주로 군사적 목적에서 출발하여, 제한된 언어 쌍을 대상으로 한 기계 번역 시스템이 중심이었습니다. 그러나 오늘날에는 인공지능(AI), 자연어 처리(NLP), 음성 인식, 클라우드 컴퓨팅 등의 기술이 접목되면서, 실시간 음성 통역, 문서 자동 번역, 다국어 챗봇 등 다양한 형태로 확장되고 있습니다. 특히, 스마트폰과 클라우드 기반의 서비스는 사용자에게 언제 어디서나 다국어 번역 기능을 제공함으로써, 언어 장벽을 허무는 데..

인공지능의 폐해: 딥페이크 포르노라는 경고 인공지능(AI)의 발전은 우리 삶을 편리하게 만들어 주었으나, 그 이면에는 심각한 폐해가 존재합니다. 최근 미국에서 도널드 트럼프 대통령이 서명한 '테이크 잇 다운 법안(Take It Down Act)'은 AI 기술의 오용이 초래하는 사회적 문제를 보여주는 대표적인 사례입니다. 이 법안은 동의 없이 배포된 노골적인 이미지나 AI로 생성된 딥페이크 콘텐츠를 불법으로 규정하며, 이를 엄격히 처벌합니다. 이는 AI가 개인의 프라이버시를 침해하고, 특히 취약 계층을 대상으로 한 디지털 폭력을 조장할 수 있다는 경각심을 반영합니다. 딥페이크 포르노는 기술이 악의적으로 사용될 경우 개인의 삶을 파괴할 수 있는 강력한 도구임을 보여줍니다. 표현의 자유와 규제 사이: 미국..

구글 I/O 2025가 성황리에 막을 내렸습니다. 이번 행사에서 워낙 많은 기술과 제품이 소개되었는데 그 가운데 제 관심을 많이 끈 제품 중 하나는 구글의 스마트 글래스였습니다. 세련된 디자인과 최첨단 AI 기술이 결합된 이 스마트 글래스는 단순한 안경을 넘어, 우리의 일상을 완전히 바꿀 가능성을 보여줬기 때문입니다. 물론 아주 가까운 미래는 아닐 겁니다. 이번 글에서는 구글 스마트 글래스의 주요 특징과 경쟁 제품들과의 비교를 통해 이 혁신적인 기기가 가진 매력에 대해 정리해 보겠습니다. 구글 스마트 글래스: 어떤 특징이 있을까?구글은 이번 I/O에서 Android XR 플랫폼을 기반으로 한 스마트 글래스를 공개하며, 기술과 스타일의 완벽한 조화를 선보였습니다. 특히, 유명 안경 브랜드들과의 협업으로 기..

한 때 자신만의 손글씨 폰트를 제작하는 열풍이 분 적이 있었습니다. 국내에서는 네이버와 보이저엑스에서 사람들의 신청을 받아서 손글씨를 AI 기술을 이용해 개인 폰트를 만들어주기도 했습니다. 보이저엑스의 경우, 현재는 중단했지만 '온글잎'이라는 이름으로 상용으로 제작 서비스를 제공하고도 했구요. 당시 이런 서비스들을 보면서 저도 '우와, 저런 건 나도 해 보고 싶다' 하는 생각을 가졌었더랬습니다. 하지만, 해 볼 수 있는 장비도 없고 능력치 밖이다 싶어서 관심만 가지고 있었죠. 그러다 몇 년이 지났습니다. 이것저것 평소에 만들어 보고 싶던 것들을 하나씩 해 보면서 정리하다보니 그때 해 봐야지 하며 기록해 둔 목록이 있어 다시 꺼내 봅니다. ^^ 1. 자신만의 폰트 제작1.1.폰트의 중요성폰트는 우리가 ..

VLM (Vision Language Model)이란?VLM은 Vision Language Model의 약자로, 이미지와 텍스트를 동시에 이해하고 처리할 수 있는 인공지능(AI) 모델입니다. 쉽게 말해, 사진을 보고 그 내용을 설명하거나, 텍스트를 바탕으로 이미지를 이해하고 질문에 답할 수 있는 기술이죠. 인간이 눈으로 보고 머리로 이해하는 것처럼, VLM은 시각 정보(이미지)와 언어 정보(텍스트)를 함께 학습해 다재다능하게 작동합니다. VLM 의 주요 특징은? 1️⃣ 이미지와 텍스트를 통합적으로 이해텍스트만 처리하는 언어 모델(예: GPT)과 달리, VLM은 이미지 속 객체, 장면, 행동 등을 분석할 수 있습니다.예) 사진 속 고양이를 보고 "이 동물은 무엇인가요?"라는 질문에 "고양이입니다"라고 답..

OpenAI에서 GPT 4.1 버전을 공개했습니다. 흠... 이제 또 새로운 서비스, 기술 소개 시즌이 온 건가요? 한번에 몰아치는 OpenAI의 특성 상 이번 한 주는 또 많은 분석글들이 쏟아지겠네요. 저도 간단하게 요약 정리해두고 가렵니다. GPT-4.1 개요GPT-4.1은 GPT-4 Turbo의 차세대 버전GPT-4.1, mini, nano 의 3개 모델을 공개GPT-4.1 mini, nano는 경량화 모델이지만 높은 성능을 제공하며, 저지연 및 저비용 운영이 가능함코딩 능력, 지시 이해 능력, 장문 맥락 처리 성능이 크게 향상됨100만 토큰까지의 문맥 길이 지원 (기존 GPT-4o는 128,000개 지원) -> 오호... 실 업무에서 활용하기에 좋아졌네요. GPT-4.1의 주요 개선 사항 정확도..

현대의 자율주행 기술은 놀라운 속도로 발전하고 있지만, 여전히 넘어야 할 큰 장벽이 존재합니다. 그 중에서도 가장 중요한 문제 중 하나는 현실적인 운전 시나리오의 시뮬레이션입니다. 현실 세계에서 데이터를 수집하는 것은 시간과 비용이 많이 들 뿐만 아니라, 드물고 위험한 상황을 반복적으로 수집하는 것은 사실상 불가능합니다. 이러한 한계를 극복하기 위해 최근 인공지능 분야에서는 생성형 모델, 특히 비디오 생성 모델을 활용한 가상 세계 시뮬레이션이 주목받고 있습니다. 하지만 일반적인 생성형 비디오 모델은 자율주행의 고유한 요구사항 (예를 들어 다중 에이전트 간의 상호작용, 시간적·공간적 일관성, 그리고 여러 카메라 뷰의 조화 등)을 만족시키기 어렵습니다. 이러한 현실적인 문제를 해결하기 위해 제안된 모델이 바..