일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- tts
- 이미지 편집
- 트랜스포머
- AI
- 메타
- 서보모터
- 일론 머스크
- 확산 모델
- 오블완
- ControlNet
- 딥마인드
- 시간적 일관성
- 가상환경
- 뉴럴링크
- PYTHON
- AI 기술
- ChatGPT
- 우분투
- 멀티모달
- TRANSFORMER
- 생성형 AI
- 인공지능
- LLM
- javascript
- LORA
- 오픈AI
- 아두이노
- 티스토리챌린지
- ubuntu
- OpenAI
- Today
- Total
목록2024/10/10 (4)
AI 탐구노트
올해 (2024년) 노벨상 수상 발표는 상당히 흥미 진진했습니다. 다른 분야는 잘 모르겠지만, 노벨 물리학상과 노벨 화학상을 AI 관련 연구자들이 받았다는 것과 노벨 문학상을 우리나라 대표 작가인 한강이 받았다는 것 때문입니다. 앞의 두 뉴스는 우와~ 하며 놀랐고 뒷 뉴스는 보는 순간 가슴이 벅차올라 막 박수를 쳤습니다. 개인적으로 아냐구요? 아뇨... 그분의 책을 다 읽어봤냐구요? 아뇨... 그런데 왜? 그냥 자랑스러워서였습니다. 외국 사람들이 한식과 BTS를 애기하며 열광할 때 나 자신과 직접적인 관련은 하나도 없지만 괜히 뿌듯해지는 바로 그런 감정 때문이었죠. 노벨상이 가지는 무게감 때문에 더 그런 것 같긴 합니다. 2000년도에 김대중 대통령이 노벨 평화상을 수상한 이후, 한국인으로서는 두번..
GS-VTON은 2D 가상 착용 기술을 3D로 확장해, 여러 각도에서 옷을 자연스럽게 입어볼 수 있게 해주는 기술입니다. 옷이나 안경, 액서사리와 같은 제품들은 디자인이나 기능적인 측면 외에도, 이를 입거나 갖췄을 때 '나한테 얼마나 어울리는가' 하는 것이 아주 중요한 구매 포인트가 됩니다. 그래서, 제품 구입 전에 입거나 걸쳐보는 등의 과정을 거치는 경우가 많습니다. 그런데, 만약 구입을 온라인에서 하게 된다면? 아니면 오프라인이라도 입고 걸쳐보고 싶은 것이 많은데 제품마다 갈아입어보기가 어렵거나 귀찮은 경우가 있다면? 아마도 많은 분들이 온라인에서 옷을 구매하면 마음에 들지 않아 반품을 해 보신 경험이 있을 겁니다. 오프라인에서는 눈치가 보여서라도 많은 옷을 입어보지 못하는 경우가 있을테구요. 이럴..
Transfusion은 텍스트와 이미지를 하나의 멀티모달 모델로 통합하여 예측하고 생성할 수 있는 모델입니다. 기존의 방식은 텍스트와 이미지와 같은 이산적(텍스트) 및 연속적(이미지) 데이터를 통합하여 생성하는 데 어려움이 있었으며, 각각의 생성 모델을 독립적으로 사용해야 했기 때문에 비효율적이었습니다. Transfusion은 하나의 Transformer 모델을 사용해 텍스트와 이미지를 동시에 처리합니다. 텍스트는 언어 모델링 손실, 이미지는 확산 모델링 손실을 적용하며, 양쪽에 서로 다른 경량화된 모듈을 추가하여 효율성을 높였습니다. 또한 텍스트와 이미지를 처리하는 데 있어 각각 인과적 주의(Causal Attention)와 양방향 주의(Bidirectional Attention)를 결합한 Trans..
Black Forest Labs, Flux.1.1 Pro 출시Black Forest Labs가 기존 1.0 버전 대비 더 빠른 속도와 더 우수한 이미지 품질을 보여주는 Flux 1.1 Pro를 출시했는데, 이는 MidJourney 보다 우수하다고 평가받고 있습니다. (AI타임스) 품질이 향상된 생성형 모델들이 계속해서 나오고 있습니다.최근 나온 모델들을 보면 실제와 AI를 구분하지 못하는 수준이 된 것 같기도 합니다. 다양한 솔루션들의 출시로 시장이 포화되면 그 다음은 각자 자신이 우수한 분야를 특화해서 시장을 선점하려 하겠죠. 앞으로 이런 우수한 기술을 가진 기업들이 어떤 재미난 서비스들을 출시하게 될 지 기대됩니다. NVIDIA, GPT-4와 경쟁할 오픈 소스 AI 모델 NVLM-D-72B 공개N..