일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- AI
- 생성형 AI
- 확산 모델
- tts
- 오픈AI
- 오블완
- 멀티모달
- 트랜스포머
- 우분투
- 메타
- AI 기술
- 서보모터
- 아두이노
- 시간적 일관성
- LLM
- 가상환경
- 인공지능
- 티스토리챌린지
- 이미지 편집
- OpenAI
- PYTHON
- LORA
- 딥마인드
- ChatGPT
- ControlNet
- javascript
- ubuntu
- 뉴럴링크
- TRANSFORMER
- 일론 머스크
- Today
- Total
목록2024/09/07 (2)
AI 탐구노트
3D 객체의 포괄적인 인간-객체 상호작용 능력을 학습하는 새로운 방법 ComA (Comprehensive Affordance)는 사전 학습된 2D 확산 모델을 활용해 3D 객체의 포괄적인 인간-객체 상호작용 능력을 학습하는 새로운 방법입니다. 기존의 인간-객체 상호작용(HOI) 연구는 주로 물리적 접촉에만 집중하여 비접촉 패턴이나 공간적 관계를 충분히 다루지 못했습니다. 이를 해결하기 위해 사전 학습된 2D 확산 모델을 사용하여 다양한 3D HOI 샘플을 생성하고, 이를 기반으로 물체 표면과 인간 표면 사이의 상대적인 위치와 방향을 모델링하는 파이프라인으로 ComA를 제안하고 있습니다. 이 기법에서 사용되는 특징적 기술로는 다음과 같은 것들이 있습니다. Comprehensive Affordance(C..
카카오가 공개한 초거대 언어모델을 기반으로 한 이미지 생성모델 칼로(Karlo) 2.0은 카카오가 공개한 초거대 언어모델을 기반으로 한 이미지 생성모델입니다. Stable Diffusion이나 DALE-E와 같은 모델이라고 보시면 됩니다. 카카오에서 카카오 디벨로퍼스 (Kakao Developers)를 통해 공개하고 있으며 개발자 등록을 하면 누구나 자유롭게 이미지를 생성해 볼 수 있습니다. MidJourney 등이 정해진 몇십장의 수량을 넘어서면 유료로 전환되었던 것에 비해 칼로 2.0은 월 60만장까지 무료로 생성할 수 있습니다. 월 60만장이면... 개인일 경우에는 거의 무제한인 셈입니다. 아쉬운 것은 API 형태로 제공되기 때문에 이걸 사용하려면 약간이라도 IT 기술을 이해하고 있어야 한다는 것입..