일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- LLM
- LORA
- 확산 모델
- ubuntu
- 티스토리챌린지
- TRANSFORMER
- 트랜스포머
- AI 기술
- 오픈AI
- AI
- 서보모터
- OpenAI
- 텍스트-이미지 생성
- 오블완
- 메타
- 시간적 일관성
- ControlNet
- OpenCV
- 멀티모달
- 생성형 AI
- 아두이노
- tts
- 가상환경
- 일론 머스크
- 우분투
- 인공지능
- 딥러닝
- PYTHON
- ChatGPT
- 휴머노이드 로봇
- Today
- Total
목록컴퓨터비전 (2)
AI 탐구노트
보조지점 지침(APG)과 암시적 특징보간(IFI)를 도입해 군중의 수를 카운팅하는 기법 APGCC는 보조지점 지침(APG)과 암시적 특징보간(IFI)를 도입해 군중의 수를 카운팅하는 기법입니다. 군중의 수를 세는 딥러닝 기반의 접근 방식은 다음과 같은 것들이 있습니다.CSRNet (Convolutional Neural Network based Crowd Counting) : CNN 기반의 이미지 밀도 예측 방식 MCNN (Multi-column Convolutional Neural Network) : 다양한 필터를 이용해 다양한 밀도 수준의 군중 수 측정 방식CAN (Context-Aware Network) : 군중 밀도 추정 시 컨텍스트 정보 활용하는 방식SFCN (Scale Fusion Convol..
고품질의 일관된 다중 뷰 이미지를 생성하여 인간 3D를 재구성할 수 있게 만드는 모델 MagicMan은 단일 이미지로부터 고품질의 일관된 다중 뷰 이미지를 생성하여 인간 3D 재구성을 가능하게 하는 모델입니다. 기존의 단일 이미지 기반 인간 3D 재구성 방법들은 부족한 훈련 데이터로 인한 일반화 능력의 약화와 3D 일관성 부족으로 인해 제한된 성능을 보입니다. 특히, 포즈 추정의 부정확성으로 인해 왜곡된 3D 재구성 결과가 발생합니다. MagicMan은 사전 훈련된 2D 확산 모델(Stable Diffusion)과 3D 신체 모델(SMPL-X)을 결합하여 다중 뷰 일관성을 개선하고, 하이브리드 멀티뷰 어텐션 메커니즘과 기하학적 인식 듀얼 브랜치를 도입하여 다중 뷰 간의 정보 교환을 효율적으로 수행합니다...