일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 우분투
- 생성형 AI
- 멀티모달
- 오픈AI
- LORA
- 아두이노
- 딥마인드
- 확산 모델
- 휴머노이드 로봇
- AI
- LLM
- tts
- 가상환경
- 메타
- ControlNet
- TRANSFORMER
- 트랜스포머
- ChatGPT
- ubuntu
- 딥러닝
- 뉴럴링크
- 오블완
- 인공지능
- AI 기술
- 일론 머스크
- PYTHON
- 티스토리챌린지
- 시간적 일관성
- OpenAI
- 서보모터
- Today
- Total
목록2024/08/31 (3)
AI 탐구노트
최소한의 인물 사진으로 나만의 디지털 트윈을 만들고 원하는 설정을 적용한 개인 사진을 생성할 수 있는 툴 체인 FaceChain은 최소 1장 (최대 3장)의 인물사진으로 나만의 디지털 트윈을 만들고 다양한 설정을 적용한 개인 인물사진을 생성할 수 있도록 해 주는 툴 체인입니다. 네이버나 카카오에서 프로필 사진을 생성하는 유료 서비스를 제공하고 있는데 이와 유사한 역할을 한다고 생각하면 될 것 같습니다. 이 툴 체인의 아키텍처를 보면 아시겠지만, 사용되는 모델들이 상당히 많으며 복잡한 처리 과정을 거칩니다. 모델로는 DamoFD (얼굴인식), 이미지 회전모델, M2FP (인간구문 분석모델), ABPN (피부 리터칭 모델), FairFace (얼굴 속성 인식모델), DeepDanbooru 모델, FQA(얼..
단일 뷰 얼굴 이미지에서 머리 전체의 3D 텍스처 모델을 생성하는 기술 PanoHead는 360° 모든 각도에서 일관된 고품질 3D 머리 이미지를 생성하는 최초의 3D GAN 모델입니다. 중국 바이트댄스와 위스콘신대 연구진이 공동으로 발표했죠. 기존의 GAN 방식은 높은 품질의 이미지 합성이 가능했지만 2D에 국한되어 서로 다른 방향에서 보는 장면을 합성하는데는 일관성이 제대로 보장되기 어려운 문제가 있었습니다. 그리고, 3D 모델을 만들기 위해서는 3D 스캔이나 별도의 렌더링 기술 적용 등의 추가적인 작업들이 필요했고 새로 등장한 모델들 또한 주로 정면에 가까운 시점만 제대로 지원이 되는 제약이 있었습니다. PanoHead는 이런 문제점들을 아래와 같은 기법을 이용해서 해결하고 있습니다. 트라이-그..
다양한 크기의 물체를 효과적으로 감지하기 위해 이미지를 슬라이스로 나누어 처리한 후 합치는 기법 객체감지 모델을 통해 작은 물체를 감지하는 것은 주로 항공, 드론, 위성 사진 등에서 찍힌 물체를 감지하는 경우에 많이 활용되며 경우에 따라서는 도로 상의 CCTV에서 원거리에 있는 물체를 판별할 때도 해당됩니다. 극히 작은 물체의 경우, 그 자체로도 감지가 쉽지 않은데 그보다 더 어려운 것은 큰 객체와 극히 작은 객체처럼 한 이미지 상에 다양한 스케일의 객체가 포함되어 있는 경우입니다. 학습할 때 이에 대한 고려가 충분히 되고 많은 데이터가 필요한 경우가 되는 것이죠. SAHI는 이미지에서 작은 물체를 감지하는데 도움이 되는 컴퓨터 비전 모델의 추론 기술입니다. 입력된 이미지에 대해 한번에 객체감지를 수행..