일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- LORA
- 강화 학습
- tts
- OpenAI
- 메타
- 시간적 일관성
- OpenCV
- TRANSFORMER
- 일론 머스크
- AI
- 다국어 지원
- 오블완
- 멀티모달
- 오픈AI
- 오픈소스
- 티스토리챌린지
- AI 기술
- 이미지 생성
- 확산 모델
- 휴머노이드 로봇
- 딥러닝
- 인공지능
- 우분투
- 실시간 렌더링
- LLM
- 트랜스포머
- 아두이노
- 생성형 AI
- ChatGPT
- PYTHON
- Today
- Total
목록딥러닝 (12)
AI 탐구노트

안면 비식별화 개인정보보호가 중요해진터라 수집된 영상에서 사람들의 안면을 비식별 처리하는 것이 중요해졌습니다.불특정 다수가 포함되는 경우가 많은 CCTV의 경우에는 이러한 것이 이젠 의무화가 되다시피 했죠. 안면 비식별화는 인공지능이 확산되기 전부터 해 오던 작업이었습니다.초기에는 컴퓨터 비전 (Computer Vision) 기술을 이용하곤 했었죠. 그러다 딥러닝 기반으로 사람의 안면영역을 바운딩 박스나 윤곽형태를 감지하는 기술이 등장했습니다. 딥러닝 기반의 안면 비식별화 객체감지, 안면감지 모델 등에 대해서는 또 다른 글이 필요할 것 같으니 목적에 맞게 건너 뛰고 이번 글에서는 바운딩 박스 형태 감지와 안면 윤곽 기반 감지를 기준으로 비식별화를 하는 방식을 구현해 보겠습니다. 하나는 바운딩 박스 ..

사람의 2D 포즈 추정, 신체 부위 분할, 깊이 예측, 표면 법선 예측을 수행하는 단일 모델 Sapiens는 인간 중심의 4가지 주요 비전 작업(2D 포즈 추정, 신체 부위 분할, 깊이 예측, 표면 법선 예측)을 위한 고성능 비전 트랜스포머 모델입니다. 기존 모델들은 인간 중심의 비전 작업에서 일반화 성능이 낮고, 다양한 작업을 일관되게 수행하기 어렵다는 한계가 있었습니다. 또한, 현실 세계의 데이터를 충분히 반영하지 못하거나, 고해상도 출력을 지원하지 못해 세부적인 표현이 부족했습니다. Sapiens는 3억 장 이상의 인간 이미지 데이터셋(Human-300M)로 MAE(Masked AutoEncoder) 접근 방식을 사용하여 사전 학습된 비전 트랜스포머 모델(ViT)을 활용하여 2D 포즈 추정, 신체..