Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 이미지 편집
- 메타
- 오픈AI
- AI
- 딥마인드
- 오블완
- 일론 머스크
- OpenAI
- 생성형 AI
- AI 기술
- 우분투
- ControlNet
- 확산 모델
- 멀티모달
- tts
- ubuntu
- LORA
- 시간적 일관성
- 서보모터
- PYTHON
- 가상환경
- 뉴럴링크
- LLM
- TRANSFORMER
- javascript
- ChatGPT
- 인공지능
- 아두이노
- 티스토리챌린지
- 트랜스포머
Archives
- Today
- Total
AI 탐구노트
FlowSAM : 영상에서 물체를 분할하는 모델 본문
FlowSAM은 영상에서 움직이는 물체를 분할하는 모델
FlowSAM은 SAM 모듈과 Optical Flow를 사용하여 영상에서 움직이는 물체를 정확하게 분할하는 모델입니다. SAM(Self-Attention Mask) 모듈은 이미지에서 움직이는 물체와 배경을 구별하는데 사용되는 Attention 메커니즘으로 이미지의 특징을 효과적으로 학습하고 모델이 움직이는 물체에 집중하도록 하여 결과적으로 정확도를 향상시키도록 합니다. Optical Flow는 프레임 간 픽셀 이동을 추적해 움직임을 감지하는데 사용되는 기술로 움직임, 여기서는 특히 저속에서의 객체를 분할하는데 도움을 줍니다.
일반적으로 이미지에서 객체 분할을 하는 것에 비해 동영상에 적용되는 것이다보니, 감지 개체의 동일성을 유지하는 부분이 중요한데 이를 위해 시퀀스 수준 분할로 확장하는 기능을 제공하며. 특징으로는 높은 정확도, 실시간 영상 지원, 간단한 구조로 학습이 용이하다는 것 등이 있습니다.
'AI 기술' 카테고리의 다른 글
Surya : 90여개 다국어를 지원하는 OCR 툴킷 (0) | 2024.08.21 |
---|---|
OpenELM : 애플이 공개한 경량 언어 모델 (0) | 2024.08.21 |
Follow-Your-Emoji : 원하는대로 만드는 초상화 애니메이션 기술 (0) | 2024.08.17 |
LE3D : 고화질로 3D 장면 렌더링, 재구성하는 기술 (0) | 2024.08.17 |
DreamGaussian4D : 3D 영상을 생성하는 기술 (0) | 2024.08.16 |