일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 다국어 지원
- OpenCV
- 생성형 AI
- 딥러닝
- 실시간 렌더링
- 인공지능
- AI 기술
- tts
- 메타
- LLM
- 확산 모델
- LORA
- 강화 학습
- 우분투
- PYTHON
- gradio
- ChatGPT
- 오픈소스
- ubuntu
- 코딩
- 일론 머스크
- OpenAI
- AI
- 시간적 일관성
- 티스토리챌린지
- 휴머노이드 로봇
- 오픈AI
- 트랜스포머
- 3d 재구성
- 오블완
- Today
- Total
목록실시간 (2)
AI 탐구노트

1. 서론디지털 기술이 발전하면서 사람처럼 대화할 수 있는 AI 기술에 대한 관심이 커지고 있습니다. 특히, 얼굴 표정과 머리 움직임을 자연스럽게 구현하는 기술은 화상 회의, 가상 비서, 엔터테인먼트 등 다양한 분야에서 유용하게 쓰일 수 있기 때문에 많은 곳에서 연구를 진행하고 있습니다. 이 논문에서는 INFP라는 새로운 기술을 소개하고 있는데, 이는 사람의 목소리를 듣고 적절한 얼굴 표정과 머리 움직임을 만들어냅니다. 중요한 점은, 이 기술이 사람처럼 대화 상황에 따라 자유롭게 '말하기'와 '듣기' 상태를 전환할 수 있다는 것입니다. 예를 들어 두 사람이 대화를 하는 상황이면 한 사람이 말을 하면 상대는 이를 듣는 동안 표정이나 움직임을 보인다는 거죠. 이는 기존 기술이 특정 역할(화자나 청자)에만 ..

1. 서론 시각적 객체 추적은 비디오 데이터를 분석하고 추적해야 하는 다양한 애플리케이션에서 필수적인 기술로 자리 잡고 있습니다. 자율 주행, 비디오 감시, 스포츠 분석 등에서 객체를 정확히 추적하는 기술은 주변 상황의 이해와 그 속에 있는 객체들의 행동 예측을 가능하게 만듭니다. 하지만 복잡한 배경, 객체 간의 가려짐, 그리고 객체들의 빠른 움직임은 전통적인 추적 시스템에 심각한 제약을 초래합니다. 이러한 문제를 해결하기 위해 인공지능 기반의 기술은 지속적으로 발전하고 있으며, 특히 세그멘테이션 중심의 접근 방식은 정교한 결과를 제공합니다. 최근에는 메타가 공개한 Segment Anything Model(SAM)이 세그멘테이션 분야에서 주목할 만한 성과를 거두었습니다. SAM은 다양한 입력 프롬프트를 ..