일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 오픈AI
- 뉴럴링크
- 오블완
- 인공지능
- 트랜스포머
- 아두이노
- ControlNet
- 확산 모델
- 딥러닝
- OpenAI
- 일론 머스크
- ubuntu
- 딥마인드
- 메타
- 생성형 AI
- 휴머노이드 로봇
- 티스토리챌린지
- ChatGPT
- 시간적 일관성
- 멀티모달
- LORA
- LLM
- PYTHON
- 가상환경
- 우분투
- 서보모터
- AI
- tts
- TRANSFORMER
- AI 기술
- Today
- Total
목록2024/08/05 (5)
AI 탐구노트
Anaconda를 이용해 CUDA, cuDNN가 지원되는 가상환경을 만드는 과정은 다음과 같습니다.간소화된 버전이라 이후 필요한 python 패키지들에 대해서는 각자 준비하는 것으로... CUDA 12.4에 cuDNN은 최신 버전, Python은 3.11로 맞추며, Anaconda는 이미 설치되어 있다고 가정합니다. NVIDIA driver 설치다만 CUDA를 설치하기 위해서는 해당 버전을 지원하는 Nvidia driver가 미리 설치되어 있어야 합니다. 지원하는 CUDA 버전을 확인하는 방법은 다음과 같습니다. (오른 쪽 상단 확인. 12.4 버전까지 지원한다는 의미) $ nvidia-smi CUDA 설치 (12.4 버전)$ wget https://developer.download.nvidia.c..
SA-DVAE는 분리 변이 오토인코더(Disentangled Variational Autoencoders)를 활용하여 스켈레톤 기반 제로샷 액션 인식을 개선하는 모델입니다. 기존 제로샷 스켈레톤 기반 액션 인식 방법은 스켈레톤 특징과 텍스트 임베딩을 동일한 잠재 공간으로 정렬합니다. 그러나, 스켈레톤 데이터는 다양한 시퀀스를 포함하고 있지만 텍스트 임베딩은 고정된 클래스 레이블로 이뤄져 있어, 두 모달리티 사이에 불균형이 발생할 수 있다는 문제가 있습니다. SA-DVAE는 스켈레톤 특징을 의미 관련 부분과 무관한 부분으로 분리하여 의미 있는 스켈레톤 특징과 텍스트 특징을 보다 잘 정렬하는 방법을 사용하여 데이터 불균형 문제를 해결하고 일반화 능력을 향상시킵니다. 두 개의 모달리티 특화 변이 오토인코더..
KAIST 이재길 전산학부 교수팀이 새로운 지식을 축적할 때 기존 학습 지식을 유지하도록 하여 효과적인 연속 학습(continual learning)을 할 수 있는 인공지능 기술을 개발했다고 밝혔습니다. 사용자의 관심이 변하더라도 과거 지식을 활용해 새로운 정보를 학습할 수 있도록 하는 방식입니다. 특정 작업을 위해 훈련된 신경망이 다른 작업을 진행하게 되면 이전 작업에 대한 정확도가 떨어지게 되는데, 연구진이 제안한 '적응적 프롬프팅' 방식은 유사한 작업의 경우 기존 프롬프트에 지식을 추가로 축적하고 완전히 새로운 작업이 나타날 때만 프롬프트를 생성하여 정보 혼합을 방지하도록 함으로써 신경망의 성능을 개선하고 학습 비용을 절감할 수 있도록 합니다. 실제 데이터로 실험한 결과, 다양한 작업 변화 상황에서..
SkateFormer는 스켈레톤-시간적 관계를 효율적으로 캡처하여 행동 인식의 정확성을 향상시킨 모델입니다. 인간 행동을 인식하기 위해 객체의 스켈레톤의 조인트 좌표 데이터와 이들의 연결성을 기반으로 하는 사례는 이전에도 많이 있었습니다. GCN(Graph Convolution Network)은 조인트 연결성의 수용 영역 제한, 즉 물리적으로 먼 조인트 간의 관계를 포착하기 힘들다는 문제점이 있었고, Transformer 기반 방식은 모든 프레임의 모든 조인트 간의 상관 관계를 계산해야 해서 많은 메모리 자원과 계산이 필요하다는 문제점이 있었습니다. SkateFormer는다음과 같은 접근 방법을 통해 문제점을 해결합니다.스켈레톤-시간적 분할 전략 스켈레톤-시간적 관계를 다음의 네 가지 유형으로 분류하고..
구글이 구글 포토의 AI 기반 사진 편집 도구를 무료화했습니다. 이로써 사용자들은 구독 없이도 강력한 AI 기능이 접목된 사진 편집 기능을 활용할 수 있게 되었습니다. 이러한 기능들은 사진의 복잡한 편집 작업을 단순하고 직관적으로 처리할 수 있도록 도와주기 때문에 사용자가 손쉽게 창의적인 사진을 제작할 수 있습니다. 이번 무료화를 통해 사용자가 사진을 자유롭게 편집하고 공유할 수 있는 문화 확산이 기대됩니다. 구글은 안드로이드와 iOS 기기에서도 원활하게 작동할 수 있도록 기술적 노력을 기울였다고 밝혔습니다. 지원되는 AI 기능으로는 다음과 같은 것들이 있습니다. 매직 에디터 (Magic Editor): 다양한 AI 도구를 통합하여 사진의 특정 부분을 쉽게 수정하는 기능입니다. 사용자는 직관적인 선택 ..