일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 이미지 생성
- OpenCV
- ubuntu
- 우분투
- 다국어 지원
- 아두이노
- 티스토리챌린지
- 트랜스포머
- 휴머노이드 로봇
- 오픈소스
- OpenAI
- AI
- 인공지능
- 강화 학습
- AI 기술
- 딥러닝
- tts
- 오블완
- 오픈AI
- 생성형 AI
- TRANSFORMER
- ChatGPT
- 메타
- 실시간 렌더링
- 확산 모델
- LORA
- 시간적 일관성
- LLM
- PYTHON
- 일론 머스크
- Today
- Total
목록전체 글 (568)
AI 탐구노트
KAIST 박종세 교수팀은 자율주행차와 로봇에 적합한 신경망처리장치(NPU)와 소프트웨어 시스템을 개발하여, 한정된 자원에서도 온디바이스 AI의 정확도를 높이는 성과를 냈으며 이 연구로 국제 컴퓨터 구조 심포지엄(ISCA)에서 최우수 연구 기록물상을 수상했습니다. 온디바이스 AI는 연산과 메모리 자원이 제한적이기 때문에 정확도가 떨어지는 문제가 있었지만, 연구팀은 연속학습 기법을 통해 이를 개선했습니다. 연구팀은 온디바이스 자원만으로 변화하는 환경에 맞춰 AI 모델의 정확도를 높이는 저전력·고효율 시스템을 개발했습니다. NPU를 공간적으로 분할하여 연산량이 낮은 추론에 자원을 최소로 할당하고, 나머지 자원을 재훈련과 라벨링에 활용함으로써 연속학습 성능을 향상시켰습니다. 연구팀은 실제 차량 데이터를 활용..
Windows에서 Linux를 사용하기 위해서는 WSL(Windows Subsystem for Linux) 을 이용해야 합니다.최근에는 초기보다 훨씬 안정화되어 생각보다 손쉽게 구성할 수 있고 기능 또한 잘 작동합니다. 다만, 본체가 되는 Windows에서 손쉽게 사용하던 USB 카메라 등을 WSL 상의 Linux에서는 제대로 인식시켜 사용하기 어렵다는 문제가 있습니다. 이것을 Windows와 WSL 간의 가상 네트워크를 이용해 USB 연결을 지원하는 방법이 있는데 그때 사용되는 것이 USB/IP 인데 Windows와 WSL 상의 Linux에서 각각 이를 지원해야 합니다. 각각의 도구를 설치하고 연결하는 과정을 정리해 보고자 합니다. 참고로 제가 테스트한 환경은 다음과 같으며 Windows Cons..

일론 머스크는 뉴럴링크의 두 번째로 인간에게 뉴럴링크의 칩을 이식하는 임플란트 수술이 성공적으로 마무리되었다고 밝혔습니다. 렉스 프리드먼과의 팟캐스트 인터뷰를 통해 소개된 이 내용은 실은 몇 개월 전부터 예정되어 있는 것으로 보도되었던 사항입니다. 이 수술은 척수 손상을 입은 마비 환자가 대상이었고 400개의 전극을 뇌에 이식하는 방식으로 진행되었다고 합니다. ‘텔레파시’로 불리는 뉴럴링크의 칩은 뇌파을 수집할 수 있는 총 1024개의 전극을 가지며, 대뇌의 운동피질 근처에 구멍을 내고 심게 되는데 이 칩이 읽은 신호를 해석해서 기기를 조작할 수 있는 동작으로 바꿔주는 역할을 하게 됩니다. 이보다 앞선 올해 1월 29일, 첫번째 진행된 임상수술이 있었죠. 대상은 다이빙을 하다가 불의의 사로고 전신마비가..

Anaconda를 이용해 CUDA, cuDNN가 지원되는 가상환경을 만드는 과정은 다음과 같습니다.간소화된 버전이라 이후 필요한 python 패키지들에 대해서는 각자 준비하는 것으로... CUDA 12.4에 cuDNN은 최신 버전, Python은 3.11로 맞추며, Anaconda는 이미 설치되어 있다고 가정합니다. NVIDIA driver 설치다만 CUDA를 설치하기 위해서는 해당 버전을 지원하는 Nvidia driver가 미리 설치되어 있어야 합니다. 지원하는 CUDA 버전을 확인하는 방법은 다음과 같습니다. (오른 쪽 상단 확인. 12.4 버전까지 지원한다는 의미) $ nvidia-smi CUDA 설치 (12.4 버전)$ wget https://developer.download.nvidia.c..

SA-DVAE는 분리 변이 오토인코더(Disentangled Variational Autoencoders)를 활용하여 스켈레톤 기반 제로샷 액션 인식을 개선하는 모델입니다. 기존 제로샷 스켈레톤 기반 액션 인식 방법은 스켈레톤 특징과 텍스트 임베딩을 동일한 잠재 공간으로 정렬합니다. 그러나, 스켈레톤 데이터는 다양한 시퀀스를 포함하고 있지만 텍스트 임베딩은 고정된 클래스 레이블로 이뤄져 있어, 두 모달리티 사이에 불균형이 발생할 수 있다는 문제가 있습니다. SA-DVAE는 스켈레톤 특징을 의미 관련 부분과 무관한 부분으로 분리하여 의미 있는 스켈레톤 특징과 텍스트 특징을 보다 잘 정렬하는 방법을 사용하여 데이터 불균형 문제를 해결하고 일반화 능력을 향상시킵니다. 두 개의 모달리티 특화 변이 오토인코더..
KAIST 이재길 전산학부 교수팀이 새로운 지식을 축적할 때 기존 학습 지식을 유지하도록 하여 효과적인 연속 학습(continual learning)을 할 수 있는 인공지능 기술을 개발했다고 밝혔습니다. 사용자의 관심이 변하더라도 과거 지식을 활용해 새로운 정보를 학습할 수 있도록 하는 방식입니다. 특정 작업을 위해 훈련된 신경망이 다른 작업을 진행하게 되면 이전 작업에 대한 정확도가 떨어지게 되는데, 연구진이 제안한 '적응적 프롬프팅' 방식은 유사한 작업의 경우 기존 프롬프트에 지식을 추가로 축적하고 완전히 새로운 작업이 나타날 때만 프롬프트를 생성하여 정보 혼합을 방지하도록 함으로써 신경망의 성능을 개선하고 학습 비용을 절감할 수 있도록 합니다. 실제 데이터로 실험한 결과, 다양한 작업 변화 상황에서..

SkateFormer는 스켈레톤-시간적 관계를 효율적으로 캡처하여 행동 인식의 정확성을 향상시킨 모델입니다. 인간 행동을 인식하기 위해 객체의 스켈레톤의 조인트 좌표 데이터와 이들의 연결성을 기반으로 하는 사례는 이전에도 많이 있었습니다. GCN(Graph Convolution Network)은 조인트 연결성의 수용 영역 제한, 즉 물리적으로 먼 조인트 간의 관계를 포착하기 힘들다는 문제점이 있었고, Transformer 기반 방식은 모든 프레임의 모든 조인트 간의 상관 관계를 계산해야 해서 많은 메모리 자원과 계산이 필요하다는 문제점이 있었습니다. SkateFormer는다음과 같은 접근 방법을 통해 문제점을 해결합니다.스켈레톤-시간적 분할 전략 스켈레톤-시간적 관계를 다음의 네 가지 유형으로 분류하고..
구글이 구글 포토의 AI 기반 사진 편집 도구를 무료화했습니다. 이로써 사용자들은 구독 없이도 강력한 AI 기능이 접목된 사진 편집 기능을 활용할 수 있게 되었습니다. 이러한 기능들은 사진의 복잡한 편집 작업을 단순하고 직관적으로 처리할 수 있도록 도와주기 때문에 사용자가 손쉽게 창의적인 사진을 제작할 수 있습니다. 이번 무료화를 통해 사용자가 사진을 자유롭게 편집하고 공유할 수 있는 문화 확산이 기대됩니다. 구글은 안드로이드와 iOS 기기에서도 원활하게 작동할 수 있도록 기술적 노력을 기울였다고 밝혔습니다. 지원되는 AI 기능으로는 다음과 같은 것들이 있습니다. 매직 에디터 (Magic Editor): 다양한 AI 도구를 통합하여 사진의 특정 부분을 쉽게 수정하는 기능입니다. 사용자는 직관적인 선택 ..