일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- tts
- 메타
- 서보모터
- 확산 모델
- javascript
- LLM
- AI
- 아두이노
- 이미지 편집
- 뉴럴링크
- 멀티모달
- TRANSFORMER
- LORA
- AI 기술
- 일론 머스크
- PYTHON
- 시간적 일관성
- 오픈AI
- 생성형 AI
- 트랜스포머
- ubuntu
- 티스토리챌린지
- 가상환경
- OpenAI
- ChatGPT
- ControlNet
- 인공지능
- 딥마인드
- 우분투
- 오블완
- Today
- Total
목록PYTHON (14)
AI 탐구노트

speck은 이미지를 연속적인 선으로 렌더링하여 각 가로(또는 세로) 픽셀 라인을 표현하는 파이썬 기반의 라인 아트 이미지 렌더러입니다. 이번 글에서는 speck이 제공하는 기능과 이를 이용한 간단한 테스트를 진행해 보겠습니다. 1.주요 기능:제공되는 주요 기능은 다음과 같은 것들이 있습니다. 선 두께 조절: 픽셀의 그레이스케일 값에 따라 선의 두께를 조절할 수 있습니다.노이즈 프로필 추가: 랜덤성을 부여하기 위해 다양한 노이즈 프로필을 적용할 수 있습니다.색상 프로필 추가: 선의 색상을 다양하게 표현하기 위해 색상 프로필을 적용할 수 있습니다.인터랙티브 조정: ipywidget을 사용하여 출력 결과를 실시간으로 조정할 수 있습니다. 대략 아래와 같은 이미지를 생성할 수 있다고 생각하시면 됩니다. ..

1.문제점Yolov8 이후부터 객체 감지를 코드를 실행하면 로그가 아래와 같이 발생합니다. 흠... 내가 찍으라고 한 것도 아닌데 이건 뭐지? 그냥 python에서 로그 안 남기도록 하거나 log level을 높이면 되나? 했는데 그걸로도 안 돼네요. 0: 480x640 1 person, 67.0msSpeed: 2.7ms preprocess, 67.0ms inference, 87.1ms postprocess per image at shape (1, 3, 480, 640)0: 480x640 1 person, 8.1msSpeed: 1.3ms preprocess, 8.1ms inference, 1.3ms postprocess per image at shape (1, 3, 480, 640)0: 480x640 1..

1.들어가며아주 예전 코딩의 시작은 어떤 프로그래밍 언어를 사용하건 'hello, world!'를 콘솔에 찍어보는 것이었습니다. 찾아보니 이 행위는 1978년에 출판된 C 프로그래밍 책인 "The C Programming Language"에서 비롯된 것이라고 합니다. 사실 그 전에도 어셈블리, 베이식, 포트란, 등등 다양한 언어가 있었고 콘솔 출력은 당연히 할 수 있는 것이었는데, 뭔가 C 프로그래밍 언어의 출현이 가져올 상황을 미리 알기라도 한 듯 새로운 세계를 향한 인사를 한 것 같이 되어 버렸습니다. 2.개발 대상그런데, 최근에는 Native나 Web 기반의 UI 프로그램으로 개발을 시작하는 분들이 많아지다보니 과거의 Hello World를 찍던 프로그램이 이젠 할일 목록 (To-Do List)를..

필요성 NVIDIA GPU를 사용하면서, AI 모델 추론이나 학습을 시키면서 남아 있거나 현재 사용 중인 GPU 현황이 궁금했던 적이 있을 겁니다. 모델 하나를 더 로딩하려다가 GPU 사용량 초과, 메모리 부족 등으로 인해 문제가 생기는 경우가 발생할 수 있기 때문이죠. 프레임워크에서 알아서 완벽하게 처리를 해 주면 좋겠지만 그렇지 못한 경우들이 종종 나타날 수 있기 때문에 서비스를 제공하는 입장에서는 항상 모니터링을 할 수 있도록 준비를 해 두는 것이 필요할 수 있습니다. 방법GPU 현황을 확인하는 방법은 다음과 같은 것들이 있습니다 . 1.별도의 창에서 nvidia-smi, nvitop 과 같은 외부 도구를 이용해 별도로 모니터링2.pycuda, pynvml 등의 NVIDIA python 패키지를..

Gradio란 Gradio는 머신러닝 모델을 손쉽게 웹 인터페이스로 배포할 수 있는 Python 라이브러리입니다. 복잡한 코드나 환경 구성 없이 손쉽게 몇 안 되는 코드만으로 웹 브라우저에서 다양한 기능을 구현하고 테스트할 수 있죠. 최근까지 많은 업그레이드가 진행되면서 이미지, 텍스트, 오디오, 비디오 등의 입력 타입을 지원해 주고 있습니다. Gradio 5에서 WebRTC 지원 그런데, 사용하면서 느꼈던 아쉬운 것은 완전 실시간 영상 처리는 어렵다는 것이었습니다. 그랬는데... Gradio 5가 나오면서 이 문제가 해결되었습니다. 다음은 Gradio 5를 소개하는 페이지에서 나오는 내용입니다. “I can’t build realtime apps in Gradio” → We have unlocked..

예전 글에서 Head Tracking 하는 테스트를 하던 중 가지고 있던 서보모터가 연속형(360도)이라 각도 조절이 어려웠다는 얘기를 한 적이 있습니다. Headshot Tracking 따라해 보기 - 1편재미난 것 발견! 작년 쯤에 유튜브를 보다가 재미난 장난감을 만든 분의 영상을 발견했습니다. 서보모터를 이용해 Pan-Tilt를 할 수 있는 장비를 만들고 (실제 알리에서 판매하고 있음),카메42morrow.tistory.com 최고 속도로 회전을 하는데 움직인 시간을 조절해서 각도를 조절해야 하다보니 원하는 각도를 정확히 맞추는 것이 어려웠습니다. 할 때마다 미묘하게 차이가 발생했었는데 이게 계속 누적이 되다보면 원치않은 위치에 가 있는 것을 확인할 수 있거든요. 연속형(360도)에서는 전..

Github repository에 올라온 코드들을 테스트할 때 보면, Python 패키지 설치 방법이 다양한 것을 알 수 있습니다. 그래서, 어떤 종류가 있고 어떻게 다른가를 조사해 봤습니다. Python 패키지 설치 방식 별 간략 특징 주로 많이 사용하는 방식은 대략 아래와 같이 3가지 정도 되는 것 같습니다. 그 가운데 저도 가장 익숙한 것이 requirements.txt 파일로 하는 방식이고 나머지 최근 방식이 현재 디렉토리 내 패키지 설치 방식인 것 같습니다. 각자가 익숙하고 편한 방법을 택하면 될 것 같고 github repository의 경우에도 개발자가 자신의 방식대로 설정해 뒀을 겁니다. pip install .현재 디렉토리에 있는 패키지 설치 setup.py 파일이나 pyproj..

국기 모양을 보고 나라 이름 맞추기를 하는 간단한 프로그램을 만들어 볼까 합니다.아이와 같이 놀 수 있는 장난감을 만드는거죠. 예상되는 과정은 다음과 같습니다. 1.국가 별 국기 이미지 및 국가명 수집 국가코드를 파일명으로 가진 svg, png 타입의 파일이 필요합니다.직접 그릴 수는 없으니 만들어진 것 가운데 저작권 등 문제가 없는 것을 찾아보려고 합니다. 2.국가코드로 국가명 매칭하는 코드 작성예를 들어 br.svg 파일은 브라질의 국기이고, ch.svg는 스위스의 국기입니다.국기를 보여주고 국가명을 맞추는 것이니 국가명이 한국어와 영어로 매핑되도록 테이블을 생성해야 합니다. 3.퀴즈 프로그램 작성 복잡하지 않게 웹 페이지 하나로 만들어서 바로 사용할 수 있도록 할 계획입니다. 1.국가 별 국기..
이전 글에서는 아두이노에 조이스틱을 연결해서 움직임 값을 시리얼 모니터로 확인해 봤습니다.서보모터 2개의 연결은 아래 이전 글을 참고하시면 됩니다. [DIY 테스트] - 아두이노 : 조이스틱으로 서보모터 조종하기 - 1편 이번에는 조이스틱을 조종해 서보모터를 동작시키는 것을 해볼 생각입니다. 이를 위해 다음과 같은 작업을 진행합니다. Python으로 pyfirmata 패키지를 이용해 아두이노를 컨트롤합니다.조이스틱 움직임을 읽어와서 이를 이용해 다시 서보모터를 조종하도록 합니다. Python 코드 생성코딩은 ChatGPT한테 시켰는데 아주 잘 만들어 줍니다. ^^; 주문사항은 아두이노, 서보모터, 조이스틱이 각각 어떻게 매핑되어 있고 조이스틱을 누르면 중지/재시작을 수행해라 정도였습니다.후자의 경우는 ..

재미난 것 발견! 작년 쯤에 유튜브를 보다가 재미난 장난감을 만든 분의 영상과 코드(깃헙)을 발견했습니다. 서보모터를 이용해 Pan-Tilt를 할 수 있는 장비를 만들고 (실제 알리에서 판매하고 있음),카메라 영상에서 인공지능 안면감지를 이용해 얼굴, 특히 미간을 트래킹하도록 한 것입니다. 영상을 보면 아무리 피해도 이 스나이퍼는 놓치질 않습니다. 비슷한 영상을 유튜브 상에서 많이 볼 수 있는데 이 경우처럼 단순 트래킹하고 트래킹된 지점을 화면 상에 표시하는 것 외에 아이들 장난감을 이용해 발사하는 것까지 구현해 둔 사례도 있죠. 어디에 써먹을 수 있나? 실제로 이런 기술이 적용된 사례는 많습니다.홈 카메라나 화상회의 카메라에 화자의 얼굴을 따라가면 비춰주는 사례도 있고 (상용화된 제품도 있음),..