일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- ubuntu
- 휴머노이드 로봇
- 딥러닝
- tts
- ChatGPT
- 서보모터
- ControlNet
- 아두이노
- OpenCV
- 멀티모달
- 오블완
- 텍스트-이미지 생성
- 티스토리챌린지
- OpenAI
- 메타
- 확산 모델
- 일론 머스크
- PYTHON
- AI 기술
- 우분투
- 생성형 AI
- 오픈AI
- 트랜스포머
- 인공지능
- LORA
- TRANSFORMER
- 시간적 일관성
- AI
- LLM
- 가상환경
- Today
- Total
목록분류 전체보기 (422)
AI 탐구노트
우분투에서 사용할 수 있는 이미지 뷰어우분투를 사용하면서 이미지를 다룰 때 불편한 점이 한가지 있습니다. 대부분 작업은 우분투에 기본으로 설치된 Image Viewer를 사용하게 되는데 이 툴은 단순히 이미지를 보기에는 나쁘지 않습니다. 하지만 조금만 더 작업하려고 하면 바로 한계를 느끼게 됩니다. 예를 들어 품질 저하 없이 이미지 회전, 크기 조절, 밝기나 채도 수정 같은 간단한 편집 기능이 아예 없거든요. 이런 작업을 하자고 GIMP 같은 무거운 프로그램을 띄우는 건 너무 과한 느낌입니다. 말 그대로 ‘배보다 배꼽이 더 큰 상황’이죠. 그런데 이런 고민을 깔끔하게 해결해줄 프로그램이 하나 있습니다. 바로 XnView-MP입니다. 윈도우 사용자에게 친숙한 XnView 사실 XnView는 오랫동안 윈도..
한컴 입력기? 공공에서 사용하는 문서를 생성/편집하려면 대부분 한글 프로그램을 사용해야 합니다. 그래서 대부분 회사에서는 MS 오피스 제품과 함께 한컴오피스에 있는 한글 프로그램을 병행 사용하고 있죠. 그런데, 이 경우, 많이 불편한 사항이 생기는데 그건 한컴 오피스 프로그램을 설치할 때 윈도우에 자동으로 설치되는 '한컴 입력기'입니다. 물론 이건 제가 워낙 'Microsoft 입력기'에 익숙해져 있어서 가지는 개인적인 느낌일 수도 있습니다. 프로그램 사용 중에 입력기가 기본으로 설정된 'Microsoft 입력기'에서 '한컴 입력기'로 변경되는 현상이 있습니다. 대부분 단축키의 키 조합이 충돌하는 경우에 그런 것으로 알고 있습니다. 게다가 한글 입력을 했는데 영문으로 바뀌거나 하는 경우와 같은 자잘하지..
가족과 함께 구석기 유적을 전시하고 있는 연천군 전곡선사박물관에 다녀왔습니다. 짧지만 간단한 후기를 써 봅니다. 혹시 관심있으신 분은 꼭 한번 방문해 보시길 추천 드립니다. 1.전곡선사박물관 기본 정보1.1.위치 및 서울에서의 교통편위치: 경기도 연천군 전곡읍 전곡리 일대(전곡리 선사유적지 인근)접근성:대중교통: 서울에서 출발할 경우, 동서울터미널 혹은 상봉터미널에서 연천 방면 버스를 이용해 전곡 터미널에 하차 후 도보나 지역버스로 접근할 수 있음전철/철도: 경원선(문산~연천 구간) 이용 시 전곡역 하차 후 택시나 도보로 이동 가능. (개별 일정에 따라 열차 운행 상황 확인 필요)자가용: 서울 북부권에서 자유로 또는 통일로를 통해 문산-연천 방향으로 이동 후 전곡IC 인근을 통해 접근할 수 있음홈페이지..
speck은 이미지를 연속적인 선으로 렌더링하여 각 가로(또는 세로) 픽셀 라인을 표현하는 파이썬 기반의 라인 아트 이미지 렌더러입니다. 이번 글에서는 speck이 제공하는 기능과 이를 이용한 간단한 테스트를 진행해 보겠습니다. 1.주요 기능:제공되는 주요 기능은 다음과 같은 것들이 있습니다. 선 두께 조절: 픽셀의 그레이스케일 값에 따라 선의 두께를 조절할 수 있습니다.노이즈 프로필 추가: 랜덤성을 부여하기 위해 다양한 노이즈 프로필을 적용할 수 있습니다.색상 프로필 추가: 선의 색상을 다양하게 표현하기 위해 색상 프로필을 적용할 수 있습니다.인터랙티브 조정: ipywidget을 사용하여 출력 결과를 실시간으로 조정할 수 있습니다. 대략 아래와 같은 이미지를 생성할 수 있다고 생각하시면 됩니다. ..
1. 서론우리가 흔히 보는 영화나 게임에서는 멋진 3D 그래픽과 애니메이션이 사용됩니다. 이 중, 볼류메트릭 비디오(Volumetric Video)라는 기술은 사람이나 사물을 여러 카메라로 촬영한 후, 이를 3D로 재구성해 사용자가 자유롭게 시점을 바꿀 수 있게 합니다. 예를 들어, 게임 캐릭터가 춤을 출 때, 옆에서 보다가 뒤에서 볼 수도 있는 기술입니다. 이 기술은 가상현실(VR), 증강현실(AR)이나 실시간 화상회의에서 매우 유용합니다. 그런데, 이 기술에는 몇 가지 제약사항이 존재합니다. 예를 들어 긴 영상(예: 5분 이상)을 만들려고 하면, 컴퓨터가 처리해야 할 데이터가 너무 많아서 그래픽카드(GPU)가 감당하기 어렵고, 파일도 너무 커져 저장하기도 힘듭니다. 게다가 영상이 길어질수록 처리 속도..
1. 서론사람이 어디를 보고 있는지를 추적하는 기술은 우리가 주변 세계와 상호작용하는 방식을 이해하는 데 중요한 역할을 합니다. 예를 들어, 대화 중 상대방의 시선 방향은 그들이 관심을 가지고 있는 대상을 파악하거나 의도를 추측하는 데 도움을 줍니다. 이런 기술은 특히 인간-컴퓨터 상호작용, 자율주행, 로봇 비전, 혹은 광고 효과 분석 등 다양한 분야에서 응용될 수 있습니다. 과거에는 시선 방향을 추적하기 위해 여러 종류의 데이터를 분석하고 조합하는 복잡한 시스템이 주로 사용되었습니다. 하지만 이러한 방식은 개발이 어렵고 많은 비용이 들며, 데이터가 부족한 환경에서는 정확도가 떨어지는 한계가 있었습니다. 최근에는 대규모 데이터를 바탕으로 학습된 인공지능 모델들이 여러 시각적 문제를 해결하는 데 매우 좋은..
최근 구글이 자사 블로그를 통해 양자컴퓨터 프로젝트 ‘윌로우(Willow)’를 공개하며 큰 주목을 받았습니다. 10자년 걸리는 문제 5분 만에… 구글, 양자컴 개발 성공자체 개발 양자칩 ‘윌로’ 장착 실시간 오류 수정 기술도 갖춰 구글이 현존 최고 성능의 슈퍼컴퓨터를 능가하는 양자컴퓨터를 개발했다. CNN방송 등에 따르면 구글은 9일(현지시간) 슈퍼컴퓨터n.news.naver.com 이는 구글의 양자컴퓨터 연구를 한 단계 끌어올린 최신 성과로 평가받고 있습니다. ‘윌로우’는 구글의 양자 AI팀이 개발한 새로운 초전도 양자 프로세서로, 이전 모델인 시카모어(Sycamore)를 능가하는 성능을 자랑합니다. 이 기술은 구글이 선언한 양자우월성의 연장선상에서 더욱 발전한 형태로, 복잡한 계산을 빠르게 수..
1. 서론앞서 다른 글에서도 언급한 것처럼 현대 디지털 디자인에서 벡터 그래픽은 스케일 조정의 유연성으로 인해 광범위하게 사용됩니다. 벡터 그래픽은 크기를 조정할 때 품질 손실이 없다는 점에서 레스터 이미지보다 뛰어난 장점을 가지고 있죠. 하지만, 대부분의 인공지능 연구는 레스터 이미지 생성에 집중되어 있으며, 벡터 그래픽을 학습하거나 생성하려는 노력은 상대적으로 부족했습니다. 이러한 한계를 극복하기 위해 DeepSVG라는 새로운 접근이 제시되었습니다. DeepSVG는 SVG(Scalable Vector Graphics) 형식의 복잡한 벡터 그래픽을 생성하고 애니메이션을 지원하는 계층적 생성 네트워크입니다. 이 모델은 벡터 그래픽 데이터를 효율적으로 표현할 수 있는 계층적 구조를 활용하여 복잡한 아이콘을..
1. 서론 그래픽 디자인에서 벡터 이미지는 이미지의 해상도에 구애받지 않고 렌더링 가능하다는 특징을 가지고 있습니다. 선화(Sketch) 이미지가 벡터화 되면 공학 설계나 2D 애니메이션, 3D 프린팅 등 다양한 산업에서 폭넓게 활용될 수 있습니다. 하지만 스케치를 수작업으로 벡터화하는 것은 많은 시간과 노력이 소요되며, 복잡한 선화를 간소화하거나 사진에서 선화를 생성하는 작업은 더욱 까다롭습니다. 최근 머신러닝 기술은 복잡한 이미지 처리와 변환 작업에서 두각을 나타내고 있습니다. 그러나 기존의 벡터화 알고리즘은 주로 고정 해상도를 처리하거나 픽셀 기반으로 작동하며, 다소 제한적인 범용성을 갖고 있었습니다. 이러한 한계를 극복하기 위해 다양한 해상도의 입력 이미지를 처리하고 벡터화를 수행할 수 있는 범용..
1. 서론벡터 그래픽스는 우리가 사용하는 폰트, 로고, 그림 등에서 자주 사용됩니다. 픽셀로 이루어진 이미지와 달리 무한히 확대해도 깨지지 않고 파일 크기도 작아 다루기 쉽습니다. 하지만 이런 벡터 그래픽스를 만들려면 전문적인 기술이 필요하거나, 벡터 데이터를 학습하는 복잡한 인공지능 모델이 필요합니다. 게다가 벡터 데이터셋은 구하기도 쉽지 않죠. 이를 해결하기 위해 논문에서는 벡터 데이터 없이도 이미지 데이터를 사용해 벡터 그래픽스를 만드는 새로운 방법인 Im2Vec을 제안했는데 이 방법은 일반 이미지(레스터) 데이터를 학습하고, 이를 통해 벡터 형태의 그림을 생성할 수 있는 기술입니다. 2. 본론2.1 기존 방식의 문제점기존에는 벡터 그래픽스를 만들기 위해 벡터 데이터를 학습시켜야 했습니다. 예를 ..