일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- OpenAI
- ubuntu
- ControlNet
- AI 기술
- 일론 머스크
- 뉴럴링크
- TRANSFORMER
- javascript
- 가상환경
- LLM
- ChatGPT
- PYTHON
- 트랜스포머
- 티스토리챌린지
- 생성형 AI
- 오블완
- 인공지능
- 메타
- 딥마인드
- 확산 모델
- AI
- tts
- 시간적 일관성
- 서보모터
- 멀티모달
- 아두이노
- 우분투
- LORA
- 이미지 편집
- 오픈AI
- Today
- Total
목록2024/08/09 (4)
AI 탐구노트
유튜브를 보다 보면 자료나 테스트 데이터 용으로 영상 파일이나 오디오 파일을 다운받아야 할 때가 있습니다. 예를 들어 군중 영상이나 보행자 영상 등을 가지고 객체 감지나 움직임 트래킹을 하는 기능을 테스트 해야 하는 경우 등등이 있겠죠. 하지만 기본적으로 유튜브는 프리미엄 사용자가 아닐 경우, 영상의 다운로드 기능을 원칙적으로는 제공하지 않습니다.그래서, 이런 작업을 지원하는 도구를 사용하게 되는데 예전에는 youtube-dl 이라는 걸출한 커맨드 기반 도구가 있었습니다.하지만, 워낙 많이 알려지다보니 다운로드 방식이 차단되었고 이걸 다시 우회하는 yt-dlp라는 도구가 나왔습니다. 이 도구를 이용해 영상과 오디오 데이터를 다운로드 하는 방법을 기록해 둡니다. 도구 다운로드yt-dlp는 패키지 관리자..
우분투를 메인 운영체제로 사용하다 보면 문서 작성을 하고 싶을 때 불편함이 생깁니다.윈도우에서는 Ctrl+Shift+s 를 이용해서 특정 영역의 캡처를 쉽게 해 왔기 때문이죠. 물론 윈도우 10, 11에서 기능이 향상되기 전까지는 별도의 도구인 PicPick을 사용해야 했습니다만... 여튼 윈도우가 아닌 우분투를 사용하게 되면서 같은 방식으로 처리할 수 있도록 하고 싶었습니다. 그래서 찾아본 것이 'shutter'라는 도구였고 이걸 단축키를 등록해서 사용하도록 했는데 그 절차를 기록해 둡니다. 설정 과정 1.shutter 설치$ sudo apt install shutter 2.우분투 키보드 설정 창에서 맨 아래로 가서 커스텀하게 추가/변경 참고) 나중에는 윈도우와 동일하게 만들기 위해 바로가기 값을 ..
PC에 내장 GPU (Intel Internal)과 외장 GPU (NVIDIA) 이렇게 둘 다 있는 경우, 우분투 기본 윈도우 화면 지원은 Intel 내장 GPU를 사용하고, 외장 GPU는 딥러닝 전용으로 사용하는 방법을 알아봅니다. 이렇게 하는 것은 저렴한 GPU를 사용할 경우, GPU 메모리 자체가 작기 때문에, GUI 처리를 위해 사용되는 것을 최소화하는 것이 필요하기 때문입니다. 인터넷으로 찾아본 것과 ChatGPT에게 물어봐서 답변 받은 것 2가지를 각각 기록해 둡니다.예전 조사 당시의 기억으론 둘 다 작동했던 것 같은데... 흠... 1.xorg.conf 변경 방식# /etc/X11/xorg.conf 파일 생성 - 우분투는 기본은 생성되지 않음$ sudo nvidia-xconfig $..
CLASI (Cross Language Agent - Simultaneous Interpretation)는 대규모 언어 모델(LLM)을 활용한 동시 음성 번역 시스템입니다. 사람, 즉 동시통역사가 번역하는 수준의 품질을 목표로 합니다. '동시'+'통역' 영역이라 번역의 정확성과 지연 시간 둘 다 혹은 이들 간의 균형을 잡기 위해 다양한 기법을 사용하고 있습니다. 구조적으로는 LLM을 기반으로 한 인코더-조건부 아키텍처로, 음성 입력을 처리하고 외부 지식 및 이전 번역 문맥을 활용하여 번역을 생성합니다. 이 시스템은 다음과 같은 특징을 가지고 있습니다. 데이터 기반 읽기-쓰기 전략전문통역사의 문장 분할 방식을 학습하여 번역 품질과 지연 시간 간의 균형을 유지합니다.다중 모달 검색 모듈(MM-RAG)어려운..