일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 아두이노
- 다국어 지원
- 딥러닝
- ChatGPT
- AI 기술
- 휴머노이드 로봇
- 오픈AI
- LORA
- OpenCV
- tts
- 멀티모달
- 강화 학습
- 트랜스포머
- TRANSFORMER
- Stable Diffusion
- 티스토리챌린지
- 오블완
- 확산 모델
- 인공지능
- 시간적 일관성
- ubuntu
- 메타
- 생성형 AI
- AI
- 일론 머스크
- 오픈소스
- PYTHON
- OpenAI
- 우분투
- LLM
- Today
- Total
목록2024/11 (70)
AI 탐구노트

1.서론1.2.기존 LLM의 문제점 ChatGPT와 같은 기존 대형 언어 모델(LLM) 추론은 텍스트 생성 등의 작업에서 모든 레이어를 거치면서 순차적 계산을 합니다. 당연히 처리 속도가 느리고 많은 메모리가 필요하게 되며 일반 컴퓨터에서는 효율적이지 않습니다. 특히 모바일 기기나 엣지 디바이스 등에서 실행하기에는 무리가 있죠. 기존의 속도를 높이기 위한 방법으로 다른 방식들도 초안 기본 모델과 검증 모델 두개를 사용해 예측하기 위해 복잡한 구현물과 많은 메모리 사용이 역시 문제였습니다. 1.2.LayerSkipLayerSkip은 Meta에서 공개한, 대형 언어 모델의 추론 속도를 높이기 위해 레이어를 건너뛰는 기법과 자가 추론 방식을 결합하여 연산 비용을 줄이면서도 정확도를 유지할 수 있습니다. 그리..

1.1.Remmina란?Remmina는 우분투와 같은 리눅스 기반 시스템에서 원격 데스크탑을 사용하기 위한 유용한 도구입니다. 윈도우에서는 mstsc와 같은 도구를 이용해서 다른 윈도우 또는 xrdp를 사용하는 리눅스 등에 RDP 기반 원격 접속을 합니다. 2.풀고 싶은 문제2.1.작동 환경 우분투(호스트) : Remmina가 설치된 상태윈도우 11 (게스트) : 원격 데스크탑 서비스 활성화 및 네트워크 설정 완료, 방화벽 허용된 상태2.2.동작 구현 윈도우에서 mstsc를 이용해서 원격 접속을 하면 클립보드 기능을 이용해 파일이나 텍스트 등을 게스트와 호스트 간에 전송할 수 있습니다. 그런데, Remmina도 똑같은 방식으로 가능할 것이라 생각했는데 안 되는 겁니다. 그래서, 이 글에서는 우분투 호스..

3분기 실적 발표에서 구글, 아마존, 마이크로소프트는 시장 예상을 뛰어넘는 성과를 기록했습니다. 구글 (알파벳)3분기 매출: 882억7000만 달러 (약 122조2804억원)전년 동기 대비 15% 증가클라우드 매출: 113억5000만 달러 (약 15조6700억원), 전년 동기 대비 35% 증가아마존3분기 매출: 1588억7700만 달러 (약 218조8530억원)전년 동기 대비 11% 증가아마존웹서비스(AWS) 매출: 274억5200만 달러 (약 37조8288억원), 전년 동기 대비 19% 증가마이크로소프트 (MS)3분기 매출: 655억9000만 달러 (약 90조4000억원)전년 동기 대비 16% 증가인텔리전트 클라우드 부문 매출: 20% 증가 이 세 거대 기업이 공통으로 눈에 띄는 실적을 낸 배경에는 ..

1.서론1.1.기존 방식의 문제점웹 개발에서 UI(사용자 인터페이스) 디자인을 HTML 코드로 바꾸는 작업은 초보자와 전문가 모두에게 어려운 일입니다. HTML은 부모와 자식 관계로 복잡하게 엮여 있는 구조를 가지고 있어 이미지와 텍스트 같은 시각적 요소가 포함된 UI 디자인을 코드로 변환하기 위해서는 HTML의 구조를 제대로 이해하고 UI 이미지와 코드 간의 미세한 차이를 잘 알고 있어야 하기 때문입니다. 1.2.WAFFLE이란?WAFFLE은 UI 디자인을 HTML 코드로 쉽게 변환하도록 돕는 AI 기술입니다. HTML의 복잡한 구조와 이미지에서 코드를 추출하는 어려움을 해결하기 위해 HTML 구조를 잘 이해하고, 시각적 차이도 파악할 수 있는 특수한 학습 방법을 적용했으며, 이를 통해 프론트엔드 개..

1.개요1.1.졸음감지란?현대의 바쁜 일상에서 장시간 운전은 불가피해졌습니다. 특히 장거리 운행이나 야간 운전 중에는 운전자의 졸음이 심각한 사고를 초래할 수 있습니다. 국내의 경우, 최근 5년간(2019~2023) 통계로는 졸음운전으로 인한 교통사고가 1만765건, 그 사고로 인한 사망자는 316명에 이른다고 합니다. 음주운전의 2배 수준으로 위험하다고 하네요. 이에 따라 운전자 졸음 감지 시스템이 주목받고 있으며, 여러 기술 기업들이 이를 개발해 도로 안전성을 높이고 있습니다. 최근 나오는 차량에는 자율주행 등급에 따라 다르긴 하지만, 카메라를 이용한 졸음감지 기능이 탑재되어 있는 것들도 있습니다. 예를 들어 Tesla의 FSD 최신버전은 실내 (in-cabin) 카메라를 통해 운전자의 상태를 체크하..

1.서론OpenAI가 드디어 AI 기반 실시간 웹 검색 기능인 'ChatGPT Search'를 공개했습니다. 구글이 주도하고 최근 Perflexity가 AI 검색 시장에 진출해 각광을 받고 있는 바로 그 글로벌 검색시장에 중요한 변화를 가져오는 사건입니다. ChatGPT Search는 AI 모델을 통해 실시간 웹 검색 기능을 제공하여 사용자에게 맞춤형 정보를 신속히 전달할 수 있도록 하며, 검색 결과에 대한 신뢰할 수 있는 원본 출처도 제공합니다. 게다가 르몽드, 복스, TIME, 파이넨셜타임스 등과 같은 주요 언론사들과 콘텐츠 라이선스 계약을 체결해 더 풍부한 정보를 제공할 수 있다고 합니다. 이는 전통적인 검색 엔진 사용자들에게 매력적인 대안으로 다가올 것으로 생각됩니다. 2.검색 광고 시장의 중요..
1.서론OpenAI가 새로운 AI 기반 실시간 웹 검색 서비스인 'ChatGPT Search'를 공개했습니다. 구글이 주도하고 최근 Perflexity가 AI 검색 시장에 진출해 각광을 받고 있는 바로 그 글로벌 검색시장에 중요한 변화를 가져오는 사건입니다. ChatGPT Search는 AI 모델을 통해 실시간 웹 검색 기능을 제공하여 사용자에게 맞춤형 정보를 신속히 전달할 수 있도록 하며, 검색 결과에 대한 신뢰할 수 있는 원본 출처도 제공합니다. 게다가 르몽드, 복스, TIME, 파이넨셜타임스 등과 같은 주요 언론사들과 콘텐츠 라이선스 계약을 체결해 신뢰도 높은 정보를 제공할 수 있다고 합니다. 이는 전통적인 검색 엔진 사용자들에게 매력적인 대안으로 작용할 수 있습니다. 2.검색 광고 시장의 중요..

1.서론1.1.원격 오디오란?RDP(Remote Desktop Protocol)을 사용할 때 "원격 오디오"는 원격 데스크톱 연결을 통해 원격 컴퓨터에서 재생되는 오디오를 로컬 컴퓨터(연결을 요청한 컴퓨터)에서 들을 수 있도록 하는 기능을 의미합니다. 이 기능을 통해 원격 데스크톱에 있는 미디어 파일을 재생하거나 회의 소리를 들을 때, 실제로 원격지 컴퓨터에서 나오는 소리가 사용자 쪽으로 전송됩니다. 원격 오디오 설정은 RDP 클라이언트에서 제어할 수 있으며, 보통 다음 세 가지 옵션이 있습니다:원격 컴퓨터에서 소리 재생 : 원격지 컴퓨터에서 소리가 재생되며 로컬 컴퓨터에는 전달되지 않습니다.로컬 컴퓨터에서 소리 재생 : 원격지 컴퓨터에서 발생하는 소리를 로컬 컴퓨터에서 들을 수 있도록 합니다.소리 없음..

1.개요: Adssense 승인 거절최근 블로그를 개설하면서 혹시나 다른 사람들 다 한다는 Adsense 등록을 해 보려고 승인 신청을 해 봤습니다. 한참만에 온 대답은 승인 거절! 흠... 다른 분들도 신청하면 2~4주 가까이 걸리기도 한다고 해서 음... 오래 걸리는거구나 하고 잊고 있었는데 알고보니 진즉에 승인 거절이 되어 있었습니다. 그래서, 이번 글에서는 승인 거절이 난 사유와 그것으로 인해 진행했던 과정을 쭉 기록으로 남겨보려고 합니다. 2.Adsense 승인 거절 사유: 가치 없는 콘텐츠Adsense가 제 블로그에 광고 등재 승인을 거절한 사유는 정책 위반이나 '가치가 별로 없는 콘텐츠...' 입니다. T^T 블로그 시작한 지 대략 1달 가량 됐고, 부분 부분 AI를 활용하긴 하지만 나름 ..

1.개요1.1.ASCII Camera란?ASCII Camera는 웹캠으로 촬영한 영상을 ASCII 아트로 실시간 변환하여 출력하는 프로그램입니다. 일반적으로, 웹캠으로부터 입력받은 이미지나 영상의 밝기 정보를 사용해 각 픽셀에 해당하는 ASCII 문자를 매핑하여 영상을 텍스트로 표현합니다. ASCII 아트로 변환된 결과는 CLI 환경에서도 시각적인 재미를 줄 수 있고, 이미지의 형태를 저용량 텍스트로 표현하기 때문에 네트워크 대역폭을 아낄 수 있다는 장점도 있습니다. 대표적인 ASCII 카메라 프로그램이나 라이브러리에는 Python의 opencv-python과 ASCII 변환을 위한 간단한 스크립트를 사용하여 구현된 예시들이 있으며, CLI에서 ASCII 카메라를 쉽게 실행할 수 있습니다. 일반적인 AS..