일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- ubuntu
- nvidia
- 생성형 AI
- 아두이노
- 인공지능
- 딥러닝
- 티스토리챌린지
- LLM
- 시간적 일관성
- OpenCV
- 우분투
- 트랜스포머
- 메타
- AI
- 오블완
- LORA
- 일론 머스크
- ChatGPT
- 오픈소스
- tts
- 휴머노이드 로봇
- 다국어 지원
- PYTHON
- TRANSFORMER
- 이미지 생성
- 오픈AI
- 확산 모델
- 강화 학습
- OpenAI
- AI 기술
- Today
- Total
목록오픈소스 (9)
AI 탐구노트

3월 19일, LG에서는 자사가 개발 중이던 AI모델 'EXAONE Deep'을 오픈소스로 공개했습니다. 이 소식은 국내 AI 기술의 발전과 오픈소스 커뮤니티에 어떤 영향을 미칠지 생각해보는 기회가 될 것 같아 짧게 정리를 해 보려고 합니다. [서울타임즈뉴스] LG, 세계 최고수준 추론AI ‘엑사원 딥’ 오픈소스로 공개[서울타임즈뉴스 = 최남주 기자] LG AI연구원이 18일 글로벌 추론 AI 모델들과 경쟁할 ‘엑사원 딥(EXAONE Deep)’을 오픈소스로 공개했다. ‘엑사원 딥’ 공개는 한국 기업이 자체 개발한 ‘추론 AI’www.seoultimes.news EXAONE Deep : Reasoning AI의 새로운 기준LG AI 연구소에서 개발한 고급 추론 AI 모델 시리즈로, 수학적 논리와 과..

Manus란?Manus는 중국의 AI 스타트업인 Monica AI에 의해 출시된 AI 에이전트입니다. 인간의 생각을 행동으로 연결하여 실질적인 결과를 제공하는 것을 목표로 하고 있다고 밝힌 이 에이전트는 단순히 정보를 제공하는 기존 AI와 달리, 자율적으로 복잡한 작업을 계획하고 실행할 수 있는 능력을 갖추고 있습니다. Manus의 주요 기능 및 아키텍처Manus의 핵심은 다중 에이전트 아키텍처에 있습니다. 이는 복잡한 작업을 작은 구성 요소로 나누어, 각 부분을 전문화된 하위 에이전트가 처리하도록 설계된 시스템입니다. 예를 들어, 웹 브라우징, 코드 실행, 데이터 분석 등 다양한 도구를 원활하게 통합하여 작업을 수행합니다. 이 아키텍처는 전통적인 단일 신경망 기반 AI와 달리, 여러 에이전트가 협력..

1. 서론디지털 3D 에셋은 게임, 영화, 물리 시뮬레이션, AI 연구 등 다양한 분야에서 중요한 역할을 합니다. 그러나 이 에셋을 제작하는 과정은 많은 시간과 비용이 소요되는 복잡한 작업으로, 스케치, 모델링, 텍스처 매핑 등 각 단계에서 높은 전문성이 요구됩니다. 이를 해결하기 위해 자동화된 3D 에셋 생성 기술이 주목받고 있으며, 특히 확산 모델 기반의 이미지와 비디오 생성 기술에서 발전을 이루면서 3D 생성 기술도 주목받고 있습니다. 이번에 Tencent가 공개한 Hunyuan3D 2.0은 이와 같은 배경에서 개발된 시스템으로, 텍스처 매핑과 3D 형태 생성의 어려움을 해결하기 위해 독창적인 접근 방식을 채택했습니다. 특히, 확장형 확산 모델을 기반으로 한 두 가지 주요 구성 요소인 Hunyuan..

최근 인공지능 분야에서 추론 능력이 중요한 화두로 떠오르고 있습니다. 수학 문제 해결, 코드 생성, 퍼즐 풀이 등 다양한 작업에서 높은 성능을 발휘하는 모델들은 복잡한 사고 과정을 내재화하며 인상적인 결과를 도출하고 있습니다. 하지만 이러한 모델들은 일반적으로 높은 개발 비용과 제한된 접근성으로 인해 연구자 및 오픈소스 커뮤니티의 참여를 어렵게 만들었습니다. 잘 알려진 상용 추론 모델들은 뛰어난 성능을 보이지만, 모델의 가중치와 세부 기술이 비공개로 유지되어 오픈소스 커뮤니티가 이를 재현하거나 개선하기 어렵습니다. 또한, 이를 이용하기 위해서는 엄청난 비용이 들죠. 그러다보니 오픈소스 모델을 중심으로 이를 파인튜닝하는 쪽으로 접근하는 연구가 많이 진행되고 있습니다. 소규모 연구팀이 접근하기에는 현실적인 ..

텍스트-음성 변환(TTS)은 현대 인공지능 기술의 핵심적인 응용 중 하나로, 음성 인터페이스, 오디오북, 팟캐스트 제작 등 다양한 영역에서 중요한 역할을 담당하고 있습니다. 이 분야에서 새롭게 등장한 Kokoro-82M은 8,200만 개의 매개변수만으로 대형 모델을 능가하는 성능을 제공하며, 컴팩트한 크기와 효율성을 자랑합니다. 이러한 특징은 TTS 기술의 상용화를 위한 게임 체인저로 주목받고 있습니다. 특히 Kokoro-82M은 StyleTTS 2와 ISTFTNet 아키텍처를 기반으로 하여 기존 모델의 복잡한 디퓨전 메커니즘 없이 효율성을 극대화한 디코더 중심의 설계를 채택했습니다. 현 시점의 최신 버전인 0.23에서는 영어, 프랑스어, 일본어, 한국어, 중국어가 지원되고 있습니다. 전세계 지원 언어 ..

로컬 LLM을 이용해 문서파일을 업로드한 후 이를 기준으로 대화를 진행할 수 있는 어플리케이션 LARS는 로컬 환경의 LLM(Large Language Models)으로 사용자 문서 기반으로 정확한 응답을 생성하는 오픈소스 응용 어플리케이션입니다. 로컬 환경에서 LLM을 구동하고, 로컬에서 사용자 문서를 업로드한 뒤 로컬 LLM이 업로드한 콘텐츠로 응답을 근거로 하는 대화를 진행할 수 있습니다. 기존 LLM의 '환각 현상'으로 인한 문제를 해결하기 위해, LARS는 RAG(Retrieval Augmented Generation) 기술을 사용하여 사용자의 업로드 문서에서 인용 및 페이지 번호를 포함한 자세한 참고 자료를 제공합니다. 이를 통해 LLM의 응답 정확도와 답변 신뢰성이 증가하고, 문서 기반 ..

Mistral AI, 첫 멀티모달 AI 모델 출시프랑스 AI 스타트업 Mistral AI가 멀티모달 AI 모델 'Pixtral 12B'를 발표했습니다. 이 모델은 120억 개의 매개변수를 가지고 있으며, 이미지와 텍스트를 모두 처리할 수 있는 기능을 제공합니다. (애플경제) 프랑스의 대표적인 AI 기업으로는 Mistral AI와 AI 에이전트를 개발하는 H가 있습니다. Misral AI의 경우, Mistral, Mixtral 등의 모델을 공개하고나서 한동안 잠잠했었던터라 이번 모델 출시를 계기로 또 어떤 모습을 보여줄 지 기대됩니다. Mitral AI의 CEO인 아서 멘쉬의 경우, 오픈소스 LLM 모델을 개발하되 일정 규모 이상의 것은 유료로 개발자들에게 공급하는 수익 모델을 가지고 있다는 것이 다른 곳..
테슬라의 옵티머스나 Figure AI의 Figure 1 등 휴머노이드 로봇과 관련된 공개 영상들을 보면, 사람의 행동을, 모방학습을 통해 엔드 투 엔드로 학습하는 방식이 주가 되고 있는 것 같습니다. 하지만, 이 분야는 정교하게 만들어진 기계적 장치가 필요하기 때문에 진입 장벽이 무척이나 높아, 사람들이 대부분 시작조차 해 보기 어려운 것도 사실입니다. HuggingFace 로봇 프로젝트 팀에서 공개한 오픈소스 기반 로봇 개발 도구 'LeRobot'은 그런 의미에서 의미가 있다고 할 수 있습니다. LeRobot은 로봇 공학을 위한 사전 훈련된 모델 세트, 사람이 수집한 시연이 포함된 데이터 세트, 시뮬레이션 환경, 비전언어모델(VLM) 및 대형언어모델(LLM)을 위한 라이브러리 등을 포함하고 있어, 사..

유튜브를 보다 보면 자료나 테스트 데이터 용으로 영상 파일이나 오디오 파일을 다운받아야 할 때가 있습니다. 예를 들어 군중 영상이나 보행자 영상 등을 가지고 객체 감지나 움직임 트래킹을 하는 기능을 테스트 해야 하는 경우 등등이 있겠죠. 하지만 기본적으로 유튜브는 프리미엄 사용자가 아닐 경우, 영상의 다운로드 기능을 원칙적으로는 제공하지 않습니다.그래서, 이런 작업을 지원하는 도구를 사용하게 되는데 예전에는 youtube-dl 이라는 걸출한 커맨드 기반 도구가 있었습니다.하지만, 워낙 많이 알려지다보니 다운로드 방식이 차단되었고 이걸 다시 우회하는 yt-dlp라는 도구가 나왔습니다. 이 도구를 이용해 영상과 오디오 데이터를 다운로드 하는 방법을 기록해 둡니다. 도구 다운로드yt-dlp는 패키지 관리자..