일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
- 딥러닝
- 오픈AI
- 우분투
- PYTHON
- 실시간 렌더링
- 트랜스포머
- AI
- 인공지능
- 감정 표현
- OpenAI
- 이미지 생성
- 메타
- 멀티모달
- 생성형AI
- LLM
- 자연어 처리
- tts
- 강화 학습
- 일론 머스크
- 다국어 지원
- Stable Diffusion
- XAI
- ChatGPT
- 확산 모델
- 티스토리챌린지
- 휴머노이드 로봇
- 오픈소스
- AI 기술
- 강화학습
- 오블완
- Today
- Total
목록오픈소스 (17)
AI 탐구노트

카카오가 ‘Kanana-1.5‑v‑3b’ (경량 멀티모달 언어모델)와 ‘Kanana-1.5‑15.7b‑a3b’ (MoE·Mixture of Experts 언어모델)를 오픈소스로 공개했습니다. 이번 공개는, 카카오가 지난 5월 발표한 4종 모델에 이어 불과 두 달 만의 추가 공개이며인데 독자적 모델 설계 및 기술 경쟁력을 드러내기 위한 의도로 보입니다. 경량화, 멀티모달 처리, 지식 증류, Humans-in‑the-loop 학습 등과 같은 키AI 분야 키워드가 함께 적용된 사례이기도 합니다. MoE 타입의 모델의 오픈소스 공개는 처음인 것 같은데 제 기억이 맞는지 모르겠습니다. 기존 공개된 AI 모델(특히 한국어 기반)은 주로 큰 규모의 Dense 구조 모델이었으며, 이들은 추론 시 모든 파라미터가 활..

OpenMed와 380+ 의료용 NER 모델 공개OpenMed라는 이름으로, 의료 및 임상용 텍스트에서 엔티티(질병, 약물, 유전자 등)를 식별하는 NER(Named Entity Recognition) 모델 380여 종이 Apache 2.0 라이선스 하에 무료 공개되었습니다. 상용 솔루션과 동등하거나 그 이상의 성능을 보이며, 투명성과 접근성을 확보함으로써 의료 AI 연구 및 응용의 문턱을 낮추는 것이 목표입니다. 높은 사용료, 블랙박스 시스템, 기술 고도화의 지연, 소수 플레이어 중심 구조 등의 문제로 일반 연구자나 소규모 기관의 접근이 어려웠던 의료 모델에 대한 해결책으로 등장했습니다. 참고) NER 란? 1️⃣ NER (Named Entity Recognition, 명명 엔티티 인식)문장에서 특정..

리눅스에서 WPS Office를 사용하고 있다가 우연히 Youtube 영상을 보다가 최근에 새로운 오픈소스 Office 도구가 생겼다는 사실을 알게 됐습니다. OnlyOffice라는 것입니다. 개발사는 라트비아에 있는 Ascensio System이라는 회사이고 국내에는 거의 소개가 되어 있지 않아서 지명도가 없다시피 한 것 같습니다. 그런데... 의외로 ChatGPT와 같은 LLM 연동과 같은 AI 기능이나 다양한 OS 지원 등 아주 쓸만한 기능을 많이 가지고 있는 좋은 도구 같았습니다. 그래서, 이번 글에서는 OnlyOffice에 대해 간략한 소개를 하려고 합니다. OnlyOffice란?OnlyOffice는 Ascensio System SIA(라트비아 기반)에서 개발한 오픈소스 기반 사무용 생산성 툴이..

2023년 구글에서는 NotebookLM이라는 것을 공개했습니다. 처음에는 프로젝트명 'Tailwind'라는 것으로 명명되어 있었죠. 그러다 2024년 12월에 Gemini 구독자들을 대상으로 NotebookLM Plus가 정식 서비스가 출시됐습니다. 사용자가 업로드한 파일, 콘텐츠를 기반으로 해서 내용을 분석한 뒤 이에 대한 요약과 설명, 답변을 달 수 있도록 하면서 동시에 팟캐스트 스타일의 오디오 오버뷰 기능을 포함했습니다. 당시 이 서비스를 소개하는 유튜브 영상을 보면서 저도 우와... 하면서 한동안 입을 다물지 못했었습니다. 팟캐스트 제작에 소요되는 비용가 인력 공수 자체가 이제는 불필요해지는 거 아닌가 하는 생각을 했었죠. 내가 원하는 주제로, 그것도 바로 즉석으로 서로 티티카카를 주고 받아가며..

Chatterbox란?Chatterbox는 Resemble AI에서 개발한 오픈소스 텍스트-음성 변환(Text-to-Speech, TTS) 모델로, 고품질 음성 합성과 음성 클로닝 기능을 제공합니다. MIT 라이선스로 배포되어 누구나 자유롭게 사용할 수 있으며, 특히 감정 표현 조절과 실시간 음성 합성 기능이 특징입니다. Chatterbox의 주요 특징제로샷 음성 클로닝 : 단 몇 초의 참조 음성만으로 새로운 음성을 클로닝할 수 있습니다. 추가 학습 없이도 다양한 음성을 생성할 수 있습니다. 감정 수준 조절 : exaggeration 파라미터를 통해 음성의 감정 표현 강도를 조절할 수 있어, 단조로운 음성부터 극적인 표현까지 다양하게 생성할 수 있습니다.실시간 음성 합성 : 200ms 이하의 지연 시간..

VLM (Vision Language Model)이란?VLM은 Vision Language Model의 약자로, 이미지와 텍스트를 동시에 이해하고 처리할 수 있는 인공지능(AI) 모델입니다. 쉽게 말해, 사진을 보고 그 내용을 설명하거나, 텍스트를 바탕으로 이미지를 이해하고 질문에 답할 수 있는 기술이죠. 인간이 눈으로 보고 머리로 이해하는 것처럼, VLM은 시각 정보(이미지)와 언어 정보(텍스트)를 함께 학습해 다재다능하게 작동합니다. VLM 의 주요 특징은? 1️⃣ 이미지와 텍스트를 통합적으로 이해텍스트만 처리하는 언어 모델(예: GPT)과 달리, VLM은 이미지 속 객체, 장면, 행동 등을 분석할 수 있습니다.예) 사진 속 고양이를 보고 "이 동물은 무엇인가요?"라는 질문에 "고양이입니다"라고 답..

네이버가 자체 개발한 소버린 AI 모델, 하이퍼클로바X SEED를 상업용으로 사용 가능한 오픈소스로 공개하며 국내 AI 산업에 새로운 바람을 일으키고 있습니다. 이는 단순한 기술 공개를 넘어, 한국의 AI 생태계 구축을 위한 획기적인 발걸음으로 평가됩니다.하이퍼클로바 X SEED란?하이퍼클로바X SEED는 3B, 1.5B, 0.5B 파라미터로 구성된 세 가지 경량 모델로, 특히 한국어와 한국 문화에 특화된 성능을 자랑합니다. 기업과 개발자들이 특정 비즈니스 요구에 맞춰 모델을 튜닝할 수 있도록 설계된 이 AI는 다양한 산업에서 맞춤형 솔루션으로 활용될 가능성을 열었습니다. 특징적인 것으로는 세가지 경량모델이 각각 특화 영역에서 강점을 가지도록 되어 있다는 것입니다. 3B 모델은 이미지 이해에 뛰어나고, ..

1.MCP(Model Context Protocol) 모델 컨텍스트 프로토콜(Model Context Protocol, MCP)은 AI 모델과 외부 데이터 소스 및 도구를 표준화된 방식으로 연결해주는 오픈소스 프로토콜입니다. 미국 기업 앤트로픽(Anthropic)이 주도적으로 개발했으며, AI 에이전트가 실시간으로 다양한 시스템(클라우드 저장소, 데이터베이스, 업무 도구 등)과 상호작용할 수 있도록 설계되었습니다. 아래는 MCP의 핵심 개념과 특징을 간략히 정리한 소개입니다. 1️⃣ MCP의 목적MCP는 AI 모델이 고정된 학습 데이터나 단순한 사용자 입력에 의존하지 않고, 동적이고 풍부한 컨텍스트를 활용해 더 지능적인 작업을 수행하도록 돕습니다. 예를 들어, AI가 문서, 이메일, 코드 리포지토리, ..

3월 19일, LG에서는 자사가 개발 중이던 AI모델 'EXAONE Deep'을 오픈소스로 공개했습니다. 이 소식은 국내 AI 기술의 발전과 오픈소스 커뮤니티에 어떤 영향을 미칠지 생각해보는 기회가 될 것 같아 짧게 정리를 해 보려고 합니다. [서울타임즈뉴스] LG, 세계 최고수준 추론AI ‘엑사원 딥’ 오픈소스로 공개[서울타임즈뉴스 = 최남주 기자] LG AI연구원이 18일 글로벌 추론 AI 모델들과 경쟁할 ‘엑사원 딥(EXAONE Deep)’을 오픈소스로 공개했다. ‘엑사원 딥’ 공개는 한국 기업이 자체 개발한 ‘추론 AI’www.seoultimes.news EXAONE Deep : Reasoning AI의 새로운 기준LG AI 연구소에서 개발한 고급 추론 AI 모델 시리즈로, 수학적 논리와 과..

Manus란?Manus는 중국의 AI 스타트업인 Monica AI에 의해 출시된 AI 에이전트입니다. 인간의 생각을 행동으로 연결하여 실질적인 결과를 제공하는 것을 목표로 하고 있다고 밝힌 이 에이전트는 단순히 정보를 제공하는 기존 AI와 달리, 자율적으로 복잡한 작업을 계획하고 실행할 수 있는 능력을 갖추고 있습니다. Manus의 주요 기능 및 아키텍처Manus의 핵심은 다중 에이전트 아키텍처에 있습니다. 이는 복잡한 작업을 작은 구성 요소로 나누어, 각 부분을 전문화된 하위 에이전트가 처리하도록 설계된 시스템입니다. 예를 들어, 웹 브라우징, 코드 실행, 데이터 분석 등 다양한 도구를 원활하게 통합하여 작업을 수행합니다. 이 아키텍처는 전통적인 단일 신경망 기반 AI와 달리, 여러 에이전트가 협력..