Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
Tags
- AI 기술
- ubuntu
- 오픈AI
- 생성형 AI
- 다국어 지원
- 아두이노
- 오픈소스
- 딥러닝
- 메타
- 강화 학습
- 휴머노이드 로봇
- 트랜스포머
- LORA
- 확산 모델
- 시간적 일관성
- LLM
- OpenAI
- Stable Diffusion
- TRANSFORMER
- 오블완
- PYTHON
- tts
- 티스토리챌린지
- OpenCV
- 인공지능
- AI
- 멀티모달
- ChatGPT
- 일론 머스크
- 우분투
Archives
- Today
- Total
AI 탐구노트
LARS : 로컬 LLM으로 사용자 문서를 분석하는 애플리케이션 본문
로컬 LLM을 이용해 문서파일을 업로드한 후 이를 기준으로 대화를 진행할 수 있는 어플리케이션
LARS는 로컬 환경의 LLM(Large Language Models)으로 사용자 문서 기반으로 정확한 응답을 생성하는 오픈소스 응용 어플리케이션입니다.
로컬 환경에서 LLM을 구동하고, 로컬에서 사용자 문서를 업로드한 뒤 로컬 LLM이 업로드한 콘텐츠로 응답을 근거로 하는 대화를 진행할 수 있습니다.
기존 LLM의 '환각 현상'으로 인한 문제를 해결하기 위해, LARS는 RAG(Retrieval Augmented Generation) 기술을 사용하여 사용자의 업로드 문서에서 인용 및 페이지 번호를 포함한 자세한 참고 자료를 제공합니다.
이를 통해 LLM의 응답 정확도와 답변 신뢰성이 증가하고, 문서 기반 인용을 제공하여 사용자의 이해를 높일 수 있습니다. 게다가 내부 데이터의 외부 유출을 우려하는 기업 내부에서 잘 활용하면 효과를 볼 수 있는 솔루션이 아닌가 싶습니다.
LARS의 특징은 다음과 같은 것들이 있습니다.
- 다양한 파일 형식을 지원 (pdf, word, excel, powerpoint, image, html, 등등) - 단, LibreOffice 설치 필요
- CUDA 가속 추론 지원
- 다앙햔 고급 설정 변경 지원
- 다양한 LLM 지원 (Llama3, Phi3, Deepseek Coder, OpenChat-3.5 등등)
- 순수 llama.cpp 백엔드 기반
- 대화 기록 : 이전 대화를 포함하여 후속 질문 가능
- Docker 컨테이너로도 제공
- AGPL-3.0 라이선스
대충 흐름을 보면, LibreOffice를 이용해 다양한 파일 형식을 지원하고, pdf2image를 이용해 이미지 변환을 하며, 다양한 로컬 OCR을 지원하여 텍스트를 추출하고, 로컬 LLM을 이용해 내용을 분석하고 대화를 이어나갈 수 있도록 하고 있는 것으로 판단됩니다. 현재도 계속 새로운 기능이 업데이트되고 있는 것 같으니 관심을 가져보시는 것도 좋을 듯 합니다.
'AI 기술' 카테고리의 다른 글
Sketch Video : 영상에서 스케치를 생성하는 프레임워크 (1) | 2024.10.01 |
---|---|
Firecrawl : 웹사이트 데이터 크롤링 API 서비스 (1) | 2024.10.01 |
FiT3D : 3D 정보에 기반한 2D 모델 미세조정 기법 (0) | 2024.09.30 |
MuCodec : 초저비트레이트에서 고품질 음악 복원을 위한 음악 코덱 (8) | 2024.09.27 |
Sapiens : 4가지 비전 작업을 지원하는 시각 모델 (0) | 2024.09.27 |