Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 시간적 일관성
- 텍스트-이미지 생성
- AI
- ChatGPT
- 이미지 생성
- LLM
- LORA
- 일론 머스크
- 트랜스포머
- TRANSFORMER
- AI 기술
- OpenAI
- 딥러닝
- 메타
- tts
- OpenCV
- PYTHON
- ubuntu
- 우분투
- 가상환경
- 확산 모델
- 인공지능
- 다국어 지원
- 오픈소스
- 서보모터
- 생성형 AI
- 아두이노
- 오픈AI
- 티스토리챌린지
- 오블완
Archives
- Today
- Total
AI 탐구노트
Qwen Chat : ChatGPT를 닮은 오픈소스 챗봇 본문
Qwen Chat은 중국 Alibaba Cloud에서 개발한 고급 AI 챗봇입니다. OpenAI의 ChatGPT와 비슷한 녀석이라고 보시면 됩니다. 최근 공개된 공식 사이트를 가 보면 사용자 경험이 거의 ChatGPT와 유사하게 나왔습니다. 채팅, 비전 이해, 코딩 등의 영역에서 도움을 받을 수 있습니다.
Qwen : 알리바바 클라우드의 Qwen 팀에서 개발한 최신 LLM 모델
0.5B~72B까지 다양한 크기의 모델을 제공하며 30여개의 다양한 언어를 지원하고,
언어 이해/글 생성/코딩/수학/논리 추론 등의 영역에서 우수한 성능을 보여주고 있음.
Apache 2.0 라이선스로 공개되어 활용도가 높고
성능, 기능 면에서 메타가 공개한 Llama 3의 강력한 경쟁상대로 평가 받고 있음
Qwen Chat
Qwen Chat에 대한 주요 세부 정보는 다음과 같습니다.
주요 특징
- 알리바바 클라우드에서 개발
- 트랜스포머 기반 디코더 전용 언어 모델을 기반으로 구축
- 약 3조 개의 다국어 데이터 포인트에 대한 교육을 통해 0.5B에서 72B 매개변수에 이르는 다양한 모델 크기를 지원
- 이미지, 문서파일 업로드 및 해당 문서 기반의 답변 기능 제공
- HTML 방식의 프리뷰 기능 제공
- 웹 검색, 이미지 생성, 음성 모드 등의 기능이 추가로 제공될 예정
기술 사양
- 영어와 중국어에 대한 강력한 역량을 갖춘 다국어 지원
- 최대 32,768개 토큰의 컨텍스트 길이
- 150,000개 이상의 토큰을 사용한 고급 토큰화
- 텍스트, 이미지, 멀티모달 대화 등 다양한 상호작용 모드를 지원
ChatGPT와 차별화
Qwen Chat가 ChatGPT와 다른 점은 오픈소스라는 것 외에도 동시에 하나 이상의 모델을 대상으로 동일한 Prompt로 대화를 할 수 있고 답변을 동시에 받을 수 있다는 것입니다. 어디에 써먹을까 싶기도 하지만 경우에 따라서는 시각적인 추론과 논리적인 사항, 그리고 언어적인 것을 한번에 종합해서 답변을 받아야 하는 경우에 사용될 수 있지 않을까 싶습니다.
Qwen Chat에서 지원하는 모델
Qwen Chat 사이트에 나와 있는 설명을 기준으로 하면 다음과 같습니다.
- Qwen2.5-Plus : 핵심적인 언어 모델, 코딩과 수학과 같은 복잡한 작업, 언어 이해와 생성에서 우수한 성능. 131,072 토큰 길이의 컨텐스트까지 지원. 최대 8K 토큰 생성 지원
- QVQ-72B-Preview : 이미지/텍스트를 지원하는 시각적 맥락 기반의 추론. 최대 32K 토큰 컨텍스트, 최대 8K 토큰 생성 지원
- QwQ-32B-Preview : 언어 모델, 코딩, 수학 및 간단한 논리 추론에 뛰어남. 최대 131,072K 토큰 컨텍스트, 8K 토큰 생성 지원
- Qwen2.5-Coder-32B-Instruct : 플래그십 언어 모델, 코딩에서 최고 수준의 성능 지원, 최대 131,072K 토큰 컨텍스트, 8K 토큰 생성 지원
- Qwen2-VL-Max : 이미지/텍스트 모델, 이미지/비디오를 이해하고 캡션 생성하며, 질문 답변, 텍스트 인식, 객체 감지 등의 기능 지원
- Qwen2.5-Turbo : 빠르고 긴 문맥을 지원하는 언어 모델. 요약, 번역, 독해 등 일반적 언어 작업 수행. 최대 1백만 토큰 컨텍스트, 8K 토큰 생성 지원
- Qwen2.5-72B-Instruct : Qwen2.5 시리즈 가운데 가장 큰 언어모델. 언어이해, 코딩, 수학, 다국어 작업 등 지원, 최대 131,072K 토큰 컨텍스트, 8K 토큰 생성 지원
- Qwen2.5-32B-Instruct : Qwen2.5 시리즈 가운데 두번째로 큰 언어모델. 언어이해, 코딩, 수학, 다국어 작업 등 지원, 최대 131,072K 토큰 컨텍스트, 8K 토큰 생성 지원
주요 장점
- 인간의 선호도 평가에서 높은 성과를 거뒀습니다.
- 유연한 상호작용이 가능하고 다국어 지원이 강력합니다. 한글이 잘 되니 좋더군요. ^^;
- 로컬에 적용할 수 있으므로 개인정보 보호에 좋을 것 같습니다.
- 개발자와 연구자는 Hugging Face와 같은 플랫폼을 통해 Qwen Chat을 프로젝트에 통합하여 다양한 애플리케이션에서 지능형 대화형 AI 경험을 구현할 수 있습니다
참고자료
Qwen Chat 서비스
'AI 기술' 카테고리의 다른 글
SANA : 효율적인 초고해상도 이미지 생성의 새로운 패러다임 (0) | 2025.01.15 |
---|---|
SPAR3D : 단일 이미지에서 3D 객체를 안정적으로 복원하는 새로운 방법론 (0) | 2025.01.14 |
Sa2VA: 이미지와 비디오를 똑똑하게 이해하는 새로운 인공지능 모델 (0) | 2025.01.14 |
Kokoro-82M: 컴팩트하면서 강력한 TTS 솔루션 (1) | 2025.01.13 |
NeuralSVG - 텍스트에서 벡터 그래픽 생성으로의 새로운 접근 (0) | 2025.01.12 |