Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 생성형 AI
- 인공지능
- 우분투
- AI 기술
- javascript
- TRANSFORMER
- tts
- 메타
- 오블완
- LORA
- 시간적 일관성
- 딥마인드
- 이미지 편집
- AI
- OpenAI
- ubuntu
- 멀티모달
- ChatGPT
- 서보모터
- 오픈AI
- 트랜스포머
- 티스토리챌린지
- 가상환경
- 확산 모델
- LLM
- ControlNet
- 일론 머스크
- 뉴럴링크
- 아두이노
- PYTHON
Archives
- Today
- Total
AI 탐구노트
Phi-1.5 : 고품질 학습 데이터로 학습한 sLM 본문
마이크로소프트에서 공개한 경량 LLM 모델
Phi-1.5는 Microsoft가 발표한 공개 LLM 모델입니다.
13억개의 매개변수를 가진 상대적으로 덩치가 작은 sLLM 쪽에 가깝습니다. Microsoft에서는 소규모 Transformer 기반 언어모델의 성능에 대한 연구가 계속 진행해왔으며 그 결과 Phi-1 이후 Phi-1.5까지 이르게 되었고 13B로 70B의 매개변수를 가지는 Llama2 모델의 성능과 유사한 결과를 낸다고 하네요.
이 모델은 사회적 편견 이해, 독성 감소 등을 목적으로 하고 있기에 학습에 사용한 데이터 자체에 먼저 집중했습니다. '교과서 품질'의 데이터셋을 구성하기 위해 웹에서 크롤링한 데이터를 배제했습니다. 그리고 기존 LLM을 활용하는 방식으로 접근했으며 인간 피드백을 통한 강화학습(RLHF)을 이용한 파인튜닝도 하지 않았다고 합니다.
- 소개 페이지나 공개된 논문에 python 코드로 테스트 해 볼 수 있는 많은 예제가 포함되어 있습니다.
'AI 기술' 카테고리의 다른 글
EMO : 오디오 기반 초상화 비디오 생성 (0) | 2024.08.28 |
---|---|
DoubleTake : 기하학적 정보를 이용한 실시간 깊이 추정 (0) | 2024.08.28 |
Multi-LoRA Switch & Composite : 복수 LoRA 통합의 새로운 방식 (0) | 2024.08.27 |
ChatMusician : 텍스트로 음악을 이해하고 생성하는 모델 (0) | 2024.08.27 |
TripoSR : 고품질의 3D 모델 생성 도구 (0) | 2024.08.26 |