Phi-1.5 : 고품질 학습 데이터로 학습한 sLM

Notice

Recent Posts

Recent Comments

Link

« 2024/12 »
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

Tags more

Archives

Today

Total

관리 메뉴

AI 탐구노트

Phi-1.5 : 고품질 학습 데이터로 학습한 sLM 본문

AI 기술

Phi-1.5 : 고품질 학습 데이터로 학습한 sLM

42morrow 2024. 8. 27. 21:44

마이크로소프트에서 공개한 경량 LLM 모델

Phi-1.5는 Microsoft가 발표한 공개 LLM 모델입니다.

13억개의 매개변수를 가진 상대적으로 덩치가 작은 sLLM 쪽에 가깝습니다. Microsoft에서는 소규모 Transformer 기반 언어모델의 성능에 대한 연구가 계속 진행해왔으며 그 결과 Phi-1 이후 Phi-1.5까지 이르게 되었고 13B로 70B의 매개변수를 가지는 Llama2 모델의 성능과 유사한 결과를 낸다고 하네요.

이 모델은 사회적 편견 이해, 독성 감소 등을 목적으로 하고 있기에 학습에 사용한 데이터 자체에 먼저 집중했습니다. '교과서 품질'의 데이터셋을 구성하기 위해 웹에서 크롤링한 데이터를 배제했습니다. 그리고 기존 LLM을 활용하는 방식으로 접근했으며 인간 피드백을 통한 강화학습(RLHF)을 이용한 파인튜닝도 하지 않았다고 합니다.

참고) 논문, 소개(허깅페이스) , 소개영상, 코드

소개 페이지나 공개된 논문에 python 코드로 테스트 해 볼 수 있는 많은 예제가 포함되어 있습니다.

'AI 기술' 카테고리의 다른 글

EMO : 오디오 기반 초상화 비디오 생성 (0)	2024.08.28
DoubleTake : 기하학적 정보를 이용한 실시간 깊이 추정 (0)	2024.08.28
Multi-LoRA Switch & Composite : 복수 LoRA 통합의 새로운 방식 (0)	2024.08.27
ChatMusician : 텍스트로 음악을 이해하고 생성하는 모델 (0)	2024.08.27
TripoSR : 고품질의 3D 모델 생성 도구 (0)	2024.08.26

'AI 기술' Related Articles

AI 탐구노트

Phi-1.5 : 고품질 학습 데이터로 학습한 sLM 본문

Phi-1.5 : 고품질 학습 데이터로 학습한 sLM

'AI 기술' 카테고리의 다른 글

티스토리툴바