AI 탐구노트

Phi-1.5 : 고품질 학습 데이터로 학습한 sLM 본문

AI 기술

Phi-1.5 : 고품질 학습 데이터로 학습한 sLM

42morrow 2024. 8. 27. 21:44
마이크로소프트에서 공개한 경량 LLM 모델

 

Phi-1.5는 Microsoft가 발표한 공개 LLM 모델입니다.

 

13억개의 매개변수를 가진 상대적으로 덩치가 작은 sLLM 쪽에 가깝습니다. Microsoft에서는 소규모 Transformer 기반 언어모델의 성능에 대한 연구가 계속 진행해왔으며 그 결과 Phi-1 이후 Phi-1.5까지 이르게 되었고 13B로 70B의 매개변수를 가지는 Llama2 모델의 성능과 유사한 결과를 낸다고 하네요.

 

이 모델은 사회적 편견 이해, 독성 감소 등을 목적으로 하고 있기에 학습에 사용한 데이터 자체에 먼저 집중했습니다. '교과서 품질'의 데이터셋을 구성하기 위해 웹에서 크롤링한 데이터를 배제했습니다. 그리고 기존 LLM을 활용하는 방식으로 접근했으며 인간 피드백을 통한 강화학습(RLHF)을 이용한 파인튜닝도 하지 않았다고 합니다.

 

 

사진 : Llama2와의 비교

 

 

참고) 논문소개(허깅페이스) , 소개영상코드

  • 소개 페이지나 공개된 논문에 python 코드로 테스트 해 볼 수 있는 많은 예제가 포함되어 있습니다.