AI 탐구노트

Granite Code Models : IBM의 자연어, 코드 생성 모델 본문

AI 기술

Granite Code Models : IBM의 자연어, 코드 생성 모델

42morrow 2024. 8. 16. 12:27
자연어 처리 및 코드 작업을 위한 생성형 모델

 

IBM에서 Granite Code Models라는 자연어 처리 및 코드 작업을 위한 생성 인공지능(AI) 모델을 발표했습니다. 그러고보니 IBM의 AI 모델을 소개하는 것은 처음인 것 같네요. IBM하면 한때는 IT계의 공룡이었고, AI 초기에는 딥블루(1997년 체스 챔피언에 승리)나 2004년 Watson이 퀴즈 챔피언을 이긴 사례 등 가장 주목을 받는 기업이기도 했었습니다. 하지만, 어느새 구글, 메타, OpenAI 등등 다양한 빅테크 기업들의 그늘에 가려져 버렸죠.

 

이번에 IBM이 발표한 Granite Code Models는 디코더 전용 코드 모델로 매개변수 30억~340억으로 다양한 크기로 제공됩니다. IBM의 비즈니스 영역답게  엔터프라이즈 소프트웨어 개발에 최적화되어 다양한 코딩 작업에 적합하다고 합니다. 그것은 모델의 크기(다양한 크기의 모델 제공), 다양한 개발업무에서의 성능(코드 생성 외에도 수정 및 설명 등에서의 최고 성능), 모델의 개방성(오픈소스), 라이선스 조건(상용 사용 가능한 Apache 2.0) 등의 특징 때문으로 볼 수 있습니다. IBM은 이 모델을 사용해 기존 기업 내의 레거시 어플리케이션(예: 코볼, 등으로 만들어진...)들의 코드를 현대적 언어로 변환하는 방식으로도 활용할 수 있을 것이라 소개하고 있습니다.

 

 

 

 

사진 : Granite-8B-Code 모델과 타 모델 간의 비교 (on HumanEvalPack)

 

 

사진 : 모델 성능 비교

 

 

 

 

참고) 코드모델카드블로그