Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 일론 머스크
- 오블완
- 트랜스포머
- 티스토리챌린지
- AI 기술
- 이미지 편집
- PYTHON
- TRANSFORMER
- ControlNet
- 오픈AI
- 아두이노
- 시간적 일관성
- 메타
- 확산 모델
- 인공지능
- 멀티모달
- javascript
- 생성형 AI
- AI
- 우분투
- 서보모터
- 뉴럴링크
- ubuntu
- tts
- 딥마인드
- OpenAI
- 가상환경
- LLM
- ChatGPT
- LORA
Archives
- Today
- Total
AI 탐구노트
BitNet 1.58B : 1bit 양자화 기반 LLM 구현 기술 본문
Microsoft가 공개한 1bit 양자화 기반 LLM 구현을 위한 기술
지난 2월에 Microsoft가 발표한 논문에서 소개된 기술입니다. LLM 모델 발표 초기에는 8bit, 4bit 하면서 연산량 절감 기술들이 많이 소개되었는데 그 이후부터는 기본으로 깔고 가서 그런지 그런 얘기들은 점점 메인 주제에서 보이지 않았습니다. 그러다 이번에 Microsoft가 발표한 논문은 BitNet 1.58B로 1bit 기술을 이용해서 LLM을 만들 수 있다는 소식을 전했습니다. (참고로 1.58B는 3개의 값(-1,0,1)을 동일한 확률로 인코딩할 때의 엔트로피값을 의미한답니다)
BitNet 1.58B는 계산복잡성이 감소하고 처리속도는 빨라지고, 메모리 사용량은 줄게 될테니 전반적인 에너지 효율성은 크게 증가합니다. 게다가 이렇게까지 경량화가 된다면 고사양의 GPU에 의존하는 정도도 줄어들 수 있겠죠. 이 방식에 최적화된 회로를 가진 연산장치를 개발하는 것이 상대적으로 쉬울 수도 있을테니까요.
아쉽게도 아직은 공식 구현체는 발표되지 않았습니다. 다만, 비공식적으로 논문 내용을 구현하고 있는 분은 있더군요.
'AI 기술' 카테고리의 다른 글
ChatMusician : 텍스트로 음악을 이해하고 생성하는 모델 (0) | 2024.08.27 |
---|---|
TripoSR : 고품질의 3D 모델 생성 도구 (0) | 2024.08.26 |
MusicHiFi : 모노 음원을 스테레오로, 저음질을 고음질로 변환 (0) | 2024.08.26 |
MindEye2 : 뇌활동 분석해서 시각정보로 재구성하는 기술 (0) | 2024.08.25 |
Procigen : 인간-사물 상호작용 합성 데이터셋 (0) | 2024.08.25 |