Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
Tags
- 시간적 일관성
- 강화 학습
- OpenAI
- 멀티모달
- OpenCV
- LLM
- PYTHON
- 다국어 지원
- 생성형 AI
- 아두이노
- 오픈소스
- 일론 머스크
- Stable Diffusion
- 오블완
- tts
- 트랜스포머
- AI
- 오픈AI
- 메타
- TRANSFORMER
- ChatGPT
- 우분투
- 티스토리챌린지
- 인공지능
- 확산 모델
- ubuntu
- AI 기술
- 휴머노이드 로봇
- 딥러닝
- LORA
Archives
- Today
- Total
목록경량화된 연산 (1)
AI 탐구노트

LLM(대규모 언어모델)에서 행렬 곱셈을 완전히 제거하면서도 성능을 유지하도록 만든 모델 1.개요MatMul-free Languge Model (이하 MLM)은 LLM(대규모 언어모델)에서 행렬 곱셈을 완전히 제거하면서도 성능을 유지하도록 만든 모델입니다. 대부분의 신경망의 모델 학습과 추론 과정에는 아주 많은 행렬 곱셈이 사용됩니다. 처리해야 하는 데이터의 양이나 네트워크의 복잡도 등 다양한 이유로 인해 행렬곱의 양도 달라지게 되는데, LLM은 특성 상 많은 양의 행렬곱을 필요로 합니다. 2.적용 기술일반적으로 Dense 레이어에서 입력 벡터와 가중치 행렬의 곱으로 출력을 계산하게 되는데 가중치를 {-1, 0, +1}의 값으로 제한하게 되면 곱셈 대신 덧셈과 뺄셈으로 계산을 대체할 수 있게 됩니다. 또..
AI 기술
2024. 8. 15. 09:45