Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
Tags
- 다국어 지원
- Stable Diffusion
- 오픈AI
- LORA
- ubuntu
- OpenCV
- 오블완
- 우분투
- 멀티모달
- 메타
- 딥러닝
- OpenAI
- LLM
- 티스토리챌린지
- PYTHON
- 오픈소스
- 휴머노이드 로봇
- ChatGPT
- 아두이노
- TRANSFORMER
- AI 기술
- 생성형 AI
- AI
- 시간적 일관성
- 트랜스포머
- tts
- 인공지능
- 강화 학습
- 확산 모델
- 일론 머스크
Archives
- Today
- Total
목록자가추론 (1)
AI 탐구노트

1.서론1.2.기존 LLM의 문제점 ChatGPT와 같은 기존 대형 언어 모델(LLM) 추론은 텍스트 생성 등의 작업에서 모든 레이어를 거치면서 순차적 계산을 합니다. 당연히 처리 속도가 느리고 많은 메모리가 필요하게 되며 일반 컴퓨터에서는 효율적이지 않습니다. 특히 모바일 기기나 엣지 디바이스 등에서 실행하기에는 무리가 있죠. 기존의 속도를 높이기 위한 방법으로 다른 방식들도 초안 기본 모델과 검증 모델 두개를 사용해 예측하기 위해 복잡한 구현물과 많은 메모리 사용이 역시 문제였습니다. 1.2.LayerSkipLayerSkip은 Meta에서 공개한, 대형 언어 모델의 추론 속도를 높이기 위해 레이어를 건너뛰는 기법과 자가 추론 방식을 결합하여 연산 비용을 줄이면서도 정확도를 유지할 수 있습니다. 그리..
AI 기술
2024. 11. 4. 10:16