일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 인공지능
- 휴머노이드 로봇
- 아두이노
- 서보모터
- TRANSFORMER
- OpenAI
- LLM
- 딥러닝
- AI
- ChatGPT
- ubuntu
- 확산 모델
- 오픈AI
- 딥마인드
- AI 기술
- 메타
- tts
- 일론 머스크
- 가상환경
- 트랜스포머
- 시간적 일관성
- ControlNet
- 티스토리챌린지
- 생성형 AI
- 오블완
- LORA
- PYTHON
- 뉴럴링크
- 우분투
- 멀티모달
- Today
- Total
AI 탐구노트
OpenAI o1 모델 공개 본문
OpenAI, 더 똑똑해진 AI 모델 'o1' 출시... 복잡한 문제 해결 능력 강화
OpenAI는 새로운 인공지능 모델 'o1'을 드디어 공개했습니다. 이 모델은 '스트로베리(trawberry)'라는 코드명을 가진 프로젝트로 진행되어 왔었는데, OpenAI의 실력을 이미 다 알고 있었기에 지난 발표 이후 생각보다 오랜 긴 침묵을 보며 이번에는 어떤 것들을 선보일까, 게다가 기존의 GPT-4 등에 사용된 기술이 아닌 전혀 다른 접근을 하고 있다는 얘기들도 있었기에 초기 버전의 AGI의 한 측면을 볼 수 있지 않을까 하는 기대를 불러일으켜 왔습니다.
공개된 내용에 의하면, o1은 추론, 특히 복잡한 문제 해결을 위한 추론에 특화되어 있고 과학, 수학, 코딩 등 다양한 분야에서 이전 모델보다 훨씬 뛰어난 성능을 보인다고 합니다. 이번에 공개된 것은 'o1-preview', 'o1-mini' 두 개의 버전입니다. mini 버전조차 경량화가 되었음에도 기존 대비 상대적으로 높은 성능을 보인다고 합니다. (과학 분야는 박사 수준, 국제 수학 올림피아드(IMO) 예선 시험에서 83%의 성적 등) 특히 추론 능력이 크게 강화되었다는데 그러다보니 질문하면 바로 답이 나오던 이전 버전과는 달리 상당 시간을 '숙고'하며 종합적인 판단과 추론을 하고 그 결과를 보여줍니다. 답변의 품질보다 신속함을 원하는 성미 급한 분들은 정식 공개 버전이 나올 때까지 조금 더 기다려 보는 것이 좋을 것 같습니다. 그때는 프리뷰 버전인 현재와 좀 달라질 수도 있으니까요.
보통 사전 훈련된 LLM은 책을 아주 많이 읽은 똑똑한 신입사원과 같다고 생각합니다. 지식은 많으나 경험이 부족하므로, 좋은 결과물을 내기 위해선 적절한 가이드가 있어야 한다는거죠. 'o1'의 경우는 그 신입사원이 수많은 시뮬레이션을 자체적으로 해서 수십년된 고참이 할만한 답변을 만들어내는 셈이 됩니다. 인공지능이 실수를 했을 때 이를 인식하고 다른 전략을 시도하는 등 사고의 과정을 스스로 개선할 수 있게 되면서 연역적 사고 등이 가능해진 것이죠. (비유가 -_-;) 이런 것이 가능해진 것은 테스트-시간 계산 (test-time computation) 학습법과 CoT (Chain of Thought) 등의 기법 덕분으로 생각됩니다.
챗GPT와 API에서 유료 플랜 사용자에게 제공되며, 'o1-preview'와 'o1-mini' 버전으로 나뉘는데, 아무래도 많은 컴퓨팅 자원이 필요해서 그런지, 각각 한 주에 30개, 50개의 메시지의 사용으로 한정되어 제공됩니다. 예상 비용은 GPT-4o의 4배와 1배 가량라고 하는데, 얼마 전 가짜뉴스인지 모르겠지만 다른 모델의 개발을 위해 ChatGPT의 구독 비용을 2000달러로 올릴 수도 있다는 얘기가 있었기에 생각보다 높진 않네 싶었습니다. 점점 더 많은 좋은 서비스가 나오길 기대하지만, 너무 과하지 않은 비용(!)으로 그동안 쌓아온 사람들의 관심이 끊어지지 않도록 하는 것도 함께 고려가 되었으면 합니다.
X에 올라온 Dr. Jim Fan의 o1에 대한 글에는 아래와 같은 그림이 들어 있습니다. 기존의 LLM이 사전학습과 튜닝 이후 추론 시에는 적은 리소스와 시간만 사용해서 답변을 주는 반면, Strawberry의 경우는 테스트 타임에 반복 샘플링을 통한 추론 계산 확장을 통해 높은 성능을 달성하는 접근을 하고 있다는 것을 보여줍니다.
'AI 관련 소식' 카테고리의 다른 글
2024.9.15 관심뉴스 (1) | 2024.09.16 |
---|---|
2024.9.14 관심뉴스 (3) | 2024.09.14 |
2024.9.12 관심 뉴스 (1) | 2024.09.12 |
2024.9.10 관심 뉴스 (2) | 2024.09.10 |
2024.9.9 관심 뉴스 (0) | 2024.09.09 |