일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 딥마인드
- 오블완
- 생성형 AI
- javascript
- 멀티모달
- 시간적 일관성
- 티스토리챌린지
- 서보모터
- ubuntu
- 뉴럴링크
- ControlNet
- LORA
- 확산 모델
- 메타
- 일론 머스크
- 트랜스포머
- 이미지 편집
- AI 기술
- AI
- tts
- 인공지능
- 아두이노
- 가상환경
- OpenAI
- 오픈AI
- 우분투
- ChatGPT
- LLM
- PYTHON
- TRANSFORMER
- Today
- Total
목록2024/09/13 (2)
AI 탐구노트
OpenAI, 더 똑똑해진 AI 모델 'o1' 출시... 복잡한 문제 해결 능력 강화 OpenAI는 새로운 인공지능 모델 'o1'을 드디어 공개했습니다. 이 모델은 '스트로베리(trawberry)'라는 코드명을 가진 프로젝트로 진행되어 왔었는데, OpenAI의 실력을 이미 다 알고 있었기에 지난 발표 이후 생각보다 오랜 긴 침묵을 보며 이번에는 어떤 것들을 선보일까, 게다가 기존의 GPT-4 등에 사용된 기술이 아닌 전혀 다른 접근을 하고 있다는 얘기들도 있었기에 초기 버전의 AGI의 한 측면을 볼 수 있지 않을까 하는 기대를 불러일으켜 왔습니다. 공개된 내용에 의하면, o1은 추론, 특히 복잡한 문제 해결을 위한 추론에 특화되어 있고 과학, 수학, 코딩 등 다양한 분야에서 이전 모델보다 훨씬 뛰어난..
다양한 문자인식(OCR) 작업을 통합적으로 처리하는 모델 GOT(General OCR Theory)는 다양한 문자인식(OCR) 작업을 통합적으로 처리하는 고성능 모델입니다. 기존의 OCR 시스템은 다양한 모듈을 조합한 복잡한 구조로 구성되어 있어 유지 보수가 어렵고, 특정 작업에만 최적화되어 범용성이 떨어지고 고밀도 텍스트나 다양한 언어를 처리하는 데 한계가 있었습니다. GOT의 구조는 OCR 작업을 단순화하고 범용성을 극대화하려는 시도로 기존 방식의 복잡성을 해결하는 데 중점을 두고 있습니다. 고압축 인코더와 긴 맥락을 처리하는 디코더로 구성된 엔드 투 엔드 OCR-2.0 모델을 통해 다양한 입력 이미지 형식과 고해상도 문서 및 수식, 도표, 음악 악보 등의 복잡한 문자들을 처리할 수 있고 상호작용..