| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
| 29 | 30 | 31 |
- 음성 인식
- XAI
- 오픈AI
- 이미지 생성
- AI 기술
- 우분투
- 인공지능
- 바이브코딩
- PYTHON
- LLM
- 이미지 편집
- 메타
- 딥러닝
- tts
- 티스토리챌린지
- 오블완
- 생성형AI
- 오픈소스
- AI
- OpenAI
- 일론 머스크
- ChatGPT
- 감정 표현
- 자동화
- 강화학습
- gaussian splatting
- 음성합성
- 멀티모달
- 확산 모델
- 트랜스포머
- Today
- Total
목록OpenAI (15)
AI 탐구노트
지난 번 소개글에 이어 Speech-to-Speech 모델인 gpt-realtime을 실제 테스트 해 보기로 했습니다. 이 모델을 OpenAI 의 API를 이용하는 것으로 OpenAI의 API Key가 있어야 합니다. 연동하는 과정을 한번 쭉 따라가 보도록 하겠습니다. (단, 결과적으로 완전하게 동작하는 단계는 아직 아닙니다! 마지막 단계에서 하나가 걸렸는데 그 부분은 글 끝에서 확인하시면 될 것 같습니다) 1.구현 요건서버 : Python, FastAPI 이용클라이언트 : html / javascript / css 이용한 web UI, webRTC를 이용한 데이터 전송, 사용자 마이크 이용필요 기능입력/출력 언어 선택 UI : 입력언어 (기본 자동 감지), 출력언어(특정 언어 지정)오디오 출력 토글 :..
gpt-realtime은 OpenAI가 자사의 공식 블로그를 통해 8/28일에 공개한 음성 에이전트 모델입니다. 북마크만 해두고 있었는데 이제 생각이 나서 이것도 간략하게 정리만 해 두고 가겠습니다. gpt-realtime 모델 소개OpenAI의 가장 진화된 speech-to-speech 모델입니다. (참고: Whisper는 text to speech 용 ASR 모델)자연스러운 감정 표현, 말투, 속도 등을 더 정교하게 제어할 수 있으며, 복잡한 지시사항도 더 잘 따릅니다. gpt-realtime 특징 1️⃣ 향상된 오디오 품질더욱 자연스러운 대화를 위해 모델의 억양, 감정, 말의 리듬 등을 개선했습니다.예) '빠르고 전문적으로 말해줘', '공감 있는 프랑스식 억양으로 말해줘'와 같은 세밀한 지시도 정확..
어제 (현지 기준 7월17일) OpenAI는 ChatGPT Agent (통합 에이전트)를 공개했습니다. (링크) 지난 번에 Kimi K2 모델의 공개 당시 OpenAI의 발표 연기 소식이 있었고 생각보다 강력했던 Kimi 때문에 이번 공개 일정이 연기된 것 아니냐는 의구심이 일기도 했었습니다. 어찌됐건 최종적으로 혁신적인 서비스가 공개됐고 이번 글은 그 소식을 간단하게 정리해서 알려 드립니다. ChatGPT AgentOpenAI가 2025년 7월 17일 새로 공개한 ChatGPT 에이전트는 단순한 챗봇을 넘어 사용자의 가상 컴퓨터를 직접 조작해 복잡한 작업을 수행해 주는 일종의 ‘지능형 비서 또는 지능형 도우미’입니다. 웹 브라우저 클릭, 터미널 실행, 캘린더 확인, 슬라이드 제작 등 다양한 기능을 하..
최근 흥미로운 소식이 전해졌습니다. 전 세계 최초로 모든 시민과 거주자에게 ChatGPT Plus를 무료로 제공하기로 한 것입니다. 이는 OpenAI의 공식 사이트에서도 UAE와의 파트너십과 관련되어 소개된 바 있습니다. (링크) Everyone living in Dubai will soon get free ChatGPT Plus subscriptionPeople living in the United Arab Emirates (UAE), will soon be able to use ChatGPT Plus for free. This makes the UAE the first country in the world to give free access to the premium version of Chat..
오픈AI에서 최근 개발자를 지원하기 위한 AI 기술을 새로 공개했습니다. 프로그래밍 자체를 처음 접하는 사람이나 바쁜 개발자 모두에게 큰 도움이 되는 AI 도구로 말입니다. 이번 글에서는 Codex가 뭔지, 어떻게 쓰는지 등에 대해 간략하게 내용을 정리해 보겠습니다. 🧠 Codex란 무엇인가요?Codex는 OpenAI에서 만든 인공지능(AI) 코딩에 특화된 AI 입니다. 다양한 다양한 프로그래밍 언어(파이썬, 자바스크립트, 타입스크립트 등)를 지원하고, 복잡한 작업도 처리할 수 있죠. 🔧 Codex는 어떤 곳에 사용될 수 있나요?코드를 자동으로 작성예: '간단한 계산기 앱을 만들어줘'라고 말하면, Codex가 HTML, CSS, 자바스크립트 등 12개 이상의 프로그래밍 언어를 이용해 코드를 짜주고 ..
OpenAI는 어제(2025.4.16), 새로운 추론 모델인 'o3'와 'o4-미니(mini)'를 공개했습니다. (링크) 이 모델들은 기존 모델들과는 달리, 도구를 활용하는 방식으로 성능 향상과 비용 효율성을 동시에 구현했습니다. 이번 글에서는 짧게 해당 부분을 정리해 보고 넘어가겠습니다. o3와 o4-mini'o3'는 기존 모델을 능가하는 성능을 자랑합니다. 수학, 코딩, 추론, 과학, 시각적 이해 능력 등의 테스트에서 우수한 성과를 보였으며, 특히 강화 학습(RL)을 통해 추론 성능과 컴퓨팅 속도 모두에서 눈에 띄는 발전을 이뤘습니다. 'o4-mini'는 가격, 속도, 성능의 균형을 고려한 모델로, 개발자들에게 매력적인 선택지로 떠오르고 있습니다. 도구 사용을 통한 성능 향상두 모델의 핵심 특징은 바..
OpenAI에서 GPT 4.1 버전을 공개했습니다. 흠... 이제 또 새로운 서비스, 기술 소개 시즌이 온 건가요? 한번에 몰아치는 OpenAI의 특성 상 이번 한 주는 또 많은 분석글들이 쏟아지겠네요. 저도 간단하게 요약 정리해두고 가렵니다. GPT-4.1 개요GPT-4.1은 GPT-4 Turbo의 차세대 버전GPT-4.1, mini, nano 의 3개 모델을 공개GPT-4.1 mini, nano는 경량화 모델이지만 높은 성능을 제공하며, 저지연 및 저비용 운영이 가능함코딩 능력, 지시 이해 능력, 장문 맥락 처리 성능이 크게 향상됨100만 토큰까지의 문맥 길이 지원 (기존 GPT-4o는 128,000개 지원) -> 오호... 실 업무에서 활용하기에 좋아졌네요. GPT-4.1의 주요 개선 사항 정확도..
OpenAI, 기술과 마케팅의 융합으로 초격차를 증명하다12월 초부터 OpenAI는 하루에 하나씩 새로운 제품이나 기술을 공개하며 전 세계의 이목을 끌고 있습니다. 이러한 전략은 단순히 기술력을 자랑하는 데 그치지 않고, 사람들의 기대감을 유도하고 경쟁사들에게 심리적 압박을 가하는 마케팅 방식으로도 주목받고 있습니다. 첫날 발표부터 사람들은 충격과 호기심에 휩싸였습니다. 그 후 발표되는 각 기술과 제품들은 하나하나 '초격차'를 보여주는 내용들이었죠. AI의 발전 속도를 직접 목격하며 사람들은 내일은 어떤 내용이 소개될까?'라는 설렘 속에 빠졌들고 있습니다. 설마 저만 그런가요? ^^; 하루 하나씩, 기대를 설계하는 마케팅OpenAI가 선택한 방식은 단순히 모든 내용을 한 번에 공개하는 대신, 12일에 ..
최근 올라온 뉴스들 가운데 관심을 가질만한 것을 소개합니다. 메타, 매개변수 70B로 첨단 성능 발휘하는 '라마 3.3' 출시..."비용은 8분의 1 이하" 라마 3.3 70B 모델이 공개되었는데 기존 발표된 라마 3.1 405B와 비슷한 성능을 제공하며 처리 속도도 빨라졌다고 합니다. 오픈소스 진영에서는 아주 좋은 소식인 듯 합니다. 메타, 매개변수 70B로 첨단 성능 발휘하는 '라마 3.3' 출시..."비용은 8분의 1 이하" - AI타임스메타가 오픈 소스 대형언어모델(LLM) \'라마 3.3 70B\'를 출시했다. 매개변수는 700억개에 불과하지만, 훨씬 큰 모델과 맞먹거나 일부 뛰어난 성능을 보인다고 밝혔다. 대신 사용 가격은 훨씬 저렴하www.aitimes.com 구글, Gemini-ex..
OpenAI, GPT-o1 pro 모드 공개며칠 전 오픈AI가 GPT-o1과 GPT-o1 pro 모드를 공개했습니다. 관련 글 : https://openai.com/index/introducing-chatgpt-pro/ 기존 공개되어 있었던 것은 o1-preview와 o1-mini였죠. 추론 시 CoT(Chain of Thought) 기법을 이용해 GPT-4o 대비 훨씬 나은 결과물을 보여줬었는데 이것이 정식 버전으로 출시가 된 것이라고 보면 됩니다. GPT-o1 pro 모드는 기존 모델들 대비 Math, 코딩, 과학 질문 등에서 훨씬 향상된 성능을 보여 주는 것으로 소개 되었습니다. ChatGPT Pro 구독 모델 추가구독 또한 pro 모드를 사용할 수 있는 Pro 요금제가 추가되었습니다. Pro모드..
