일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 딥러닝
- 생성형AI
- LORA
- tts
- 오블완
- 트랜스포머
- AI
- 오픈소스
- 확산 모델
- 다국어 지원
- 인공지능
- 오픈AI
- XAI
- 강화 학습
- 일론 머스크
- OpenAI
- 실시간 렌더링
- PYTHON
- 멀티모달
- 휴머노이드 로봇
- ai 챗봇
- 자연어 처리
- AI 기술
- 티스토리챌린지
- LLM
- 우분투
- 시간적 일관성
- ChatGPT
- 메타
- OpenCV
- Today
- Total
목록2025/05/22 (2)
AI 탐구노트

인공지능이 우리 일상 곳곳에 스며들고 있는 지금, 텍스트 기반 인공지능이 주목받고 있습니다. 대표적인 예로는 대형 언어 모델(LLM)을 들 수 있는데, 이 모델들은 복잡한 문제를 텍스트로 표현하고 해석하는 데에 뛰어난 능력을 보여줍니다. 최근에는 이미지와 텍스트를 동시에 처리하는 다중모달 인공지능(MLLM)도 등장했지만, 여전히 텍스트를 중심으로 사고를 이어갑니다. 하지만 공간 정보나 시각 정보가 중심이 되는 문제에서는 과연 이런 방식이 최선일까요? 실제로 사람들은 복잡한 구조를 이해하거나 계획을 세울 때 종종 그림을 그려가며 생각합니다. 예를 들어, 미로를 탐색하거나 방 구조를 계획할 때 우리는 말보다 먼저 그림을 떠올립니다. 이처럼 '보면서 생각하기'가 훨씬 자연스러운 문제 영역에서는, 인공지능도 언..

Google I/O 란?Google I/O는 구글(Google)이 매년 개최하는 개발자 컨퍼런스로, 최신 기술, 제품, 서비스를 발표하고 개발자 커뮤니티와 소프트웨어 및 하드웨어 혁신을 공유하는 행사입니다. 주요 특징은 다음과 같습니다. 목적 : 안드로이드, Gemini AI, 클라우드, 웹, XR(확장 현실) 등 구글의 최신 기술 업데이트와 API, 개발 도구를 소개하며, 개발자들이 이를 활용해 애플리케이션을 만들 수 있도록 지원주요 발표: 새로운 AI 모델(예: Gemini 2.5), 안드로이드 OS 업데이트, 생성형 미디어 도구(예: Veo, Flow), 개발자 도구(예: Jules Code Assistant), 하드웨어 협업(예: Android XR) 등형식 : 키노트 세션, 기술 워크숍, 데모,..