일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 딥러닝
- 코딩
- XAI
- 강화 학습
- 메타
- AI 기술
- PYTHON
- ubuntu
- 우분투
- OpenCV
- 티스토리챌린지
- tts
- 일론 머스크
- ChatGPT
- LORA
- 휴머노이드 로봇
- 오블완
- LLM
- AI
- 오픈AI
- OpenAI
- ai 챗봇
- 인공지능
- 시간적 일관성
- 트랜스포머
- 생성형AI
- 3d 재구성
- 다국어 지원
- 확산 모델
- 오픈소스
- Today
- Total
목록생성형AI (6)
AI 탐구노트

한때 대한민국은 자체 LLM(초거대 언어 모델)을 개발하며 글로벌 AI 경쟁에 도전장을 내밀었습니다. 하지만 최근 AI 산업의 흐름을 보면, 이제는 기술적 한계와 현실적 제약으로 인해 방향을 전환해야 할 시점에 놓여 있습니다. LLM 경쟁, 이미 게임은 끝났는가?LLM(초거대 언어 모델)의 개발은 다음과 같은 상상을 초월하는 자원을 요구합니다. 수백억~수조 개에 달하는 학습 데이터전 세계 상위 1% 수준의 AI 인재 풀연구와 학습에 투입되는 수개월~수년의 시간과 비용고성능 AI 전용 인프라 (A100, H100 등의 GPU 클러스터)이 모든 것을 감당할 수 있는 기업은 전세계적으로도 손에 꼽힙니다. 현재 시점에서 Google, OpenAI, Meta, xAI 등 ‘슈퍼 자본 + 슈퍼 인재’를 보유한 기업..

최근 AI 기술의 눈부신 발전은 누구나 손쉽게 그림을 그리고, 음악을 만들고, 영상을 제작할 수 있는 시대를 열었습니다. 그 중심에는 ChatGPT, Midjourney, Sora, Suno 등 다양한 AI 툴들이 있습니다. 그러나 이 기술의 자유로운 활용 뒤에는, 점점 더 목소리를 내기 어려워지는 진짜 창작자들이 존재합니다. 오늘은 이 부분에 대한 생각을 정리해 보겠습니다. 🎨 AI로 만든 ‘지브리풍’ 그림… 누구의 스타일일까?2025년 3월 26일, 오픈AI의 GPT-4o의 이미지 생성 기능이 확 개선되어 발표됐습니다. 사용자가 원하는 화풍이나 텍스트 등의 배치가 훨씬 나아졌고 Grok 만의 특권처럼 여겨졌던 실제 인물 사진의 생성도 지원되는 등 몰라보게 성능이 좋아졌다는 평들이 있죠. 그런데, ..

요즘 AI 이야기 안 하면 대화가 안 되는 세상이죠. 하루가 멀다 하고 새로운 기술이 발표되고, 너도나도 AI를 탑재한 제품과 서비스를 내놓고 있으니까요. 그런데 이 와중에 살짝 다른 관점에서 AI를 바라보는 시선이 생기고 있습니다. 예전에는 뭔가 ‘AI 기술 그 자체’가 주인공이었다면, 이제는 그 AI가 ‘어디에, 어떻게’ 쓰이느냐가 더 중요해졌다는 겁니다. 즉, 기술 중심의 AI에서 ‘비즈니스 중심의 AI’로 시선이 옮겨가고 있다는 이야기죠.게임 회사의 AI 활용, 그 시작이자 전환점최근 머니투데이에 실린 기사를 보면, 이 흐름이 정말 실감 납니다. 크래프톤이 신작 '인조이'에 sLM 기반을 적용한 것에 대한 소개와 넷마블, 네오위즈, 위메이드 등의 게임업체도 AI 서비스 도입을 위해 AI 전담 연구..

Janus는 이미지와 텍스트를 동시에 이해하고 생성할 수 있는 모델입니다. 기존 멀티모달 모델은 하나의 이미지 인코딩 방식을 이해와 생성에 모두 사용했습니다. 그런데 사실 이 두 작업이 요구하는 정보가 다릅니다. 이미지를 이해하는 작업은 이미지 속의 사물이나 장면을 분석해서 높은 수준의 의미를 추출해야 하고, 생성 작업은 이미지의 세부적인 부분을 그리거나 표현해야 합니다. 그러다보니 하나의 인코딩 방식으로 두 작업을 모두 수행하게 되면 성능이 떨어지는 문제가 있었습니다. Janus는 시각적 인코딩을 이미지 이해용과 생성용 두 가지로 분리했습니다. 이 두 인코더를 하나의 통합된 Transformer 구조 안에서 결합해, 작업에 맞는 것을 각각 사용할 수 있도록 했고, 이 덕분에 두 작업 간의 충돌을 ..

지난 번에 ComfyUI를 설치해서 Flux.1 Schnell을 돌려봤습니다. Flux.1 설치 및 테스트이미지 생성 모델하면 떠 오르는 것들이 있을 겁니다. 최근에는 워낙 많이 생겨서 다 나열하기 힘들지만 그래도 떠오르는 이름 말입니다. Stable Diffusion, DALL-E, MidJourney, Flux.1 그 가운데 하나가 B42morrow.tistory.com 그러다보니 ComfyUI라는 것을 어떻게 써먹을 수 있는지 좀 더 알아봐야겠다는 생각이 들었습니다. 검색을 해 보니 Stable Diffusion과 같이 공개 모델을 이용하는 사람들 가운데 LoRA를 적용해서 개인적으로 사용하는 분들이 많다는 것을 알게 됐고, ComfyUI에도 이것을 활용할 수 있다고 합니다. 그래서, 이번 시간..

AI, 미국 채용과 입시의 변화를 이끌다미국의 구직 및 입시 시장에서, 구직자들이 AI 도구를 활용해 지원서를 작성하면서 지원자 수는 증가했지만, 기업은 우수한 인재 선별이 어려워지거나 대학 입시에서도 AI 활용이 확대되며 기존 에세이 평가의 의미가 퇴색하는 등 새로운 도전에 직면하고 있다고 합니다. (한겨레) AI 영상 진단, 필수 의료 도구로 자리 잡는다AI 영상 진단 기술을 보유한 루닛, 뷰노, 제이엘케이, 뉴로핏 등 주요 기업들이 진단의 정확도를 높이며 의료 분야 AI 시장을 주도하고 있으며 정부도 AI 기반 응급 예측 모델과 의료 데이터를 활용하는 지원책을 마련하고 있어 2028년까지 필수 의료 분야 AI 기술 투자를 2배 확대할 예정이라고 합니다. (팜뉴스)경기도, 생활밀착형 AI 서비스 시범..