Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
| 29 | 30 | 31 |
Tags
- 강화학습
- 멀티모달
- 이미지 생성
- 인공지능
- 음성합성
- LLM
- 메타
- 감정 표현
- 일론 머스크
- 확산 모델
- 오픈소스
- 생성형AI
- AI
- 자동화
- 오블완
- XAI
- PYTHON
- gaussian splatting
- tts
- 티스토리챌린지
- 딥러닝
- OpenAI
- AI 기술
- 트랜스포머
- 음성 인식
- 이미지 편집
- 바이브코딩
- 오픈AI
- 우분투
- ChatGPT
Archives
- Today
- Total
목록token-level cot (1)
AI 탐구노트
디지털 콘텐츠의 비약적인 발전과 함께, 텍스트를 입력하면 이미지를 생성하는 기술이 점점 현실화되고 있습니다. 최근 등장한 대형 언어 모델(Large Language Model, LLM)은 수학 문제나 코딩 문제 해결에 있어 '생각의 흐름(Chain of Thought, CoT)'을 따르며 정답을 도출하는 능력을 입증해 왔습니다. 이 같은 방식은 이미지 생성 분야에도 적용될 수 있을까요? T2I-R1 논문은 이러한 질문에서 출발하여, 텍스트-이미지 생성(text-to-image generation)에 고차원적인 사고 과정을 접목한 새로운 접근을 제안합니다. 이미지를 만들어내는 모델은 단순히 입력된 문장을 해석하는 것에 그치지 않고, 텍스트 속 의미를 '생각'하고, 그 생각을 바탕으로 이미지를 구성할 수 있..
AI 기술
2025. 5. 6. 19:41
