StreamMultiDiffusion : 실시간 영역 기반 텍스트-이미지 생성 모델

Notice

Recent Posts

Recent Comments

Link

« 2024/12 »
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

Tags more

Archives

Today

Total

관리 메뉴

AI 탐구노트

StreamMultiDiffusion : 실시간 영역 기반 텍스트-이미지 생성 모델 본문

AI 기술

StreamMultiDiffusion : 실시간 영역 기반 텍스트-이미지 생성 모델

42morrow 2024. 8. 25. 09:41

실시간 영역 기반 텍스트-이미지 생성 모델

StreamMultiDiffusion은 실시간 영역 기반 텍스트-이미지 생성 모델입니다.

서울대 ComputerVisionLab 연구원들이 발표한 이 모델은 이미지 생성 속도가 이전 대비 훨씬 빨라졌고 모델을 다중 프롬프트 스트림 배치 아키텍처로 재구성했다고 합니다. 그 결과, 사용자가 텍스트 설명을 사용하여 특정 이미지 영역을 세밀하게 제어하면서도 원하는 크기의 고품질 이미지를 빠르게 만들어낼 수 있게 되었습니다.

Github Repo에는 지역 기반 다중 텍스트-이미지 생성, 신속한 분리를 통한 이미지 인페인팅, 파노라마 생성 등을 수행하는 코드 예시도 함께 제공하고 있습니다.

여기서 끝나는 게 아니라 연구자들은 고맙게도 Gradio를 활용해 대화형으로 작동하는 Semantic Pallete(시맨틱 팔레트)라는 대화형 생성 패러다임을 제시하며 사용자가 직접 영역을 지정해 의미를 부여하는 방식으로 고품질 이미지를 실시간으로 생성할 수 있도록 도구도 공개 했습니다. : )

참고) 논문, 코드, 데모

'AI 기술' 카테고리의 다른 글

MindEye2 : 뇌활동 분석해서 시각정보로 재구성하는 기술 (0)	2024.08.25
Procigen : 인간-사물 상호작용 합성 데이터셋 (0)	2024.08.25
LATTE3D : 텍스트-3D 생성 모델 (0)	2024.08.24
Wear-Any-Way : 패션 가상 피팅 기술 (0)	2024.08.24
VideoMamba : 영상 속의 상황을 이해하는 모델 (0)	2024.08.24

'AI 기술' Related Articles

AI 탐구노트

StreamMultiDiffusion : 실시간 영역 기반 텍스트-이미지 생성 모델 본문

StreamMultiDiffusion : 실시간 영역 기반 텍스트-이미지 생성 모델

'AI 기술' 카테고리의 다른 글

티스토리툴바