Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 아두이노
- 딥러닝
- 티스토리챌린지
- AI 기술
- OpenAI
- 생성형 AI
- LORA
- 뉴럴링크
- 가상환경
- ControlNet
- 휴머노이드 로봇
- LLM
- 시간적 일관성
- ChatGPT
- 서보모터
- ubuntu
- tts
- PYTHON
- 트랜스포머
- 멀티모달
- 오블완
- AI
- 확산 모델
- 인공지능
- 일론 머스크
- TRANSFORMER
- 우분투
- 딥마인드
- 오픈AI
- 메타
Archives
- Today
- Total
AI 탐구노트
MistoLine : 손그림 입력을 지원하는 이미지 생성모델 본문
다양한 유형의 라인 아트 입력을 처리할 수 있는 SDXL-ControlNet 모델
MistoLine은 손으로 그린 스케치, 건축 도면, 드레스 디자인 등 다양한 유형의 라인 아트 입력을 처리할 수 있는 SDXL-ControlNet 모델입니다. (ControlNet은 조건을 추가하여 확산모델을 제어하는 신경망 구조)
이를 이용해 선명하고 생생한 고품질의 이미지(짧은 면 기준 1024px 이상)를 생성할 수 있습니다. MistoLine은 새로운 전처리 알고리즘으로 AnyLine을 사용하고, SDXL ControlNet 모델에 초점을 맞춰 재훈련되었습니다.
특징으로는 아주 디테일한 부분까지 잘 처리한다는 것입니다. 즉, 요소의 디테일이나 이미지 상의 텍스트 라벨을 정확히 추적할 수 있고, 라인 아트와 깊이 매핑을 결합하여 추적 정밀도를 더 높일 수 있습니다. 또한 복잡한 시나리오에서의 세부 복원하는 능력과 신속한 정렬, 안정성 등이 기존 모델들을 능가한다고 합니다.
'AI 기술' 카테고리의 다른 글
EgoPet : 개, 고양이 등 동물의 시점 영상 데이터셋 (0) | 2024.08.15 |
---|---|
AniTalker : 자연스럽게 말하는 대화 영상 생성 프레임워크 (0) | 2024.08.15 |
HiDiffusion : 이미지의 해상도와 생성 속도 향상 기법 (0) | 2024.08.15 |
Phi-3-vision : Phi-3 기반 멀티모달 모델 (0) | 2024.08.15 |
P3M-Net : 비식별화된 초상화 배경 분리 (0) | 2024.08.15 |