일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- PYTHON
- TRANSFORMER
- 휴머노이드 로봇
- AI
- ChatGPT
- 일론 머스크
- ControlNet
- LLM
- 확산 모델
- 딥마인드
- 가상환경
- 뉴럴링크
- AI 기술
- 티스토리챌린지
- 서보모터
- 메타
- 멀티모달
- OpenAI
- 우분투
- LORA
- 아두이노
- 오블완
- ubuntu
- 오픈AI
- tts
- 생성형 AI
- 트랜스포머
- 인공지능
- 시간적 일관성
- 딥러닝
- Today
- Total
목록사용자 인터페이스 (3)
AI 탐구노트
1. 서론디지털 이미지 편집은 현대의 다양한 산업에서 필수적인 기술로 자리 잡았습니다. 하지만 세밀하고 정밀한 편집 작업은 여전히 고도의 전문성이 요구되며, 대부분의 사용자는 이 과정에서 직관적이지 않은 인터페이스와 복잡한 도구 사용의 어려움을 겪게 됩니다. 그러던 중에 생성형 AI의 등장은 기반의 이미지 생성 및 편집의 자동화에 혁신적인 변화를 가져왔습니다. 특히, Diffusion 모델과 다중모달 대규모 언어모델(MLLM)의 결합은 사용자 경험을 향상시키는 핵심적인 도구가 되고 있습니다. MagicQuill은 이러한 기술적 흐름 속에서 탄생한 혁신적인 이미지 편집 시스템입니다. 사용자는 단순한 브러시 스트로크만으로도 복잡한 편집을 수행할 수 있으며, 시스템은 사용자 의도를 실시간으로 분석하고 이에 ..
사용자 인터페이스(UI)와 인포그래픽을 이해하는데 특화된 비전 언어 모델 사람들이 기계(주로 컴퓨터)와 상호작용을 할 때 필요한 것이 UI이고 정보를 시각적으로 쉽고 효율적으로 파악하기 위해 사용하는 것이 인포그래픽이죠. ScreenAI는 구글에서 발표한 사용자 인터페이스(UI)와 인포그래픽을 이해하는데 특화된 비전 언어 모델입니다. 이를 이용하면 사용자가 웹브라우저를 통해 접근한 사이트 내용이나 스마트폰 화면 등 우리가 보는 화면의 내용을 AI가 이해할 수 있게 되고 이를 통해 사용자 경험을 개선하는데 활용할 수 있게 됩니다. ScreenAI는 이전 모델인 PaLI를 기반으로 개선됐으며 유연한 패치 전략(이미지를 부분으로 나눠 처리하는)을 적용해 다양한 종횡비의 이미지에서 작동하도록 했습니다. 또 사..
베리어 프리 키오스크 (Barrier Free Kiosk) 베리어 프리 키오스크란 장애인이나 고령자, 임산부 등 다양한 사용자들이 쉽게 접근하고 사용할 수 있도록 설계된 무인 정보 단말기를 의미하면 다음과 같은 특징을 가지고 있습니다. 물리적 접근성 측면높이, 위치, 조작부 크기와 배열 등이 휠체어나 키 작은 사람들도 쉽게 접근할 수 있도록, 그리고 입력 방식도 터치스크린 외에 버튼, 레버, 음성 인식, 동작 인식 등 다양하게 지원되도록 설계됩니다. 시각적 접근성 측면시각 장애인을 위해 화면의 텍스트 크기를 조절하거나 음성 안내를 하거나 점자 디스플레이/키보드 등을 제공합니다. 청각적 접근성 측면청각 장애인을 위해 시각적인 안내를 강화하거나 자막이나 화면 내용을 텍스트로 변환하거나 수화 표현 또는 동작 ..