Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- tts
- 일론 머스크
- ubuntu
- 우분투
- TRANSFORMER
- 가상환경
- 인공지능
- 딥마인드
- LORA
- 생성형 AI
- ChatGPT
- 트랜스포머
- 이미지 편집
- LLM
- 오블완
- AI 기술
- 뉴럴링크
- PYTHON
- 아두이노
- 확산 모델
- AI
- 시간적 일관성
- 멀티모달
- OpenAI
- ControlNet
- 오픈AI
- 서보모터
- javascript
- 티스토리챌린지
- 메타
Archives
- Today
- Total
목록비전 언어 모델 (1)
AI 탐구노트
ScreenAI : 사용자 UI와 인포그래픽을 이해하는 비전 언어 모델
사용자 인터페이스(UI)와 인포그래픽을 이해하는데 특화된 비전 언어 모델 사람들이 기계(주로 컴퓨터)와 상호작용을 할 때 필요한 것이 UI이고 정보를 시각적으로 쉽고 효율적으로 파악하기 위해 사용하는 것이 인포그래픽이죠. ScreenAI는 구글에서 발표한 사용자 인터페이스(UI)와 인포그래픽을 이해하는데 특화된 비전 언어 모델입니다. 이를 이용하면 사용자가 웹브라우저를 통해 접근한 사이트 내용이나 스마트폰 화면 등 우리가 보는 화면의 내용을 AI가 이해할 수 있게 되고 이를 통해 사용자 경험을 개선하는데 활용할 수 있게 됩니다. ScreenAI는 이전 모델인 PaLI를 기반으로 개선됐으며 유연한 패치 전략(이미지를 부분으로 나눠 처리하는)을 적용해 다양한 종횡비의 이미지에서 작동하도록 했습니다. 또 사..
AI 기술
2024. 8. 22. 22:02