Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
Tags
- 딥러닝
- 다국어 지원
- 생성형 AI
- 일론 머스크
- 오픈소스
- 메타
- 시간적 일관성
- AI
- LLM
- PYTHON
- 강화 학습
- 티스토리챌린지
- AI 기술
- 트랜스포머
- 오블완
- 확산 모델
- 우분투
- 오픈AI
- Stable Diffusion
- 인공지능
- OpenCV
- OpenAI
- TRANSFORMER
- ChatGPT
- 휴머노이드 로봇
- tts
- 아두이노
- 멀티모달
- LORA
- ubuntu
Archives
- Today
- Total
목록PALI (1)
AI 탐구노트

사용자 인터페이스(UI)와 인포그래픽을 이해하는데 특화된 비전 언어 모델 사람들이 기계(주로 컴퓨터)와 상호작용을 할 때 필요한 것이 UI이고 정보를 시각적으로 쉽고 효율적으로 파악하기 위해 사용하는 것이 인포그래픽이죠. ScreenAI는 구글에서 발표한 사용자 인터페이스(UI)와 인포그래픽을 이해하는데 특화된 비전 언어 모델입니다. 이를 이용하면 사용자가 웹브라우저를 통해 접근한 사이트 내용이나 스마트폰 화면 등 우리가 보는 화면의 내용을 AI가 이해할 수 있게 되고 이를 통해 사용자 경험을 개선하는데 활용할 수 있게 됩니다. ScreenAI는 이전 모델인 PaLI를 기반으로 개선됐으며 유연한 패치 전략(이미지를 부분으로 나눠 처리하는)을 적용해 다양한 종횡비의 이미지에서 작동하도록 했습니다. 또 사..
AI 기술
2024. 8. 22. 22:02