Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 확산 모델
- 딥러닝
- 멀티모달
- 서보모터
- 오픈AI
- 휴머노이드 로봇
- AI 기술
- ubuntu
- 우분투
- 메타
- 아두이노
- PYTHON
- OpenAI
- ControlNet
- ChatGPT
- AI
- 트랜스포머
- 티스토리챌린지
- 생성형 AI
- 일론 머스크
- LLM
- 뉴럴링크
- 가상환경
- LORA
- TRANSFORMER
- tts
- 시간적 일관성
- 딥마인드
- 인공지능
- 오블완
Archives
- Today
- Total
AI 탐구노트
Mobile-Agent-V2 본문
Mobile-Agent-V2는 알리바바 그룹이 공개한 모바일 기기 상에서 내비게이션과 실행의 개선을 돕는 작업 도우미 기술입니다. 모바일 기기에서 작업을 자동으로 처리하기 위해서는 사용자의 지시나 행동의 의도 등을 파악하고 기기 상에서 동작하는 다양한 기능들을 다룰 수 있도록 만드는 것이 필요한데, 이 목적으로 최근 에이전트 기술이 많이 연구되고 있습니다.
스마트폰에서의 자동화 처리를 위해 예전에는 단순한 룰 기반의 IFTTT(IF This Then That)라는 기술을 사용하기도 했습니다. IFTTT의 경우 단순하지만 광범위한 작업에 사용될 수 있었던 반면, Mobile-Agent-V2는 복잡한 작업과 다단계 작업을 효과적으로 처리할 수 있다는 장점이 있습니다.
Mobile-Agent-V2에는 Planning/Decision/Reflection이라는 3개의 특수 에이전트가 있으며 각각은 다음과 같은 역할을 수행합니다.
- Planning 에이전트 : 이전 작업들을 요약하여 진행 상황을 텍스트로 정리합니다.
- Decision 에이전트 : 정리된 진행 상황을 바탕으로 작업을 수행하며, 중요 정보는 기억 장치에 업데이트 합니다.
- Reflection 에이전트 : 작업 전후 상태를 보고 오류를 식별하여 수정합니다.
Mobile-Agent-V2는 긴 작업 내역과 복잡한 화면을 효율적으로 탐색하고 중요한 정보를 기억하는 능력이 뛰어나며 결과적으로 어려운 작업에서 성공률이 55% 수준까지 끌어올릴 수 있었다고 합니다. (기존 단일 에이전트 성공률은 20% 수준)
'AI 기술' 카테고리의 다른 글
ToonCrafter (0) | 2024.08.13 |
---|---|
LivePortrait : 정적인 얼굴 이미지를 움직임을 부여하는 기술 (0) | 2024.08.13 |
VGGHeads (0) | 2024.08.12 |
CLASI (0) | 2024.08.09 |
SF3D (0) | 2024.08.08 |