阿里发布手机操作智能体框架Mobile-Agent

阿里发布手机操作智能体框架Mobile-Agent

1月30日,来自阿里和北京交通大学的团队在arXiv上发表论文,提出了用于操作手机的智能体框架Mobile-Agent。据介绍,这是一个纯视觉解决方案,不需要XML(可拓展标记语言)和系统元数据,其操作范围不受限制,可进行多应用操作,配备多种视觉感知工具用于操作定位,且无需训练,即插即用。目前,Mobile-Agent已经学会了阿里巴巴、谷歌地图、TikTok等10个APP的操作,可以完成一些跨应用任务。

论文地址:
https://arxiv.org/abs/2401.16158

本文地址:https://www.163264.com/6341

(0)
研究证明可以让AI模型从一个婴儿的角度去学习
上一篇 2024年2月2日 下午6:07
商汤大模型体系日日新SenseNova 4.0发布,其知识覆盖面、推理能力、长文本理解力、代码生成能力等得到提升
下一篇 2024年2月2日 下午6:11