12 月 9 日,智谱 AI 开源其核心 AI Agent 模型 AutoGLM,能够“看懂”手机屏幕、模拟真人进行点击、滑动和输入操作。
此时距离字节跳动“豆包手机”引爆市场仅过去一周,那款能跨应用自动执行任务的工程样机曾遭遇到微信、淘宝等应用的登录限制。
如今随着AutoGLM的全面开源,硬件厂商、手机厂商和普通开发者都可以基于该模型打造自己的AI手机助手。
从“对话响应”到“自主操作”,智谱AutoGLM展示了一个AI真正理解并使用手机的未来。
技术突破
这个被视为全球首个具备Phone Use能力的 AI Agent,能够稳定完成外卖点单、机票预订等长达数十步的复杂操作流程。它已经支持微信、淘宝、抖音、美团等超过 50 个高频中文应用的核心场景。
技术实现上,AutoGLM走了一条与众不同的路径。不同于传统脚本依赖易被封禁的无障碍服务,它底层调用了ADB指令,结合视觉大模型AutoGLM-Phone-9B。
其运行逻辑是看屏幕截图 → 大模型分析 → 模拟手指点击,这种基于视觉的“类人操作”让 App 厂商通过简单的代码检测进行防御变得极其困难。
据其他媒体报道,在下达点单指令后,AutoGLM 可自主完成打开App、搜索店铺、筛选商品、关闭广告弹窗等操作,全程耗时约一分半钟。
智谱自 2023 年 4 月开始投入 Phone Use 方向,到 2025 年 8 月发布的 AutoGLM2.0 已经可以完成类似豆包手机展示的功能。该项目负责人刘潇表示,团队建立了一整套 Phone Use 能力框架,将点击、滑动、输入、界面理解抽象化
生态重塑
智谱在此时选择开源,正值豆包与互联网大厂之间的对峙白热化。
就在一周前,字节跳动的“豆包手机”工程样机凭借其系统级权限和跨应用自动化能力,让市场首次直观感受到 AI Agent 手机的颠覆性潜力。
然而这种能力迅速触碰了互联网行业的逆鳞。微信、淘宝及多家银行App随即启动防御机制,用户反馈当豆包助手尝试接管这些应用时,会出现异常退出、风险提示甚至封号的情况。
业内分析认为,这种能绕过App直接完成任务、让服务直达用户的AI助手,会直接冲击互联网大厂基于用户停留和广告变现的商业模式。
智谱的开源策略,则为这场僵局提供了另一种可能性。“这件事只在一家公司做,是不够的。” 智谱在官方通稿中明确表示,AutoGLM开源的初衷是把这一层能力变成整个行业可以共同拥有、共同打磨的公共底座。技术架构方面,豆包手机依赖 Android 系统权限,AutoGLM 则采用视觉大模型+ADB 指令的开源框架。并且,AutoGLM 为开放生态,赋能全行业开发者。
根据北京计算机学会AI专委会秘书长张有鱼判断,未来的AI手机市场不会只有一个豆包。手机巨头们将拥有自研助手,二三线品牌和新兴设备商采用 AutoGLM 等开源方案快速跟进,形成多层次、多形态的竞争局面。
这次开源带来的最大变化,是技术门槛的大幅降低。硬件厂商、手机厂商和开发者均可基于 AutoGLM,在自己的设备或系统中复现一个能“看懂”屏幕、并模拟真人进行点击、输入、滑动的 AI 助手。
尤其值得注意的是,AutoGLM支持本地与云端双重部署模式,确保数据与隐私控制权掌握在使用者手中。
开源框架 Open-AutoGLM 还可提前预判,嵌入敏感操作分级确认机制。常规操作 AI 可自主执行,支付、转账等敏感操作需用户确认方可进行。
除了手机领域,AutoGLM 还可能推动其他硬件设备的进化。以前的穿戴式设备受制于交互方式的限制,几乎难以替代手机的任何功能,而现在通过 AutoGLM,绝大多数简单的任务都能轻松完成
参考资料:
https://www.cls.cn/detail/2225027
//www.jiqiren.org.cn/upload/2025/index.html style="-webkit-tap-highlight-color: rgba(0, 0, 0, 0); margin-top: 0px; margin-bottom: 0px; padding: 8px 0px; outline: 0px; max-width: 100%; clear: both; min-height: 1em; color: rgb(53, 53, 53); line-height: 1.8em; letter-spacing: 0.04em; text-indent: 2em; box-sizing: border-box !important; overflow-wrap: break-word !important;">https://awtmt.com/articles/3760976
//www.jiqiren.org.cn/upload/2025/article.html
【免责声明】本站所刊内容仅代表作者本人观点,与机器人网站无关。机器人网站对文中陈述、观点判断保持中立。本网转载自其它媒体的信息,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如有侵权,请联系我们删除。
本文地址:http://www.jiqiren.org.cn/news/1304.html
