在通过不同渠道获取必要权限后,AI 助手才能做到接管人类手机,执行各种跨 App 任务。

图片来源:视觉中国
蓝鲸新闻 12 月 6 日讯(记者 朱俊熹)上线不到一周,字节跳动联手中兴打造的首款 " 豆包助手 "AI 手机便卷入舆论风波。部分首批用户在试用过程中,遭遇无法登录微信、被多款银行 App 弹窗预警等状况。一时之间,究竟该不该 " 让 AI 接管手机 " 成为公众讨论焦点。
12 月 5 日,豆包手机助手团队再发声明称,为了让技术发展、行业接受度和用户体验多方都能形成良性适配,计划在接下来的一段时间,在部分场景对 AI 操作手机的能力做一些规范化调整。具体调整包括但不限于,一是限制刷分、刷激励的使用场景;二是进一步限制金融类应用的使用;三是限制部分游戏类使用场景。
在科技公司的炫目演示中,AI 仿佛已化身万能助手,为用户带来科幻般的便捷生活。然而,背后的隐私安全疑虑就如同一团迷雾。更深处的暗流,是各家应用平台的商业利益之争。留给用户的疑问是,AI 究竟如何接管你的手机,信息安全又该怎样得到保障?
谁在操控你的手机?
12 月 3 日,针对外界关于 " 豆包手机助手拥有操作系统高危权限 " 的质疑,团队发布了澄清声明,强调不存在任何黑客行为。
声明指出,豆包手机助手拥有 INJECT_EVENTS 权限,确实是系统级权限。但其技术实现依赖 Android 系统级权限,有更严格的使用限制。只有拥有 INJECT_EVENTS 权限许可,产品才能跨屏、跨应用来模拟点击事件,完成用户操作手机的任务需求。而豆包手机助手需要经过用户主动授权后,才可以调用该权限。
" 据我们了解,目前行业的 AI 助手,均需要使用该权限(或与其类似的无障碍权限)才能提供操作手机的服务。" 团队表示。
INJECT_EVENTS 权限允许应用向系统注入输入事件,例如模拟用户的点击、滑动、按键等操作。这意味着,拥有该权限的程序可以在系统层面像用户一样控制手机屏幕。而无障碍权限是 Android 系统为视障、听障等群体设计的辅助功能。获得无障碍权限后,应用可以读取屏幕内容,并执行点击、滑动等部分操作,权限能力相对更有限。
个人隐私保护专家、北京汉华飞天信安科技有限公司总经理彭根向蓝鲸科技解释称,INJECT_EVENTS 权限属于更高等级的系统底层权限,需要手机厂商通过一定技术方式赋予,一般的应用无法直接获取。相比之下,无障碍权限是普通应用在安装后,经用户主动授权即可开启的权限集合,更强调用户的知情与同意。
而在今年 8 月,大模型厂商智谱 AI 在发布智能体 AutoGLM 2.0 时表示,引入了 " 云手机 / 云端桌面 " 式执行形态,可在云端自主完成跨应用任务,无需依赖终端的无障碍权限。
有知情人士告诉蓝鲸科技,AutoGLM 选择的路径不同于豆包手机助手。它直接 To C 依托云设备,不依赖手机厂商,从而避免执行时抢占用户屏幕,并降低适配多家不同系统的成本,符合现有系统生态。
在通过不同渠道获取必要权限后,AI 助手才能做到接管人类手机,执行各种跨 App 任务。具体操作方式大致分为两类。目前更为主流的是基于 GUI 的视觉路线,即 AI Agent 通过阅读和理解屏幕内容,模拟点击、滑动等动作来代替用户操作。在这种模式下,智能体并不需要获得第三方 App 的许可,可以绕开各家应用的限制。
而另一种可行的路径则需要 Agent 或手机厂商与 App 方达成协议,通过官方 API 接口来调用应用功能。
据官方介绍,豆包手机助手的操作手机 Pro 模式除调用 GUI Agent 外,还可直接调用手机终端的系统工具。演示视频显示,在操作手机 Pro 模式下,当用户说 " 帮我给女儿推荐几个礼物放进购物车 " 时,若记忆中已存储女儿的年龄、兴趣等信息,助手可直接查询符合女儿年龄、偏好的方案,无需用户逐一交代细节。
一位业内人士对蓝鲸科技表示,如果从用户的数据安全出发,更好的做法是推动各方主体的合作而非竞争。" 但做接口方案的主动权在 App 厂商手上,而不在 Agent 方面。" 他指出," 安全与权限之争只是表层,深层是决策权的争夺。"
如果 AI Agent 成为统一入口,用户不再直接操作各个 App,势必对应用端的用户数据、商业模式构成挑战。
类似的纷争在国外已初现端倪。今年 11 月,亚马逊以侵权为由起诉 AI 搜索创企 Perplexity,试图阻止其通过智能体工具帮助用户在亚马逊上购物。Perplexity 回应称,亚马逊本应欢迎这种便捷购物,因为这意味着更多交易和更满意的客户,但它 " 更关心的是投放广告、显示赞助结果,以及通过附加销售和复杂优惠来影响购买决策 "。
豆包手机助手团队在最新声明中表示," 目前,我们也在积极寻求与各应用厂商的深度沟通,希望推动形成更加清晰、可预期的规则,避免用一刀切的方式否定用户合理使用 AI 的权利。"
华为小艺、小米小爱曾试水调用微信,后放弃执行
回到此次豆包手机助手争议的导火索,是多位用户反馈若涉及操作微信,会出现微信异常退出甚至无法登录的情况。
12 月 3 日,豆包手机助手团队回应称,后续已下线手机助手操作微信的能力,样机上被禁止登录的微信账号正陆续解封,请用户等待一段时间并尝试重新登录。微信方面则表示,并没有特别动作,可能是触发了微信原有的安全风控措施。

图片来源:豆包手机助手用户群截图
《腾讯微信软件许可及服务协议》中明确指出,不得通过非腾讯开发、授权的第三方软件、插件、外挂、系统,登录或使用微信软件及服务,或者进行自动化操作。也不得自行或者授权他人、第三方软件或系统等对微信软件及其组件、模块、数据进行控制、访问、读取或干扰。
搭载豆包手机助手的工程样机 nubia M153,并不是业内首款标榜 " 让 AI 接管手机 " 的产品。而通过 AI 智能体在微信上完成发消息、点赞等操作,也成为众多厂商展示其智能体能力的典型场景。
2024 年 11 月,智谱推出升级后的第一代智能体产品 AutoGLM。在发布活动现场,智谱 CEO 张鹏通过语音指令,让手机里的 AutoGLM 在微信中创建面对面群聊,并发放一百个红包。然而在今年发布 AutoGLM 2.0 时,智谱的官方演示中不再提及微信,却依然支持操作美团、京东、小红书、抖音等数十款高频应用。
此外,手机厂商华为的 AI 助手小艺也曾支持自动打开微信,帮助用户发送消息。但目前,华为小艺、小米小爱等手机厂商自有的 AI 智能体已无法直接调用微信功能。原因可能在于,微信作为国民级应用,对任何自动化操作都保持极高风控敏感度,因此也成为此次豆包手机助手最先触发风险的场景之一。
至于银行、互联网支付等金融场景,豆包手机助手团队称其直接关联用户的资金安全。虽然豆包手机助手在敏感操作时都需要用户授权,但审慎起见,也将暂时下线操作这类 APP 的能力。
在《豆包手机助手隐私安全白皮书》中,包括金融与交易操作、高风险不可逆操作、健康与医疗数据处理等在内的六大类操作被归为高敏操作,需要用户二次确认后才能接入并执行。
另有手机智能体厂商告诉蓝鲸科技,当涉及支付、内容发布等敏感操作时,其 Agent 系统会强制请求用户确认,或由用户直接 " 接管手机 " 完成。此外,厂商还会通过工程策略和权限边界来防止 " 超指令 " 行为,高风险步骤默认不自动执行。
在蓝鲸科技此前的实测过程中,使用豆包手机助手操作多家银行 App 时,中国建设银行 App 会主动弹窗提示,建议用户退出录屏或共享软件 "AI 操作手机 ",以保障个人信息及资金安全。中国农业银行 App 则在豆包手机助手进行转账操作期间,因停留时间过长而触发类似安全提醒。中国交通银行 App 并未作特别警示,直至涉及具体转账动作时,豆包手机助手会转换到手动操作模式。

图片来源:蓝鲸科技实测截图
记者查阅发现,上述几家银行 App 在个人电子银行服务协议中均提及,用户应妥善保管身份认证要素,不得提供给或交于任何第三方使用。交通银行 App 还明确规定,用户通过自动脚本或第三方外挂系统登录和使用电子银行服务,银行有权采取包括但不限于限制电子银行服务交易额度和频次、暂停或终止部分或全部电子银行服务的措施。
在最新声明中,豆包手机助手称会积极与金融类应用相关厂商沟通," 希望共同制定清晰、安全的 AI 操作行为准则 "。
中国社会科学院大学互联网法治研究中心主任刘晓春则表示,AI 智能代理行业尚处初期,技术与规范尚在探索。对这类创新技术,需以包容审慎态度,在精准规范风险的同时为创新留出空间,助力行业良性发展。


登录后才可以发布评论哦
打开小程序可以发布评论哦