虎嗅 2小时前
一场豆包秀肌肉引发的互联网大乱斗
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

今天,我们可能已经站在了中国互联网历史上最大规模 " 武装械斗 " 的前夜。无论是它讨论的问题,牵扯的利益,参战的规模,涉及的范式竞争,对未来商业世界的格局塑造,都远超曾经的 "3Q 大战 "。

12 月 1 日,豆包手机助手发布,也碰巧是 GPT 诞生的三周年纪念日。

据硅星人不完全统计,在它发布的 48 个小时内,疑似对豆包手机助手采取 " 技术对抗 " 措施的公司已经可以列出一个长长的名单:

微信:如果检测到使用 AI 会强制下线,甚至面临账号被暂时冻结的情况。

淘宝:可能频繁跳人机验证提示,或者闪退或强制账号登出。

支付宝、高德、京东、拼多多、快手等:可能出现登录页面卡死 + 触发强制账号登出。

王者荣耀:可能触发禁止排位赛惩罚 + 掉星。

以建行、招行为代表的银行类 APP:公告提示在录屏等状态下无法使用 APP,点击确认后强制退出。

目前,微信相关人士对媒体的公开回复是," 没有什么特别的动作,可能是中了本来就有的安全风控措施 "。

从公开资料来看,无论是在豆包开发,还是在媒体内测的过程中,上述软件的所有功能执行都是没有任何问题的。因此,大概率是以上安全团队临时加入的技术对抗策略,来防止豆包 AI 助手继续使用自己的功能。而根据豆包团队的官方公告显示,他们团队已经紧急停止了对微信所有相关功能的调用支持。值得一提的是,抖音似乎此前也出现了类似的强制退出情况,而豆包手机助手在昨天也禁止了部分 AI 违反抖音政策的指令。

这些大厂软件批量强制闪退和账号登出,至少有三个原因:

第一,豆包手机助手的权限实在是太高了。

与其说豆包手机 " 助手 ",不如说它是一个比 OS 更像 OS 的 AI Agent,属于一个庞大的字节系统工程的重要组成部分。

该款手机搭载的系统并不是努比亚传统的星云 OS 或者 MyOS,而是一个独立推出的 Obrit UI。在第二天,便有博主在该系统的代码中发现了 Smartisan 的代码痕迹。后者是字节此前从罗永浩手中收购的系统资产。

而作为自家系统的 AI 手机助手,其获取的权限也是顶配。

在豆包手机助手的官方回复中,其承认了该团队获得了 injection-event 的权限。injection-event 是手机系统中的顶级敏感权限,这让豆包可以在手机系统中模拟全局的输入、点击等操作。有媒体报道称,此前荣耀等其他手机助手也具备类似的权限。但不知道为何,这个消息是从开发者侧流出来的,《豆包手机助手隐私安全白皮书》完全没有专门提及该权限的调用介绍。

从技术角度上来说,与过去的 API 合作不同,APP 软件开发者没有主动关闭或者调整权限的权力。因此在超高权限的加持下,APP 开发者没有任何博弈的余地,处于极度被动的技术局面,因此 " 技术对抗 " 路径也只能变成非常极端的 " 停用 "。

第二,从更本质的角度而言,豆包手机助手确实有可能彻底颠覆以上厂商的生意模式。

一旦语音交互变成入口,过去赖以为生的所有 APP 逻辑都会不复存在。

大部分的实际用户不大可能对手机指定渠道名字,比如 " 你帮我用‘淘宝’买一部豆包手机 ",而是只会提出 " 买一部豆包手机 ";他们不会说 " 帮我用高德导航去公司 "," 用滴滴打车去学校 ",而是只会说 " 帮我打车去学校 "。那么系统的默认入口就变得很重要。

这有点像苹果和谷歌的关系,谷歌每年要为苹果支付 200 亿美元,仅仅只是为了获得在 Safari 浏览器中的默认入口。

三大外卖巨头,在过去一年时间里,为了一个外卖入口烧掉了近千亿人民币。结果一觉醒来,发现最后终局可能都是给豆包打白工,自己变成一个底层工具服务商。这自然是不可接受的。

第三,目前的豆包手机助手确实 " 摧毁 " 了各大厂商的隐私和安全政策格局。

超高的权限 + 很好的泛化能力 + 较少的敏感场景控制,三者产生的化学反应,便是让普通用户可以拥有过去要靠专门编写脚本,才能实现的 " 作弊能力 "。

我们在用户群和社交媒体上中,总结了目前豆包手机助手出现的一些问题,而这些行为在过去几乎不大可能出现。

必须强调的是:由于豆包助手一直在迭代和完善它的安全功能,以及大模型能力本来也可能导致一些场景无法复用或者出现幻觉导致规则越狱的情况,以下的案例不能代表当下和未来的豆包手机助手的安全情况,也不代表豆包产品的安全政策。

微信由于技术对抗下场较早,很多风险场景找不到对应的视频 Demo。

但据硅星人了解,豆包手机助手此前至少可以实现一些微信官方至今没有上线的功能,比如 " 定时发送微信 "、"AI 代回微信 "、" 操作微信小程序执行任务 " 等功能,整体的方式跟此前打击的 " 外挂助手 " 类似。区别在于,外挂助手的执行频次高且精准,而豆包手机助手整体的节奏还是偏慢的,有时候甚至还不如人直接点击来得快。

此外,豆包手机助手可以在微信内部深度读取数据。

比如在《爱范儿》的测评中,测评老师成功让豆包手机助手去微信的收藏夹里,找到自己的护照照片,然后提取出文字,再发送到微信自己的文件传输对话框里。

一、起义,还是暴动?

豆包手机助手的一套组合拳,给我留下的最深刻的印象就是一个字:莽。

从目前大面积的 APP 风控反弹,双方围绕机器人定义展开的技术攻防战来看,豆包团队很有可能从一开始就没有跟 APP 生态中的伙伴做有效沟通。一些高度敏感,对安全政策是常年高压线的场景,如银行、微信、支付宝等,在出厂时没有做任何防护措施。

从始至终,豆包在安全和隐私方面给出的唯一的系统性的公众沟通,几乎只有那个仅 12 页的《豆包手机助手隐私安全白皮书》。但这个白皮书只是豆包单方面的技术呈现和安全承诺,没有任何第三方机构参与,没有监管背书,更没有对技术落地的监督。你很难想象,银行的风控团队会看完那 12 页纸就大彻大悟,为豆包接下来的屏幕读取 + 模拟点击开路。

或许先干再迭代,本身也是字节长期以来行事风格;再者,或许强势本身也是豆包团队的策略之一,把局面顶到极致,再向后退步谈判,可能可以获得更好的位置。

但如果我们不把目光放那么长远,毕竟今天豆包手机助手还远未到 " 取代 " 一切 OS 的成熟程度。如果只局限于当下的产品影响的话,会发现首先最有可能被改变的将是过去一系列增加用户黏性的促活套路。

第一,签到机制将失效了。

豆包手机助手可以设置多个功能,在指定时间去帮用户签到领取奖励,无需人主动介入。

与之对应的,小游戏促活也可能被 AI 助手取代。毕竟这类游戏简单、易懂,也无需太高的及时性响应要求。

第二,用户时长奖励也将失效。

比如,我们看到豆包可以实现在后台刷抖音极速版来赚钱;很多用户让手机挂着斗地主,也是为了赚取活跃时长发放的奖励。

第三,开屏广告和弹窗可能也会面临挑战。

在视频演示中,豆包团队对弹窗广告采用手动点击的方式进行。在实测中,确实有一些弹窗可能被拦截。但并不意味着豆包没有类似的能力。如果政策允许,弹窗广告可能是最容易被消灭的变现方式。

以上案例中,除了 " 游戏挂机 " 可以被视作是不道德的外,其他三项更多是生态变现方式的变化。

如果以促进日活的角度来评判技术创新," 签到 " 可能是本世纪最伟大的发明。但从用户角度来说,这是没有任何用户体验增量的 " 陋习 ";时长奖励也是如此,他们的共同目标,就是让用户消费他们本来不再需要的内容,在特定 APP 中投入更多他们本来可以花在其他地方的时间。

而当手机平均使用时间已经超过 5 个半小时且还在不断增长的时候,类似运营策略的最后结果就是不断靠近软件生态的无效内卷。

二、超级 AGI 助手应该是什么样的?

如果必须将这场巨大的冲突做一个总结,那只能说:

豆包希望将 LUI(自然语言人机交互)的能力,强行塞入到一个已经极度成熟的 GUI(图形人机交互)生态里,所以必然会带来大量动作的扭曲和斗争的张力。

当我们期待一个 AGI 的设备时,没有人认为它应该是一个像今天这样的超级智能助手,缓慢谨慎地一个个点击屏幕上的按钮。

对于用户来说,我们可能省了一点时间、薅了一点羊毛,但付出的代价是巨大的隐私和数据安全潜在风险;对于开发者来说,加入一个手机助手,在交互上也同样受制于屏幕点击,也无法释放软件生态在 AGI 生态中的潜力。

我们期待的是一个语言交互入口能够解决足够多的东西,能够抛弃掉冗杂累赘的 GUI 交互逻辑,从而获得一种新生。

这意味着,我们需要的是 LUI 原生的应用,而不是强行改造的 GUI 的软件。

正如我们开头所说,豆包手机助手本质是一个比 OS 更像 OS 的 agent。而我们的每一个 OS 都应该有单独适配他们的原生应用,这其实原本是我们今天对 OS 这件事情的常识,但却在豆包这件事情上遗忘了。

或许有一天 LUI 体系和 GUI 体系上都有自己的 AI 助手,两个体系可以是互通的,各自都有各自的功能。

否则像现在这样打来打去,最终受到损失的不止是花了 3499 元买机子的用户,我们所有人都会与一个更好用的智能时代渐行渐远。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 微信 王者荣耀 互联网 抖音
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论