直面派 昨天
Siri没做到的事,豆包先做到了
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

" 激活一台手机,第一步竟然是登录豆包。"

这并非想象的场景,而是体验的豆包手机助手时的真实一幕。作为技术预览版的首批体验用户,直面 AI 深度体验了其在启用权限、交互方式以及端侧集成上的初步形态。

豆包,这个中国用户并不陌生的名字,这一次在字节与中兴合作的工作样机 Nubia M153 上,以 " 手机原生 AI 助手 " 的身份登台亮相。

手持这台技术验证机,你可以通过语音、侧边 AI 键或者 Ola Friend 耳机唤醒豆包,在任何界面就当前屏幕内容发问。或者直接让它代替你,在其他 App 里完成比价下单、整理日程、生成纪要等复杂任务。

中兴官方页面显示,这款工程机仅向行业体验者开放预约。在二手市场上,它已出现溢价销售的情况。

打造手机助手,是字节跳动 AI 业务边界的又一次外扩。过去几年,豆包已经在 " 云端 " 证明了自己:据火山引擎方面公开披露,豆包大模型日均 Token 调用量从 2024 年 5 月的 1200 亿涨到 2025 年 9 月的 30 万亿。

此外,豆包在原生 AI App 中长期位居用户规模第一。现在,它跨过 App 的边界正式 " 搬进手机 "。

近年来," 原生 AI 手机助手 " 成为行业内的共同迭代方向,但真正能跑通复杂链路的产品并不多。苹果宣布为 Siri 引入生成式 AI 能力,却接连推迟关键升级节点;其他厂商的 AI 助手受限于权限与模型能力,对于跨 App 交互等复杂场景仍未能普遍落地。

在这样的背景下,字节与中兴的合作的意义不言自明:把豆包 AI 强大的模型能力,从 App 生态中推向真正的手机随身入口。

对手机产业而言,这像是打开了手机原生 AI 的 " 魔盒 ":当第一台设备跑通了整套能力,接下来的比拼,就不再是有没有 AI,而是谁的 AI 真正 " 能用 "。

除了侧键能直接呼出豆包,在这台技术验证机的背面,摄像头模组旁刻着一行小字:Powered By Doubao(由豆包驱动)。一个小彩蛋,道出了这台手机 " 机魂 " 的与众不同。

真 " 原生 ",是上手使用豆包手机助手的第一感觉:激活新机时,在系统设置环节首先要登录用户的豆包账户。随后系统提示,你可以通过手机侧边键一键触发豆包 AI,提醒你这里的 " 豆包 ",相比单独使用豆包 App,有着完全不同的操作逻辑。

这样的原生感,是字节和中兴本次深度合作的结果——在操作系统层面为豆包 App 做了一轮 " 底层改造 "。在这台 Nubia M153 上,豆包 AI 能力落地场景也更贴近日常生活。比如,豆包可以帮你在社交软件等 App 里回复消息,如果你告诉它对方的身份,豆包还能帮助你编辑更合适的对话风格和语气。

要实现这样的能力,一边是大模型对复杂语言与上下文的理解,另一边则是手机厂商在底层生态上向 AI 进一步开发。理解指令后,豆包可以模拟/替代用户完成点击、输入等操作。在国内厂商的原生 AI 助手方案里,这无疑是一种新鲜的尝试。

从用户视角来看,这种交互逻辑也难免会触发一个新问题——让一个第三方大模型 " 代替你点击屏幕 " 这件事,到底安不安全?

为了解释这种 " 原生 AI 助手 " 背后的安全逻辑,豆包在官网发布了《隐私安全白皮书》,明确记忆数据优先本地处理并加密存储,不用于模型训练;所有敏感调用需用户授权并保持可见。唤起记忆时,状态栏有常驻提示,用户可随时关闭或清除记忆功能。

针对网友关心的权限、隐私问题,豆包手机助手 3 日晚发布声明做了进一步的回应。声明中提到,豆包手机助手使用的 INJECT_EVENTS(模拟点击)系统权限为安卓官方能力,所有跨应用执行任务的 AI 助手均需依赖类似权限。

豆包手机助手在使用该权限时,建立了透明的管理体系,调用必须经用户主动授权;执行长任务时有明确提示且随时可以中断;涉及支付、身份验证等敏感环节时任务会暂停,由用户手动确认,豆包手机助手不会代替用户进行相关授权和敏感操作。

从实际体验看," 真原生 " 的差异首先体现在唤醒方式和系统权限上。用户可以通过侧边 AI 键、语音,或者 Ola Friend 耳机直接唤醒豆包,在任何界面直接就屏幕内容追问——不管是聊天界面、商品详情页还是票务页面,都可以一键截屏给 AI 理解,而不是复制链接、截屏上传。

此外,豆包手机助手打通了相册和一部分系统能力,例如在原生相册里对图片下达 " 删掉路人 "" 清理杂物 " 这样的修图指令,可以直接触发豆包的多模态能力。

直面 AI 还测试了订票、打车等多个日常场景:在明确需求后,豆包手机助手可以自行完成所有前置流程,直到支付这样的敏感环节,才会提醒用户需要手动介入。

这种 " 半自动 " 的交互模式带着一点折中意味,但也是大模型在端侧落地、面向普通用户时不得不考虑的安全边界:既要让 AI 真正 " 替你做事 ",但要把最终的所有权留给用户。

不过,站在即将跨入 2026 年的时间节点回看,用户对手机 AI 的期待,正在从 " 能聊天 " 迅速走向 " 能办事 "。QuestMobile 的报告显示,自 2024 年 9 月以来,六大手机厂商的 AI 助手在过去一年合计新增用户约 6500 万,总规模达到 5.29 亿。

目前,NubiaM153 上的豆包手机助手只是一个技术预览版,主要面向行业用户开放,并未正式进入大众消费市场。但从这台工程机上,已经可以窥探到手机 " 真原生 AI" 路径的样貌。

在体验过程中,一个最直观的感受是:相比独立 App 里的豆包,Nubia M153 上的豆包已经不再是一个 " 会回答问题 " 的 AI,而是一个可以跨界到物理世界、真正替用户完成动作的 " 执行者 "。在理解用户指令的基础上,它在手机上一层一层地接管了,那些过去属于人类手指的繁琐操作。

以跨 App 多轮任务链路为例,针对相册中的某张血压仪照片,让豆包在淘宝中 " 挑便宜同款 ",然后 " 把这件链接发给张三 ",豆包不仅能维持上下文记忆,识别出 " 张三 " 是 QQ 中的好友昵称,还能跟随链路推进完成全部步骤。从相册到淘宝,再到 QQ 好友 " 张三 " 的对话框,这一流程全程由豆包自行跑通,无需用户中途干预。

与之相比,我们用同样路径测试另一家旗舰手机的 AI 助手,它停在了 " 打开淘宝—完成搜索 " 的环节,只能等待用户的进一步操作。

这种差距在屏幕理解场景中被进一步放大。在实际测试里,豆包可以在任何界面通过 " 就屏提问 ",自动截取当前页面、分析内容并执行命令——从总结一篇 6000 字的长文,到提取要点、排序逻辑,再到将某一段落总结发送给飞书群同事。尽管这个过程需要在后台等待一段时间,但它已经做到了真正意义上的 " 脱手可用 "。

当用户真正把豆包当作 " 代办者 " 时,它不仅能在助手层面完成流程交互,还能把 AI 的多模态能力渗透进日常操作。比如,豆包可以在相册中对指定图片直接进行 "AI P 图 ",这一过程以往需要手动打开对应 App。而原生豆包 AI 可以直接调用 Seedream 能力,完成 " 把这张雪碧图片 P 成可乐 " 的操作。

在社交场景里,这种 " 可介入性 " 表现得更明显。例如,你想给某位飞书好友发送信息 " 明天我想请个假 ",当你告知豆包对方身份是 " 老板 " 时,豆包能识别这一语境中隐藏的意图,提示你措辞可以更礼貌、更正式一点,并提供调整后的版本。这种 " 介入对话 " 的能力,把助手的角色从 " 工具 " 变得更像 " 副驾驶 ",能够在用户需求表达尚不完整时,及时响应并自动推断下一步动作。

陌生来电识别也是类似的逻辑。询问豆包 " 刚才给我打电话的是谁 ",豆包可以结合归属地、历史举报记录及模型推断给出风险提示,告诉用户是否存在诈骗可能。

在多语言表达方面,豆包手机助手可以承担翻译、对话转写、跨语言(包括方言)任务等工作。实机测试中,和豆包 App 此前展现出的能力类似,当用户突然使用广东话给出指令时,豆包手机助手可以平滑切换到对应方言场景,把一个普通话 " 知心姐姐 ",变成会讲粤语的 " 靓女 "。

正因如此,豆包手机助手填补了当下行业最稀缺的一块能力空白:全局跨应用任务执行。苹果 Siri 仍在修修补补,未能实现产品迭代;大多数手机 AI 助手要么擅长回答,要么擅长展示,却无法替用户完成一整条链路。

豆包手机助手的出现,让这条路径第一次有了清晰的样子:用户说一句话,从理解、决策到执行,原本需要用户手动在 App 间来回切换完成的机械劳动,如今开始一点点交给豆包来跑。

而要撑起一场手机 AI 的 " 新世代 ",不仅需要系统足够开放,也需要基座模型的强大能力赋能,技术的底座和生态的兼容,二者缺一不可。

在豆包上手机之前,字节已经用了三年时间不断打磨这个 "AI 小助手 ",让它从一个 LLM 产品,进化成一个原生 AI 超级 App。

QuestMobile、IDC 等机构的数据显示:豆包是中国 C 端用户规模最大的原生 AI 应用,2024 年中月活突破 1.5 亿。2025 年初,DeepSeek 的横空出世曾短暂刷新流量峰值,但从今年 8 月开始,豆包重新完成反超,依靠强大的生态优势稳居榜首。

不过,对于大众用户来说," 好用的 AI 应用 " 和 " 真正的手机助手 " 之间始终隔着一道物理层面的鸿沟。

再强的模型能力,如果被限制在 App 框架内,就无法接管用户的真实数字生活。你可以在豆包 App 里写文案、改图片、做视频,但只要涉及外卖、改地址、查物流、订火车票,这些操作都必须跳回到对应的 App 中完成,AI 在其中所能扮演的角色依然有限。

与此同时,2025 年,各大手机厂商纷纷将端侧 AI 推上战略高度。华为小艺推出 " 全局语音调度 ",支持部分跨应用任务链;小米澎湃 OS 宣布开放系统级 AI 接口,可在多个场景中调用大模型执行代理任务;Vivo、OPPO、荣耀也分别展示了原生 AI 智能体路径。

一个不容忽视的趋势是:所有厂商都意识到,只有把模型能力前置,让用户在任何界面、任何动作链路中随时调用 AI,手机助手这件事才算真正开始。这一年,AI 在手机上的竞争,比的不再是 " 谁的模型更大 ",而是 " 谁能真正跑在用户需求的最前端 "。

在 NubiaM153 上,豆包手机助手的姿态显得十分 " 前卫 "。在原生 AI 助手的加持下,手机里的各个 App 被重新组织成一个由 AI 统筹的 " 任务空间 "。

在这个空间里,用户只负责提目标,豆包负责 " 跑腿 "。过去需要手动跳转多个 App 才能完成的链路,如今只需要用户给出一句指令;如果再配上已经适配的 AI 可穿戴硬件,比如 OlaFriend,很多场景甚至不需要掏出手机——耳机里那声 " 豆包豆包 ",另一边的手机后台已经开始忙碌起来。

这种 AI 时代的 " 脱手感 ",正在改写用户与手机的关系:从 App 时代的 " 我有需求时点开你 ",到 AI 助手时代的 " 你随时站在我旁边 "。对豆包而言,这是一次从云端走向端侧的关键跃迁;对手机而言,则是一次从 " 应用集合 " 走向 "AI 中枢 " 的角色变化。

根据 Counterpoint 的预测,到 2028 年,Gen-AI 智能手机的出货量将占全球智能手机销量的 54% 以上,届时相关设备存量可能超过 10 亿部,成为市场的主流配置。

与此同时,QuestMobile 的数据表明,截至 2025 年 9 月,移动端 AI 应用(包括原生 App、In-AppAI、手机厂商 AI 助手在内)的月活用户总规模已达 7.29 亿,仅手机厂商 / 系统级 AI 助手这一类,就覆盖约 5.35 亿用户,表明越来越多用户开始将 AI 助手视为 " 手机的基本功能 "。

硬件侧也在同步加码。Counterpoint 此前发布的产业白皮书显示,面向生成式 AI 的手机 SoC 正在加速演进,旗舰平台的峰值 AI 算力在 2025 年将普遍跨过 60TOPS 这一性能台阶。

公开信息显示,Nubia M153 工程机所采用的高通骁龙 8 至尊版平台,NPU 峰值 AI 算力已达到约 80TOPS。算力与能效的双向抬升,为 " 原生 AI 助手 " 释放更复杂的能力提供了充分硬件冗余。

把视角再拉远一点,会看到一条更长的时间线:2011 年,Siri 作为 " 第一代手机语音助手 ",曾经给整个行业演示过 " 对着手机说话 " 的想象。但十多年后,苹果内部对 GenAI 路线的不一致,导致 Siri 重构历程充满了混乱与不稳定,即使披上 AppleIntelligence 的外衣,在短期内仍难支撑起 " 跨应用、多模态、代办任务 " 的理想。

苹果软件工程高级副总裁费德里奇此前公开承认,Siri 重构的 V2 架构只在大约三分之二的场景下能正确执行,新的 Siri 版本从 2024 年底一路推迟到 2026 年才有望正式上线。

从这个意义上说,豆包手机助手在 Nubia M153 上完成的,不只是一次产品形态的探索,而是试图接力那条被 Siri 开启、却没有跑完的赛道。

尽管还在技术验证阶段,但一个构想已经悄然成型:豆包用一次原生 AI 入口的试验,正在一点点实现那件 Siri 没做成的事。

欢迎在评论区留言 ~

如需开白请加小编微信:dongfangmark

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 中兴 字节跳动 界面
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论