Siri没做到的事，豆包先做到了

" 激活一台手机，第一步竟然是登录豆包。"

这并非想象的场景，而是体验的豆包手机助手时的真实一幕。作为技术预览版的首批体验用户，直面 AI 深度体验了其在启用权限、交互方式以及端侧集成上的初步形态。

豆包，这个中国用户并不陌生的名字，这一次在字节与中兴合作的工作样机 Nubia M153 上，以 " 手机原生 AI 助手 " 的身份登台亮相。

手持这台技术验证机，你可以通过语音、侧边 AI 键或者 Ola Friend 耳机唤醒豆包，在任何界面就当前屏幕内容发问。或者直接让它代替你，在其他 App 里完成比价下单、整理日程、生成纪要等复杂任务。

中兴官方页面显示，这款工程机仅向行业体验者开放预约。在二手市场上，它已出现溢价销售的情况。

打造手机助手，是字节跳动 AI 业务边界的又一次外扩。过去几年，豆包已经在 " 云端 " 证明了自己：据火山引擎方面公开披露，豆包大模型日均 Token 调用量从 2024 年 5 月的 1200 亿涨到 2025 年 9 月的 30 万亿。

此外，豆包在原生 AI App 中长期位居用户规模第一。现在，它跨过 App 的边界正式 " 搬进手机 "。

近年来，" 原生 AI 手机助手 " 成为行业内的共同迭代方向，但真正能跑通复杂链路的产品并不多。苹果宣布为 Siri 引入生成式 AI 能力，却接连推迟关键升级节点；其他厂商的 AI 助手受限于权限与模型能力，对于跨 App 交互等复杂场景仍未能普遍落地。

在这样的背景下，字节与中兴的合作的意义不言自明：把豆包 AI 强大的模型能力，从 App 生态中推向真正的手机随身入口。

对手机产业而言，这像是打开了手机原生 AI 的 " 魔盒 "：当第一台设备跑通了整套能力，接下来的比拼，就不再是有没有 AI，而是谁的 AI 真正 " 能用 "。

除了侧键能直接呼出豆包，在这台技术验证机的背面，摄像头模组旁刻着一行小字：Powered By Doubao（由豆包驱动）。一个小彩蛋，道出了这台手机 " 机魂 " 的与众不同。

真 " 原生 "，是上手使用豆包手机助手的第一感觉：激活新机时，在系统设置环节首先要登录用户的豆包账户。随后系统提示，你可以通过手机侧边键一键触发豆包 AI，提醒你这里的 " 豆包 "，相比单独使用豆包 App，有着完全不同的操作逻辑。

这样的原生感，是字节和中兴本次深度合作的结果——在操作系统层面为豆包 App 做了一轮 " 底层改造 "。在这台 Nubia M153 上，豆包 AI 能力落地场景也更贴近日常生活。比如，豆包可以帮你在社交软件等 App 里回复消息，如果你告诉它对方的身份，豆包还能帮助你编辑更合适的对话风格和语气。

要实现这样的能力，一边是大模型对复杂语言与上下文的理解，另一边则是手机厂商在底层生态上向 AI 进一步开发。理解指令后，豆包可以模拟／替代用户完成点击、输入等操作。在国内厂商的原生 AI 助手方案里，这无疑是一种新鲜的尝试。

从用户视角来看，这种交互逻辑也难免会触发一个新问题——让一个第三方大模型 " 代替你点击屏幕 " 这件事，到底安不安全？

为了解释这种 " 原生 AI 助手 " 背后的安全逻辑，豆包在官网发布了《隐私安全白皮书》，明确记忆数据优先本地处理并加密存储，不用于模型训练；所有敏感调用需用户授权并保持可见。唤起记忆时，状态栏有常驻提示，用户可随时关闭或清除记忆功能。

针对网友关心的权限、隐私问题，豆包手机助手 3 日晚发布声明做了进一步的回应。声明中提到，豆包手机助手使用的 INJECT_EVENTS（模拟点击）系统权限为安卓官方能力，所有跨应用执行任务的 AI 助手均需依赖类似权限。

豆包手机助手在使用该权限时，建立了透明的管理体系，调用必须经用户主动授权；执行长任务时有明确提示且随时可以中断；涉及支付、身份验证等敏感环节时任务会暂停，由用户手动确认，豆包手机助手不会代替用户进行相关授权和敏感操作。

从实际体验看，" 真原生 " 的差异首先体现在唤醒方式和系统权限上。用户可以通过侧边 AI 键、语音，或者 Ola Friend 耳机直接唤醒豆包，在任何界面直接就屏幕内容追问——不管是聊天界面、商品详情页还是票务页面，都可以一键截屏给 AI 理解，而不是复制链接、截屏上传。

此外，豆包手机助手打通了相册和一部分系统能力，例如在原生相册里对图片下达 " 删掉路人 "" 清理杂物 " 这样的修图指令，可以直接触发豆包的多模态能力。

直面 AI 还测试了订票、打车等多个日常场景：在明确需求后，豆包手机助手可以自行完成所有前置流程，直到支付这样的敏感环节，才会提醒用户需要手动介入。

这种 " 半自动 " 的交互模式带着一点折中意味，但也是大模型在端侧落地、面向普通用户时不得不考虑的安全边界：既要让 AI 真正 " 替你做事 "，但要把最终的所有权留给用户。

不过，站在即将跨入 2026 年的时间节点回看，用户对手机 AI 的期待，正在从 " 能聊天 " 迅速走向 " 能办事 "。QuestMobile 的报告显示，自 2024 年 9 月以来，六大手机厂商的 AI 助手在过去一年合计新增用户约 6500 万，总规模达到 5.29 亿。

目前，NubiaM153 上的豆包手机助手只是一个技术预览版，主要面向行业用户开放，并未正式进入大众消费市场。但从这台工程机上，已经可以窥探到手机 " 真原生 AI" 路径的样貌。

在体验过程中，一个最直观的感受是：相比独立 App 里的豆包，Nubia M153 上的豆包已经不再是一个 " 会回答问题 " 的 AI，而是一个可以跨界到物理世界、真正替用户完成动作的 " 执行者 "。在理解用户指令的基础上，它在手机上一层一层地接管了，那些过去属于人类手指的繁琐操作。

以跨 App 多轮任务链路为例，针对相册中的某张血压仪照片，让豆包在淘宝中 " 挑便宜同款 "，然后 " 把这件链接发给张三 "，豆包不仅能维持上下文记忆，识别出 " 张三 " 是 QQ 中的好友昵称，还能跟随链路推进完成全部步骤。从相册到淘宝，再到 QQ 好友 " 张三 " 的对话框，这一流程全程由豆包自行跑通，无需用户中途干预。

与之相比，我们用同样路径测试另一家旗舰手机的 AI 助手，它停在了 " 打开淘宝—完成搜索 " 的环节，只能等待用户的进一步操作。

这种差距在屏幕理解场景中被进一步放大。在实际测试里，豆包可以在任何界面通过 " 就屏提问 "，自动截取当前页面、分析内容并执行命令——从总结一篇 6000 字的长文，到提取要点、排序逻辑，再到将某一段落总结发送给飞书群同事。尽管这个过程需要在后台等待一段时间，但它已经做到了真正意义上的 " 脱手可用 "。

当用户真正把豆包当作 " 代办者 " 时，它不仅能在助手层面完成流程交互，还能把 AI 的多模态能力渗透进日常操作。比如，豆包可以在相册中对指定图片直接进行 "AI P 图 "，这一过程以往需要手动打开对应 App。而原生豆包 AI 可以直接调用 Seedream 能力，完成 " 把这张雪碧图片 P 成可乐 " 的操作。

在社交场景里，这种 " 可介入性 " 表现得更明显。例如，你想给某位飞书好友发送信息 " 明天我想请个假 "，当你告知豆包对方身份是 " 老板 " 时，豆包能识别这一语境中隐藏的意图，提示你措辞可以更礼貌、更正式一点，并提供调整后的版本。这种 " 介入对话 " 的能力，把助手的角色从 " 工具 " 变得更像 " 副驾驶 "，能够在用户需求表达尚不完整时，及时响应并自动推断下一步动作。

陌生来电识别也是类似的逻辑。询问豆包 " 刚才给我打电话的是谁 "，豆包可以结合归属地、历史举报记录及模型推断给出风险提示，告诉用户是否存在诈骗可能。

在多语言表达方面，豆包手机助手可以承担翻译、对话转写、跨语言（包括方言）任务等工作。实机测试中，和豆包 App 此前展现出的能力类似，当用户突然使用广东话给出指令时，豆包手机助手可以平滑切换到对应方言场景，把一个普通话 " 知心姐姐 "，变成会讲粤语的 " 靓女 "。

正因如此，豆包手机助手填补了当下行业最稀缺的一块能力空白：全局跨应用任务执行。苹果 Siri 仍在修修补补，未能实现产品迭代；大多数手机 AI 助手要么擅长回答，要么擅长展示，却无法替用户完成一整条链路。

豆包手机助手的出现，让这条路径第一次有了清晰的样子：用户说一句话，从理解、决策到执行，原本需要用户手动在 App 间来回切换完成的机械劳动，如今开始一点点交给豆包来跑。

而要撑起一场手机 AI 的 " 新世代 "，不仅需要系统足够开放，也需要基座模型的强大能力赋能，技术的底座和生态的兼容，二者缺一不可。

在豆包上手机之前，字节已经用了三年时间不断打磨这个 "AI 小助手 "，让它从一个 LLM 产品，进化成一个原生 AI 超级 App。

QuestMobile、IDC 等机构的数据显示：豆包是中国 C 端用户规模最大的原生 AI 应用，2024 年中月活突破 1.5 亿。2025 年初，DeepSeek 的横空出世曾短暂刷新流量峰值，但从今年 8 月开始，豆包重新完成反超，依靠强大的生态优势稳居榜首。

不过，对于大众用户来说，" 好用的 AI 应用 " 和 " 真正的手机助手 " 之间始终隔着一道物理层面的鸿沟。

再强的模型能力，如果被限制在 App 框架内，就无法接管用户的真实数字生活。你可以在豆包 App 里写文案、改图片、做视频，但只要涉及外卖、改地址、查物流、订火车票，这些操作都必须跳回到对应的 App 中完成，AI 在其中所能扮演的角色依然有限。

与此同时，2025 年，各大手机厂商纷纷将端侧 AI 推上战略高度。华为小艺推出 " 全局语音调度 "，支持部分跨应用任务链；小米澎湃 OS 宣布开放系统级 AI 接口，可在多个场景中调用大模型执行代理任务；Vivo、OPPO、荣耀也分别展示了原生 AI 智能体路径。

一个不容忽视的趋势是：所有厂商都意识到，只有把模型能力前置，让用户在任何界面、任何动作链路中随时调用 AI，手机助手这件事才算真正开始。这一年，AI 在手机上的竞争，比的不再是 " 谁的模型更大 "，而是 " 谁能真正跑在用户需求的最前端 "。

在 NubiaM153 上，豆包手机助手的姿态显得十分 " 前卫 "。在原生 AI 助手的加持下，手机里的各个 App 被重新组织成一个由 AI 统筹的 " 任务空间 "。

在这个空间里，用户只负责提目标，豆包负责 " 跑腿 "。过去需要手动跳转多个 App 才能完成的链路，如今只需要用户给出一句指令；如果再配上已经适配的 AI 可穿戴硬件，比如 OlaFriend，很多场景甚至不需要掏出手机——耳机里那声 " 豆包豆包 "，另一边的手机后台已经开始忙碌起来。

这种 AI 时代的 " 脱手感 "，正在改写用户与手机的关系：从 App 时代的 " 我有需求时点开你 "，到 AI 助手时代的 " 你随时站在我旁边 "。对豆包而言，这是一次从云端走向端侧的关键跃迁；对手机而言，则是一次从 " 应用集合 " 走向 "AI 中枢 " 的角色变化。

根据 Counterpoint 的预测，到 2028 年，Gen-AI 智能手机的出货量将占全球智能手机销量的 54% 以上，届时相关设备存量可能超过 10 亿部，成为市场的主流配置。

与此同时，QuestMobile 的数据表明，截至 2025 年 9 月，移动端 AI 应用（包括原生 App、In-AppAI、手机厂商 AI 助手在内）的月活用户总规模已达 7.29 亿，仅手机厂商 / 系统级 AI 助手这一类，就覆盖约 5.35 亿用户，表明越来越多用户开始将 AI 助手视为 " 手机的基本功能 "。

硬件侧也在同步加码。Counterpoint 此前发布的产业白皮书显示，面向生成式 AI 的手机 SoC 正在加速演进，旗舰平台的峰值 AI 算力在 2025 年将普遍跨过 60TOPS 这一性能台阶。

公开信息显示，Nubia M153 工程机所采用的高通骁龙 8 至尊版平台，NPU 峰值 AI 算力已达到约 80TOPS。算力与能效的双向抬升，为 " 原生 AI 助手 " 释放更复杂的能力提供了充分硬件冗余。

把视角再拉远一点，会看到一条更长的时间线：2011 年，Siri 作为 " 第一代手机语音助手 "，曾经给整个行业演示过 " 对着手机说话 " 的想象。但十多年后，苹果内部对 GenAI 路线的不一致，导致 Siri 重构历程充满了混乱与不稳定，即使披上 AppleIntelligence 的外衣，在短期内仍难支撑起 " 跨应用、多模态、代办任务 " 的理想。

苹果软件工程高级副总裁费德里奇此前公开承认，Siri 重构的 V2 架构只在大约三分之二的场景下能正确执行，新的 Siri 版本从 2024 年底一路推迟到 2026 年才有望正式上线。

从这个意义上说，豆包手机助手在 Nubia M153 上完成的，不只是一次产品形态的探索，而是试图接力那条被 Siri 开启、却没有跑完的赛道。

尽管还在技术验证阶段，但一个构想已经悄然成型：豆包用一次原生 AI 入口的试验，正在一点点实现那件 Siri 没做成的事。

欢迎在评论区留言 ~

如需开白请加小编微信：dongfangmark

宙世代

一起剪

相关标签