不做玩具！讯飞AI眼镜要做你眼前的超级助理

AI 眼镜依然是 2026 年科技圈最拥挤的赛道之一。硬件巨头、AI 大厂、创业公司、传统眼镜品牌、光学供应链都加入了「百镜大战」，OpenAI 和苹果的产品在路上，在刚刚结束的 I/O 大会上，智能眼镜缔造者 Google「返场」推出 AI 眼镜新品给市场再添热度。雷科技在报道澳门 BeyondExpo 科技创新博览会时发现 AI 眼镜仍四处可见，甚至出现了专攻老年群体的 " 银龄 AI 眼镜 "。

AI 眼镜爆发了，但用户爱买不爱用

市场前景很美好：Omdia 数据显示，2025 年全球 AI 眼镜出货量同比增长 322%，达 870 万台。洛图科技预测 2026 年中国 AI 眼镜市场整体销量将突破 320 万支，年增率高达 120%。2026 年 AI 眼镜首次被纳入 " 国补 " 范畴，将进一步刺激销量。

百花齐放却挡不住一个灵魂拷问：眼镜卖出去了，用户戴了吗？答案并不乐观。XR Vision 监测发现，主流电商平台 AI 眼镜平均退货率高达 30%，许多产品在用户体验尝鲜后被长期冷落在抽屉。

在电商和社媒上，用户的抱怨主要集中在：戴久了不舒服、能用的功能不多、为什么不用手机？说到底，AI 眼镜并没有实现从 " 能用 " 到 " 好用 " 的跨越，距离成为跟手机一样普及的终端还远。

行业其实够努力了：卷重量，卷显示，卷价格，卷颜值 …… 但一直未能回答好一个根本问题：用户戴着它到底能干什么？如果不是近视 / 远视，用户为什么要戴一副眼镜？讯飞刚刚发布的首款 AI 眼镜给出了新的解法：让 AI 眼镜进入用户的工作流，成为 " 眼前的超级 AI 助理 "。

首款原生 Agent 眼镜，嵌入真实工作流

讯飞 AI 眼镜外形与市面上的产品别无二致，但减重取得了突破：只有 40g，较同类产品轻约 20%。为什么强调同类呢？市面上的 AI 眼镜有许多类，有的只有拍摄，有的只有音频，AI 功能没有或者孱弱。形态最成熟的则是带显示的 AI 眼镜，讯飞 AI 眼镜带双目单色显示，搭载摄像头、多麦克风，还拥有 GlassClaw（Agent）能力。在这类产品中，讯飞 AI 眼镜是最轻的。

" 轻 " 是 AI 眼镜普及的前提。手机功能足够强大，用户还需要 AI 眼镜是因为它拥有第一视角，无感、自然、随时随地能用，但这一切的前提都是佩戴舒适。市面上许多产品笨重、压耳压鼻梁，厂商赠送鼻托能稍微改善，但用户依然 " 戴不住 "。讯飞 AI 眼镜在材质和结构上做了极致的工程优化：航空级镁合金框架、一体成型工艺、全贴合树脂波导镜片，40g 重量确保用户 " 戴得住 "。同时它在设计上有所取舍，放弃炫酷 AR 效果，做好双目单色显示，这与其功能定位有关。

（图源：Beyond EXPO）

许多 AI 眼镜逻辑将手机 App" 移植 " 过去，地图导航、视觉搜索等富媒体信息对显示有高要求。讯飞 AI 眼镜聚焦在交流、演讲、办公等生产力场景，只需展示关键文字信息。

比如用户使用讯飞 AI 眼镜的杀手锏功能——语音实时翻译时，只需看翻译字幕就可以了，扬声器会同步播放译文，全程无需手机或第三方设备，眼镜自主完成语音采集、识别、翻译与投射，支持同声传译、面对面翻译、线上同传与通话翻译四大模式。相较翻译设备，如翻译笔、翻译耳机，AI 眼镜不打断交流，可让翻译更贴近真实交流本身。

做好翻译最大的难题不是算法，而是降噪。跨语言交流许多时候 " 人多嘴杂 "，比如展会、聚会、户外，AI 很容易被干扰。讯飞 AI 眼镜用 5 颗气导麦克风加 1 颗骨传导麦克风，同时引入唇动识别多模态降噪，前置摄像头能在复杂环境里，辅助 AI 判断要采集哪些声音，" 该听谁的 "。当然这背后有很复杂的逻辑，比如要结合口型信息、声源方位、音量大小甚至声纹识别，不是单一的算法优化，而是软硬件协同的底层能力。

（图源：雷科技）

翻译功能足够强，但讯飞 AI 眼镜又不是一款翻译眼镜，它的定位是超级办公助理，内置 Agent GlassClaw（雷科技将其翻译成 " 眼镜虾 "），底层接入星火大模型，支持多模态理解、任务拆解和跨服务调用。

（图源：雷科技）

在发布会现场，演讲者戴着讯飞 AI 眼镜全程看提词，眼镜内的字幕配合说话语速同步滚动，充电胶囊同时也是提词遥控器。演讲结束后，GlassClaw 记得演讲者分享的所有内容并可进行智能总结。然后演讲者让 GlassClaw 结合讯飞和 BeyondExpo 主办方的合作，思考未来的合作方案，给出合作提案并发邮件给主办方、抄送同事，结果它真做到了，全程无手机、电脑辅助，从信息输入到任务执行都在眼镜端闭环。

GlassClaw 是讯飞 AI 眼镜的灵魂，这让它跟 " 能跑 App" 的 AI 眼镜成了不同物种。市面上很多 AI 眼镜将微信、地图、淘宝投到镜片上，要求用户用滑动、点击、眼动去操作，本质是将手机屏移到眼前，体验很差，也没必要。如果只是迁移手机的内容，用户为什么不用屏幕更大、操作轻松的手机？甚至还有 AI 眼镜妄图取代智能手机，有些一厢情愿了。

AI 眼镜以及大部分 AI 硬件天生适合 " 一句话交互 "，只是过去受限于 AI 算法技术，机器很难理解用户的复杂指令，更没法干活儿。今年事情发生了变化：春节过后 OpenClaw、Hermes 相继出圈爆红，大厂新模型都将 Agent 能力当核心演进方向，说明用户对 AI 的需求从来不只是聊天或问答，而是希望它能「干活」，干很多活儿。同时，AI 进化得足够快，Agent 已能自己理解意图、拆解任务、调用服务、交付结果，执行复杂的 " 长任务 " 了。所以 2026 年被称为 Agent 普及元年。

讯飞的判断与行业大方向是一致的：AI 终极形态不是下一个搜索或者 ChatBot，而是 Agent，而 AI 眼镜，恰恰是 Agent 最理想的物理载体之一，因为它无感自然，随时随地，拥有第一人称视角的摄像头和麦克风，能看到你看到的、听到你听到的。

所以讯飞推出的首款 AI 眼镜上来就强调 Agent 能力，以终为始进行产品定义，围绕跨语种沟通和商务、会议等办公场景，把看、听、说、理解、记录、执行串成闭环，成为第一款原生 Agent 眼镜，让用户可一句话给 AI 交办任务，真 " 解放双手 "。

（图源：雷科技）

当用户戴上讯飞 AI 眼镜后，在展会与外国人交流时，不再需要频繁低头看手机翻译提示破坏交流氛围；在会议沟通时，无需额外带录音笔，无需低头操作备忘录 App，就能实时进行会议记录与纪要整理；在公众演讲时，不需要背稿，更可避免 " 对着大提词器演讲却被观众看到读稿 " 的尴尬 …… 第一视角的 AI 眼镜，让交流、工作变得更轻松，更自然、从容。

所以看到这里，你就不会对讯飞 AI 眼镜的定价感到诧异了。4299 元的起步价（标准款）在 AI 眼镜行业不算便宜。即便刨除一些只有音频、没有 AI 的所谓 " 千元镜 "，讯飞 AI 眼镜在带显示 AI 眼镜中都不是最低价的那一档。但如果考虑到它是一款专业级翻译 AI 眼镜、更是一款 " 戴在眼前的 Agent" 的新一代 AI 眼镜，这个价格又显得过于克制，毕竟这是 " 买眼镜送 Token" 的模式，而 Token 越来越贵，讯飞等于把未来的 AI 服务价值提前打包进了眼镜里。

一出道就定义新标准，讯飞底气何在？

首款原生 Agent 眼镜，让讯飞 AI 眼镜的起点很高。

在发布会开始时，讯飞就提出要 " 定义一个新标准 "，当时雷科技看了 Keynote 还觉得讯飞挺 " 狂 " 的。经历了残酷的百镜大战依然还在牌桌上的玩家，都有几把刷子：除了做硬件、光学、AR 的专业户外，还有 Meta、阿里、Google 这样的超级巨头在列。讯飞凭什么一上来就定义新标准？

（图源：雷科技）

思考行业来时路才发现，讯飞的说法经得起推敲：十多年前做的 Google Glass 时概念超前，但更像一个能在眼前显示通知的手机配件，没有 AI、更无 Agent 逻辑，它以及当时跟着做的百度 Eye 们都销声匿迹了；现在市面上大部分 AI 眼镜能脱离手机，但还是在延续 App 生态，基于 GUI 的交互逻辑。但 AI 时代的中心不再是 App 而是 Agent，交互核心从 GUI 升级到 CLI，只要算法足够成熟、算力足够强大，AI 眼镜完全不需要再遵循 App 逻辑，只需要一句话完成任务和进行必要显示即可。

这就是讯飞 AI 眼镜的理念，直接做原生 Agent 眼镜，让 AI 眼镜成为用户的第二大脑，以眼镜的形态与用户共同感知、共同理解、共同决策，所以说是新一代标准并不夸张。而且多说一句，类似的叙事正在更多品类上演，比如地平线推出的新一代车机 Agent 系统 KaKaClaw（咖咖虾）同样摒弃了 GUI，而是让用户以语音为核心与车机交互。

（图源：雷科技）

做原生 Agent 眼镜，并不意味着要排斥 App。在未来 GUI 软件依然会存在，特别是在手机 /PC 这样的传统产品形态上，其在信息可见性（设计、游戏、阅读等）、调度（看状态、节点、结果）上依然有显著优势。讯飞 AI 眼镜可与手机上的讯飞翻译 App 搭配使用，用户可在 App 上看到更详细的信息、进行更复杂的操作，Agent 硬件与 AIPC、手机等设备联动也是行业的普遍做法。

问题是为什么是讯飞先做成了 Agent 眼镜？理论上来说，音频眼镜、拍照眼镜是更安全的形态，后面下场的大厂只需要将某些维度做得好一点，将价格压得低一点，再凭借生态等系统优势就有机会赢。但讯飞没有这样做，它绕开了显示、性能、续航这些单一维度，不卷硬件参数，大概是因为硬件性能最终会被底层计算平台或者上游光学方案统一解决，比如高通发布新一代穿戴芯片之后，所有厂商的性能都会集体升一级，硬件差异会被迅速拉平。

更重要的是，真正决定胜负的不是硬件，而是眼镜上的 AI 能做什么，这恰恰是讯飞能回答好的。

讯飞是做语音 AI 出身的，翻译是应用最广泛且最先赚到钱的场景之一。所以讯飞 AI 眼镜的 " 杀手锏 " 是翻译，这也是被 AI 眼镜验证过的高频刚需场景，但市面上的产品还有痛点，而讯飞恰好能解决。

讯飞翻译机服务超 100 万用户、累计翻译次数破 10 亿；多语言会议系统入驻 500 万间会议室，服务诸多重要会议；同传系统覆盖 50 个国家、支持 42 万场国际会议。这次讯飞成为澳门 BeyondEXPO 的核心伙伴，与其深耕多语言交流场景有直接关系，在 IFA 等国际展会以及国际会议，讯飞的存在感一直很强。这一切的背后是翻译算法模型的长期迭代、多语种语音数据的持续积累，以及在各种极端声学环境下的工程化经验，现在，讯飞将这些压到一副 40 克的 AI 眼镜里。

而独创的唇动识别降噪方案、率先搭载 Agent 能力则表明，讯飞的 AI 技术底子远不止翻译，还有语音 AI、多模态理解、基础大模型、智能体能力。讯飞是被低估的 AI 玩家，它并非大模型浪潮的 " 后来者 "，早在 2017 年就承建了认知智能全国重点实验室，并将 20% 左右的营收投入研发，打造了稳居第一梯队的星火大模型和 AI 开发者生态，在教育 / 医疗等专业场景积累了丰富的 AI 落地经验。

讯飞最突出的 AI 能力是语音，而语音恰好成了今年 AI 玩家们最重要的事情。在一切都可 Vibe 的今天，所有 AI 都在强调语音输入能力，ChatGPT、Claude、Grok、千问、豆包等均在强化电脑端语音输入，甚至推出了 Vibe 定制麦克风，深层原因是用户与 Agent 的交互方式正在从 " 打字 " 退回到 " 说话 "，语音最符合人类本能的表达方式，比打字快，比用手操作任何设备去输入信息都更自然，更接近人类的沟通本能，因此成了人与 AI 交互的主界面。

讯飞是做语音 AI 起家的，从声学前端信号降噪处理，到语音识别、声纹识别、情绪识别、语音合成，再到大模型语义理解和多模态交互，它是少数能做到语音 AI 全链路自研的中国公司。而 AI 眼镜恰好是最适合语音交互的 Agent 硬件之一：触控、眼动等不方便，输入文字更不现实，与此同时它距离 " 嘴 " 足够近，搭载骨传导麦克风天然适合 " 听指令 "。

（图源：雷科技）

所以不是讯飞要跟风下场做 AI 眼镜，而是当 AI 眼镜的竞争焦点从 " 能不能用 " 转向 " 能不能常戴、能不能听懂、能不能办事 " 时，游戏自然移到了讯飞的主场。在跨语言办公领域，讯飞深耕多年，面向用户的真实场景，开辟了教育硬件、翻译硬件、办公硬件等产品线，单单是翻译线就打造了 AI 翻译耳机、讯飞翻译机、讯飞同传麦克风、讯飞会议一体机等成功产品，这样看，讯飞推出 AI 眼镜是产品演进的结果，多少有点水到渠成的意思。

Google Glass 未能普及的原因是太超前，市面上 AI 眼镜 " 卖得好、用得少 " 则是因为沿着 " 戴在眼前的手机 " 方向走，在 Agent 爆发元年，讯飞 AI 眼镜瞄准 Agent 眼镜做，恰好是 AI 能力足够支撑 " 做事 " 的节点。它的起点很务实，先把翻译做深，同时也在借助 GlassClaw 把听到、看到的信息继续变成可执行结果。眼镜负责采集现实世界的信息，AI 负责理解和处理，最后再把结果交付出去。这个闭环跑通之后，用户戴上它跨语言交流、会议沟通、信息理解、纪要整理、任务执行变得更轻松，AI 眼镜也将从一个新奇硬件，变成人人必备的生产力工具，一个戴在眼前的 Agent。

宙世代

一起剪

相关标签