鲸选AI 14小时前
前百度大佬“放下”AI搜索,转做Agent浏览器,评分超越Manus
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

一次自我革命的转型,能成吗?

前百度集团副总裁、小度科技 CEO 景鲲离职创业的 GenSpark,最近从 AI 搜索向 AI Agent 转型,看来是想脱离 AI 搜索的竞争红海,向更智能的 Agents 服务领域进发,推特上很多网友评价,此次新产品比较有看点。

他们宣称 Genspark Super Agent 是一个综合性的 AI 助手(AI Search+Browse+Agents ),可以协调多个 AI 工具执行各项任务。鲸哥测试下来,GenSpark 在 AI 搜索、Agent、Deepsearch 几方面,都做了比较好的融合。

有多厉害呢, 在 "GAIA Benchmark"(通用人工智能基准测试 )图表中,Genspark 在三个不同级别(Level 1、Level 2、Level 3 )测试中的表现,都超越了 Manus、OpenAI Deep Research 等产品。

但对于刚刚正式海外上线的 Manus 而言,GenSpark 显然并没有瞄准它作为竞争对手,而是选择 Perplexity、秘塔 AI 以及过去的自己,颠覆 AI 搜索显然是个更大的市场。

如今的 AI 搜索有几个痛点:

1、问题思考的时长,回答的长短不好控制,受限于模型能力,回答效果也不一定。这点很影响用户体验,等了半天回答的不尽如人意,那用户可能用一次就走。

2、没有多维信息处理,也没有 Agent 能力,这意味着想法到工具服务的路径没法打通。这个是百度多少年的梦想,搜索始终局限在文字信息中心。

3、没有 Deep Research 能力,很多深度思考的问题,只是调用 AI 回答了,不够深入。

Manus 一定程度上,解决了 2、3 问题。但是也付出了代价,就是程序比较重,内置虚拟机操作浏览器,结合 AI 大模型深度处理问题,结果在 VSC 中查看,给出的效果确实不错。

也造成大家日常问题不能麻烦 Manus,毕竟没有网页服务可随时用,只能下载端侧应用,而且一思考就 20 分钟,还十分消耗 Tokens,费时费钱。更具难度的问题,还是 ChatGPT 的 DeepResearch 更靠谱。

GenSpark 使用门槛比较低,但是每次使用感觉尚可。

这源于它的解决思路,是在日常和中等任务这段区域,快速回答问题,并且完成度不错。

在官网上,GenSpark 给出了典型问题『去哪旅游』的回答 Case。

可以看到 GenSpark 搜集了衣食住行的各项问题,比较惊喜的是,它还搜索了图片等多维信息,调用了地图等工具。

而且还在最后,给出了餐厅等预订链接,你可以直接点击打电话预订。

GenSpark 还有个打电话功能,和豆包通话是 AI 对话能力不同,你对他说 " 预订明天晚上 7 点在西餐厅的两人座位 ",Genspark 就会拨打电话并完成预订。

这个功能比较西方化,国内好多人用 APP 习惯了,电话都不怎么打了,我们是大众点评团购是主要服务场景。

相比智谱等 AutoGLM 等直接实现了点咖啡,GenSpark 确实还没 Agent 到这一地步。但从使用效果而言,一句话直接买咖啡场景,适合的环境需要非常理想的环境,以及你要全部授权调用能力给 AI。

简单说发布会看看就得了,实际操作很难落地。

而 GenSpark 选择调用 Agent 但是不全部执行的策略,查看了很多网页以及工具,涉及到购买等步骤就停止了,最后一公里不只是技术问题,还是隐私保护等问题。当下阶段不去触碰,还是挺明智。

官方给出的案例很多有滤镜,以下是我测试的第一个问题,也是我近期在思考的 AI 兼职创业问题,大家可以看看效果几何。

设计下如何利用 Gen-4、GPT-4o、Trae 等最新工具,做 AI 短剧、AI 表情包、AI 海报以及 AI PPT(AI Coding 生成 SVGPPT)爆款出圈。 然后分析哪个技术实现了行业转折点能力的突破,构建月入百万的实现路径,分析下哪个路径好!

GenSpark 深度分析了几个领域目前的进展,捋顺了行业从生产到售卖的过程,并提出了优劣分析。以下是其中 AI 短剧一个领域的分析截图,制作流程的分解,收益模式的分析,盈利数据的预测等等,挺面面俱到分析。

最优秀的是,他直接生成了比较精美的 PPT。而且这个 PPT 不是套模板,很多分布图和逻辑图,都是按照生成的内容配比。

一份相当具有可用性的分析报告,一度让我十分惊艳。

当然,相比 Deep Research 来说,他的思考水平还是有一点差距,我调用 O3-mini-high 模型的 Deep Research 同样做了这份分析报告。

Deep Research 没有生成更容易浏览的 PPT,但是内容更深刻点,每个项目需要的工具,以及启动成本,还有潜在收益估算,都有贴近实际的分析和呈现。(报告链接:https://chatgpt.com/share/67ee1d0c-d7f8-8005-af20-4cff30eb6fbe)

在第二个测试中,我测试了电商购买场景中的思考问题:

帮我比较电商渠道的两款产品:

我在考虑购买 <Mac M4 芯片版本 > 和 < 华为鸿蒙最新款 >。

需求:- 我经常出差,需要 < 影视剪辑 >、<AI 软件适配 >< 续航长 > 的笔记本,也关注 < 不要太重 >。

请从性价比、生态产品服务、用户评价等方面比较 A 和 B,列出各自的优缺点,并根据我的需求给出推荐国内外等电商渠道的购买链接。

从生成的报告看,并仅用了三四十秒钟就完成了。而且查看了电商品台的网页,给出了购买链接,将一些国补等优惠信息也分析了出来。这就有点实用了。

实现以上能力,他们提到了 GenSpark 产品背后的几项技术突破。

1、世界上第一个混合代理系统,利用最佳模型、工具和数据集来完成不同的任务

它的 LLM 可以使用 o 1、o3-mini-high、Claude 3. 7。图像生成可以使用 FLUX、ogram、Recraft,视频可以用 Kling 和 Luma。

不知 GenSpark 是不是利用 CoE(Collaboration-of-Experts, 专家协同)架构,实现了思维链 + 多系统协同,每个问题能找最适合的大模型回答。这个 GenSpark 不算是第一个实现。

2、内部构建的各种可靠的工具集,经过精心构建和测试,以确保效率和稳健性

调用工具集是否顺畅,Google genmini 有先天优势,它在移动互联网时代做了比较多的工具。

现在 AI 时代,预计 MCP 协议有助于让大模型调用工具更顺畅。这点短期有差距,长期大家应该都能顺畅使用很多工具。

3、内部构建的各种可靠数据集,预先构建并从网络上提取,以确保质量、新鲜度和数量。

估计这是 Genspark 对传统搜索更理解的优势所在,自己从头清洗数据。从生成的内容看,鲸哥认为比目前的 AI 搜索效果更好一些。

当然,也不是说 Genspark 没有劣势。目前来说 Genspark 也是套壳应用,它卡在 AI 搜索和纯粹 Agent 应用两种形态中间,大家是否会习惯这种 AI 形态,就比较难说。

而且在 AI 搜索市场并未建立起优势,就彻底转变为 Agent 形态,还好是大厂高管背景出身,刚刚融资了 1 亿美金,作为初创企业有一定的容错率。

这里不得不提到 ARC 浏览器,最近转型比 Genspark 转型还激烈。ARC 浏览器本身有一定的市场知名度,但是背后的企业 The Browser Company ,宣布 ARC 以后只维持,企业另起炉灶重新做了面向 AI 时代的 Agent 浏览器—— Dia(还未发布)。

Dia 看起来极简,实际也是在走夸克的『超级搜索框』思路,AI 对搜索的内容分析精细度和彻底融入了 Agent 能力方面,都号称更强。

相比 Dia,Genspark 没这么 AI Native,它更像是 Chatbot 形态的 AI 浏览器。比 Dia 更易用,未来潜力也许比不过。

从使用成本来看,Genspark 也只是比 Manus 略低,每个月 24.99 美元。当下阶段,对内容有深入要求的用户,可能付费 ChatGPT 的 DeepResearch 更有效果。

当然,Genspark 还有 AI 图片、AI 视频等功能,公告说正在自己训练模型。这样看每个月 25 美金还值得。

目前,Genspark 也支持制作解释烹饪食谱的视频或根据新闻主题制作简短的动画视频。AI 会自动处理从脚本创建、视频生成到语音合成的所有事情。

鲸哥看效果并不出众,这些流程没必要 Agent 化。视频肯定是效果有限,不是效率优先。

客观说,Genspark 这次转型还比较有眼光,如果沿着 AI 搜索的路径走,大概率下轮融资也比较难,且不说 ChatGPT 和 Perplexity 这些巨头对其威胁,Google 这些掌握搜索数据的企业,还有底层模型的优势,未来等 AI 搜索的产品形态稳定,想超越也是分分钟的事情。

Genspark 向着更 Agent 能力发展,就走出了差异化竞争路线,有助于培养用户的新 AI 使用习惯,提升付费率。

作为初创企业,也许给自己找到了短期活下去的出路。长期竞争还是很难,Agent 浏览器预计是 2025 年最受关注的 AI 应用赛道,大厂预计都会下场竞争。

本文来自微信公众号 " 鲸选 AI",作者:杨晓鹤,36 氪经授权发布。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 百度 效果 用户体验 人工智能
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论