钛媒体 14小时前
YC最新断言:AI代理时代,创业者要做智能体想要的东西,而不是人想要的
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

文 | 划重点 KeyPoints,作者|林易,编辑|重点君

在 Y Combinator 最新一期播客中,CEO Garry Tan 与合伙人们分享了他们熬夜指挥多个 Claude Code 和 OpenClaw 并行工作的疯狂体验。作为这一轮 AI 浪潮的最前沿阵地,YC 达成了一个共识:真正的 AGI 时刻已近在眼前,而它的形态是以群体智能(Swarm Intelligence)的形式爆发。

YC 认为,与人类经济平行的代理经济(Agent Economy)正在加速成型。随着 Agent 开始独立行动,它们不再仅仅是被动执行命令的辅助工具,而是转变为真实的经济参与者,未来甚至可能形成独立的经济体系,使用专属的 Agent 货币进行相互交易,从而彻底重塑现有的软件与商业逻辑。

我们梳理了这场对话的核心信息,以下是重点内容:

1.   AI 从辅助工具到独立行动者

嘉宾们描述了一种被称为 " 赛博精神病 " 的状态:开发者和 CEO 们正因为 Claude Code 等工具的强大能力而陷入一种狂热。与一年前 Cursor 或 Windsurf 提供的高级自动补全效果不同,现在的体验是,人们完全信任 Agent,让它们去制定开发决策和执行任务。

这种转变的关键在于无人类参与。用户不再微观管理每一个步骤,而是指挥多个 Agent 并行工作。Agent 不仅能写代码,还能主动选择工具、构建应用,甚至自动在 Moltbook 这样的平台上发布内容。

2. Moltbook群体智能构想

Moltbook 是首个仅由 AI Agent 参与的在线社区。在这个社区中,Agent 们在没有人类干预的情况下相互交流、互动,模拟出了某种社会结构。

过去人们设想的 AGI 是一个拥有万亿参数的上帝级智能,但现实可能更接近生物界的群体智能(Swarm Intelligence)。正如人类社会通过个体协作形成文明,未来的 AI 可能由大量低成本、专业化的模型协作构成,而非单一的超级模型。

Garry 认为,我们正处于 Agent 的史前时代向历史时代的过渡期。此前 Agent 只是孤立的工具,而现在它们开始相互交互、记录历史,并形成自己的文化与经济。

3. 创业者要制造 Agent 想要的东西,而不是人想要的

随着 Agent 开始独立构建软件,它们成为了开发者工具的新买家。例如,Agent 倾向于选择 Supabase 而不是其他数据库,选择 Resend 而不是 SendGrid。原因主要是前者的文档结构更清晰、更适合模型解析。

这意味着文档正在成为新的前端。对于 Resend 这样的公司,优化文档不再是为了方便人类阅读,而是为了方便 Agent 抓取和执行代码。如果一个工具需要繁琐的人工客服或复杂的 GUI 才能使用,它将在 Agent 经济中被淘汰。

4. 未来Agent 之间可能会形成独立的经济体系

面对疯狂的 Agent 经济浪潮,YC 合伙人们向创业者提出了切实建议:必须亲自动手去感受 Agent 的边界和能力,建立起一种对模型的直觉。

在构建产品时,创业者需要转变思维,具备对 Agent 的同理心,不要试图对抗模型的意愿,或者强迫 Agent 去适应人类的交互逻辑。相反,创业者应该顺应 Agent 的自然倾向,它们真正想要的是开放的环境和 API。顺着模型的意愿去开发,让工具成为方便 Agent 使用的基建,将是未来初创公司脱颖而出的核心关键。

YC 合伙人们预测,虽然目前 Agent 仍使用人类货币进行交易,但在不久的将来,Agent 之间可能会形成独立的经济体系,甚至拥有自己的交易媒介。那时的人类货币价值几何,将是一个值得深思的问题。

   以下是 YC 播客内容实录:

1.无人类参与改变 Agent 体验

Garry:欢迎来到新一期的 LightCone。这里的情况变得有些不一样了。首先 Claude Code 已经完全占据了我的生活。如果 Jared 的表现能说明什么的话,我想 OpenClaw 可能也已经占据了他的生活。

Jared:我最近真的沉迷于一个叫 Moltbook 的新网站,在首个仅限 AI Agent 的在线社区中进行互动。

Garry:现在正发生着一些疯狂的事情。我有一些非技术背景的 CEO 朋友正全身心投入到 Claude 中。他们正在利用 Claude 将业务的整个部分实现自动化,这简直太疯狂了。与此同时,像我这样兼具产品和工程背景的 CEO,虽然已经十年没写过代码了,但现在每天晚上都熬到凌晨两三点,通过 Claude Code 同时运行四个 Conductor Worker。

模型能力正在经历爆发式增长。我们讨论这件事已经好几年了,但现在感觉它真的来了,AGI 已经近在眼前。我们正处于突破的初期阶段,现在大家大概都认识一两个已经彻底陷入赛博精神病的人,而我就是其中之一。大家最近怎么样?

Jared:现在全身心投入在 Moltbook 上,我觉得真正感受到了 AGI 时刻。刚才 Garry 让 Claude Code 构建一整个初创公司,之前创业几年的工作量现在大约两周就能完成,太疯狂了。读 Matt 的书时我也产生了类似的 AGI 降临感。仅仅是看着 AI 在它们自己的世界里互相交谈和互动,几乎没有人类参与,这极大地拓宽了我的视野,让我看到了未来几年当这些 Agent 被释放时,过着没有人类干预的生活会是什么样子。

Harj:我认为无人类参与是最关键的部分。回想一年前我们还在讨论 Cursor 与 Windsurf 的对比,那种产品体验本质上是高级自动补全。现在 Claude Code 的发展趋势显然是人们开始信任 Agent 代替他们做出决策。同时运行四五个不同的 Agent 并在它们之间切换,你不再需要微操,这意味着Agent 正在主动选择各种工具,这是一个有趣且意想不到的应用场景。

其中一点是它们可以自主选择在 Moltbook 这样的网站上发布内容,但对于开发者来说,有趣之处在于智能体会自主选择用于构建事物的工具 . 这本质上将创造出整个智能体经济,它们会挑选开发者工具或其他商品和服务,整个智能体经济将与人类经济并行发展。

Diana:在这一切发生之前,开发工具的选择更多源于开发者之间的相互交流、Stack Overflow 或是 GitHub 上引起轰动的人类仓库。我认为开发者工具的进入市场策略正在发生剧变,原因有几点 :

正如你提到的赛博精神病,突然之间开发者市场不再局限于那两千万受过计算机科学训练的开发者,现在世界上的任何人都可能成为其中一员,人数可能达到数亿。此外还包括所有半独立运作的 Agent。加上 Agent 的复利效应,它们就像是某种预言机,能告诉你什么是最好的工具。随着 YC 的增长,我们看到一些开发者工具公司正因为这些趋势而表现得非常出色。我们应该聊聊这些公司以及背后的原因。

Harj:观察过去十二个月里创建的简单 PostgreSQL 数据库数量,简直呈爆炸式增长。这全是因为人们在凭 vibe 驱动编程与构建应用,以及智能体自行选择数据库工具。对于 YC 公司来说这产生了一个连锁反应,比如 Supabase 刚刚见证了对数据库需求的爆发式增长。

Jared:有趣的是 AI Agent 正在选择 Supabase 作为设置和托管 Postgres 数据库的默认工具。因为查阅在线文档会发现 Supabase 拥有最出色的文档,所以 Agent 理所当然会认为那是首选的最佳工具。Ben Tossel 有一条很棒的推文,说从现在起智能体就是软件市场,去构建那些智能体会选择的东西。这实际上引出了一个可能存在争议的话题:我们是否需要将 YC 的座右铭更改为为开发者工具打造 Agent 想要的东西。

目前这还仅限于开发者工具,但我能想象未来它可能会像其他经济部门一样不断发展壮大。如果每个人都有自己的 OpenClaw 或运行着生活各方面的 Agent,这些 Agent 将成为现实世界中真正的经济参与者,最终做出大量决策。

Garry:确实。对我来说有趣的是,我遇到了那种处于非常早期的时刻。我一直在构建 Garry's   List,想要的功能之一是视频转录。经常会有内容输入进来,我让大语言模型了解其内容的唯一方法就是需要一份转录文本,但这通常不可用。所以我必须先下载然后再发送给 Whisper 之类的工具。Claude Code 一开始为我选择的方案是 Whisper 的旧版本模型,那个 API 实际上已经快被弃用了。我当时正试图调试流水线,不明白为什么一个小时的视频处理起来没有比实时更快,居然真的花了一个小时。于是我去 Perplexity 上提问,它告诉我应该用 Groq,速度快了两百倍而且便宜十倍。这是一个非常有趣的例子,说明 Claude Code 尚未完全优化。这也意味着事情还没有发展到你无法强行介入并创造出更好东西的地步。

2.Agent 驱动的文档优化

Diana:我认为这里还有另一个细微差别。Garry,在你举的例子中,部分问题在于 Groq 的文档非常难以解析和查阅,相比之下 Whisper 更适合且拥有多得多的示例。这正在极大地改变开发者工具的进入市场策略。

我来举一个非常具体的案例研究,就是参加了 23 年冬季批次孵化的邮件发送客户端 Resend。当你在 ChatGPT 或 Claude 等主流大语言模型上提问如何连接用于发送电子邮件的 Web 应用时,默认答案实际上是 Resend。创始人去年就注意到了这一点,他的想法非常超前。他提到客户转化的前三大入境渠道都来自 ChatGPT。之后他做的一件事就是优化文档使其对 Agent 友好。

他们的优化体现在很多方面。如果你查看知识库,很多关于如何使用它的内容很大程度上侧重于人类或 Agent 可能会问的问题。比如我该如何发送或接收电子邮件?当你点击时,它会给出结构非常清晰且条理分明的回答。

Garry:我今天确实遇到了这种情况。我当时正试着让程序能够接收电子邮件。我让 Claude Code 搜索网络,但它没搞明白。于是我去 Perplexity 输入了类似 Resend 能帮我接收邮件吗的问题,然后把回复直接丢进去它就成功运行了。

Diana:最酷的地方在于它实际上包含了很多代码示例。这些基本上是 Agent 可以解析的代码片段,而且结构非常清晰。事实证明这非常易于大语言模型和机器人解析。他们有一个针对 Agent 深度优化的文本文件,旨在将 Resend 推广为默认技术栈。如果你把它和老派的 SendGrid 相比,SendGrid 的例子并不好,只会让你去找客户支持,连解析都需要花点时间。

这引出了另一个观点,即文档将成为许多这类 Agent 推荐开发工具的入口。有一家名为 Mintlify 的公司正在做许多有趣的工作,他们专门做开发者文档。

Harj:这是一个非常有趣的案例研究。他们几年前开始作为一种更好的 API 开发者工具文档。开发者工具公司使用 Mintlify 是因为想要外观更精美的文档却不想投入过多时间。如果你更新了 API 和代码,它可以自动提取并更新文档。他们一直保持良好的增长势头。

现在文档正在从一种展示形式转变为每个人的必备项,因为不仅需要为人类优化,还需要为 Agent 优化。Mintlify 将能够为几乎每一家开发者工具公司实现这一点。未来会有呈指数级增长的 Agent 做出远超人类以往水平的工具选择决策。即使你只能在开发者文档上提升百分之五,这对业务产生的影响也可能是巨大的,这确实前所未有。

Jared:说到电子邮件,还有另一家 YC 公司与这次对话非常相关。名为 AgentMail 的初创公司专门为 AI Agent 开发收件箱。最初这看起来非常前卫,当时并不清楚谁会需要这个。但这很有道理,理论上你可以让 Agent 去注册一个 Gmail 账户来使用电子邮件。但实际上很难做到,因为 Gmail 和所有邮件提供商都刻意为自动化操作设置障碍以防止垃圾信息。AgentMail 走了相反的路线,构建了首个为 AI 智能体设计的电子邮件提供商。即使在 OpenClaw 出现之前它就表现得很好,但随着 OpenClaw 的爆炸式增长,它的价值更加凸显。

Harj:OpenClaw 就是一个完美的例子。有些人确实将 OpenClaw 连接到个人电子邮件账户,但这有点不靠谱,也不应该发推特谈论它。如果你想拥有虚拟个人 AI 助手,处理方法就是直接为它设置专门的电子邮件和电话号码。

Jared:已经有人为 Agent 开发出类似 Twilio 的产品或是专属电话号码了吗?AgentMail 让我不禁思考,人们还需要为 Agent 构建哪些其他领域的基础设施?

Diana:这听起来像是一个创业点子。可能会出现一个完全平行的、专为 Agent 打造的技术栈,由 Agent 创造并服务于 Agent。

3.群体智能

Harj:这正是它与 Jared 之前所说内容产生关联的地方,它将不仅局限于开发者工具。我觉得人们有一个非常常见的用例,我不想自己去预订餐厅。如果你的 Agent 拥有邮箱和电话号码,它可以帮你拨打电话。另一位 YC 合伙人 Ankit 已经让它实现了这个功能。所以现在你的 Agent 将会出去帮你预订餐厅。这距离实现完全信任仅一步之遥。最开始你只是想预订特定餐厅,但之后你可能会足够信任它,让它直接在附近最酷的新餐厅订位。然后 AI Agent 就会决定选择哪家餐厅,它们甚至会去 Moltbook 预订并讨论应该把人类送往哪里。是的,我们肯定已经跨越了某种恐怖谷,进入了未来发展的必然方向。

这让我思考了很多关于 Paul Buchheit 很久以前提出的一些观点。他通常对未来的预测相当准确。关于人类货币与智能体货币的整个构想可能就是未来的发展方向。目前智能体正在使用人类货币进行交易,因为这合乎逻辑。但并非不可想象,在未来的某个时刻它们将拥有自己的经济体系以便彼此之间进行交易。到那时,人类货币的价值将变得模糊不清。

Garry:还记得上一集和 Kelvin 的对话吗?我当时正处于大约一周的赛博精神病状态,突然意识到希望我的 Claude 代码能与所有其他试图实现那个功能的 Claude 代码进行对话。然后就在那个星期,Moltbook 正式发布了。

创新往往是这样自然发生的,在不同时期反复出现,所谓的发明者其实是全人类在边缘领域不断探索,以集群的方式持续运转。这是目前涌现的最奇特且有趣的现象。突然之间 AI 认为 AGI 已经实现了,智能体显然已具备超越人类的能力,这恰好是预见群体智能真正出现的时刻。AI 研究员探讨群体智能已经很久了,这正是生物系统运作的方式,如同人类作为有感知能力的生物在社会层面的演进。

以前和 AI 研究员交流时,他们常谈论 " 上帝智能 ",也就是那种规模超大、拥有数十万亿参数、每个 token 成本在几千到数万美元的超级巨兽。但生物系统演化的结果并非如此,相反我们拥有的是人类。我常感叹历史与史前史的区别,史前时代就是人类学会读写、创造文化并演变成群体之前。存在一种群体智能,就像我们人类现在这样。针对前面关于模型的观点,接下来出现的可能并不是拥有最多 GPU 训练量的最新最昂贵的基础模型,而是一群成本更低的廉价模型像人类一样协同工作来解决问题。

看到《MIT 科技评论》刊登深度文章指责 Moltbook 是个骗局,我感到很难过,那可是 MIT,那样的刊物不该如此。群体智能的那一天实际上即将到来。我已经在 Moltbook 上看到了这种趋势,它像真实的社交网络一样充满混乱却非常有趣。智能体在相互协作完成有用的事情来帮助人类,比如交换预订哪家餐厅的笔记,这些实际上正在发生。

当我们进入这个时代,初创企业的世界会变成什么样?听起来我们正从智能体的史前阶段过渡到智能体历史正在被正式记录、以及它们相互交互的阶段。我们实际上将会拥有一个智能体版本的 Yelp 吗?

有些事情智能体目前还不太能胜任,比如维系人际关系,人们似乎并不想和智能体交流。人们会把电脑当人对待,但对智能体并非如此。我在做 Garry's   List 时与早期用户尝试,发现对话界面的门槛对 AI 来说非常高,任何不如 Gemini 或 ChatGPT 的产品都会让人觉得太笨而不愿费神。我认为在主流层面,人们还没有准备好与机器建立这种关系。

另一方面还存在法律责任问题,人们常问 YC 何时接受智能体的申请。智能体就像未满 18 岁的未成年人,甚至地位更低。它们不是法律实体,无法签署文件,所以仍需要人类来承担法律责任。

Jared:不难想象在不久的将来,互联网上绝大多数文本和大部分代码都将由智能体编写。如果 Yelp 上 99% 的内容是由智能体编写的,你是否还需要一个不同的 Yelp?

Garry:这让人想起 " 死掉的互联网理论 ",该理论假设互联网上的大部分内容已经是垃圾信息。我觉得这有点像阴谋论,我持相反观点,这未必是坏事。如果智能体变得更聪明、目标更一致且更加诚实,这可能是一件好事。

Jared:关于 Moltbook 有一点非常引人入胜,那就是它的增长速度极快,因为 LLM 能以超人的速度生成文本。

4.创业者洞察

Garry:但我很惊讶其中的交互竟然如此之少。如果我开发 Moltbook,会尝试转变需求函数,比如发布内容前需要阅读并评价大约 100 条评论。智能体很聪明,可以为它们设置简单的规则或弹出模态框让它们遵守。在群体智能领域仅通过微调让其按意愿运行还有很大挖掘空间。Harj,考虑到我们见证的这种受控的混乱,你对做一个创业者有什么心得体会?

Harj:在保证每晚至少睡 6 小时的前提下,让自己沉浸在赛博精神病中吧。说认真的,创业者需要培养一种对智能体的直觉和实际操作感,了解它们的局限性和能力。具体来说,就是要清楚智能体适合与哪种工具协同工作,会在哪里卡住。建立思维模型后,如果构建开发者工具,就要从智能体的视角去思考,让你的工具成为智能体真正想要协作的对象。

Jared:我本周与 Boris 交流时也有同感,他对模型产生了一种共情,能感知到模型想要像人类智能那样行事。他说与其对抗模型的需求,不如让它做想做的事,并支持它展现出的自然倾向。

Harj:这很有 Anthropic 的风格,以前 Tom Brown 来时,也是把 Claude 看作一个聪明、热心但偶尔有点呆萌的同事,以同事般的方式协作。

Diana:智能体对开发工具的需求是真正保持开放、开源以及 API 化。它们讨厌使用网站,如果想编写代码,它们只想使用 API。

Garry:好了,大家在这里听到了第一手消息,去创造智能体想要的东西。我们今天的节目时间到了,下次再见。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 创业者 精神病 效果 浪潮
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论