智东西 09-11
曝OpenAI神秘大模型“草莓”两周内发布!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

作者 | 香草

编辑 | 李水青

智东西 9 月 11 日消息,据外媒 The Information 昨晚报道,OpenAI 的新模型 " 草莓 "(Strawberry),将在未来两周内作为 ChatGPT 服务的一部分发布。

" 草莓 " 项目是 OpenAI 盛传已久的神秘 Q* 模型,据传是此前 OpenAI 政变大戏的关键原因之一。它展现出了解答数学问题、复杂编程的强大能力,让 AI 安全的研究人员都为之震惊。

上个月初,OpenAI CEO Sam Altman 曾在推特暗戳戳秀自家花园 5 颗草莓。当时有网友根据草莓成熟时间预测," 草莓 " 模型或者 GPT-5,可能在未来 4-6 周内发布。这次曝出的时间点,正好和当初网友的预测对上了。

▲ Sam Altman 秀草莓

两位参与模型测试的人员透露了更多该模型的细节。" 草莓 " 与其他对话式 AI 最大的区别,在于它会在回答之前进行 " 思考 ",这一阶段通常持续 10~20 秒。

此外," 草莓 " 的初代版本只能接收和生成文本,不能处理图像等其他多模态信息,这似乎与如今市面上的主流大模型发展方向有些不同。

一、" 三思而后答 ",初代为纯文本模型

据测试人员透露," 草莓 " 虽然是 ChatGPT 的一部分,但它将是一项独立产品。其具体的服务方式尚不清楚,一种可能是作为可选择的模型,在 ChatGPT 的下拉菜单中提供。

" 草莓 " 最大的特点,就是会在回答前进行 " 思考 ",而非立即给出响应。这一阶段通常持续 10~20 秒。

思考阶段有助于模型避免出错,这段额外的时间也使 " 草莓 " 更有可能知道何时需要向用户提出后续问题,以便提供更全面的解答。这既可以视作深思熟虑的优点,但同时也可以视作反应迟钝的缺点。

此外," 草莓 " 的初代版本只能接收和生成文本,不能处理图像等其他模态信息。而如今市面上大多数大模型都是多模态的,纯文本似乎是一个明显的弱点,这可能反映了 OpenAI 在发布产品上面临的压力。

二、或将以速率限制收费,无需 " 思维链提示"

价格方面," 草莓 " 的定价可能与 OpenAI 的聊天机器人不同,后者有免费和订阅两种级别。据另一位了解该产品的人士称,它可能会有速率限制,限制用户每小时发送的最大消息数量,并且可能会有响应速度更快的高价级别。

与 OpenAI 目前最强的模型 GPT-4o 相比," 草莓 " 可能更擅长处理复杂、多步骤的问题。目前,用户在使用 ChatGPT 时往往需要输入各种额外的提示词,才能得到理想的答案,也就是所谓的 " 思维链提示 ",例如告诉聊天机器人逐步展示其推理过程。" 草莓 " 的功能旨在避免这些步骤。

这意味着," 草莓 " 不仅在数学问题和编程方面会表现更佳,而且在更 " 主观 " 的商业任务上也会表现更好,比如头脑风暴制定产品营销策略等。在这类任务中,该模型将提供更符合用户公司特定情况且更详细的建议。

三、思考模式存在弊端,记忆能力仍有待提升

但在模型发布之前或之后,OpenAI 可能还有一些问题需要解决。

例如,尽管从理论上讲,当 " 草莓 " 被问到简单问题时,能够跳过思考步骤直接回答,但一位测试人员说,在实际操作中模型并不总是这样做。它可能会错误地花费太长时间,来回答那些其他模型可以立即回答的问题。

一些使用过 " 草莓 " 原型的人抱怨,与 GPT-4o 相比,它虽然响应略好一些,但并不值得额外等待 10~20 秒。

此外,虽然 " 草莓 " 旨在在回答新问题之前,记住并整合前面的聊天记录,用以满足用户的特定偏好,但模型在这方面有时也存在问题。

结语:OpenAI凭借 " 草莓 " 重振旗鼓?

不可否认,OpenAI 在很长一段时间内都是大模型产品领域的领头羊,但它面临的竞争日益激烈。

例如在上个月,谷歌对标 GPT-4o 的 AI 语音助手 Gemini Live 已经广泛落地,其能够灵活处理用户的打断和突然的话题变化。OpenAI 在 5 月首次发布了 AI 语音助手 GPT-4o Voice,但随后为了改进安全措施而推迟了发布。

" 草莓 " 能否帮助 OpenAI 恢复势头,我们拭目以待。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

草莓 the 聊天机器人 数学
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论