驱动之家 09-13
OpenAI o1预览模型发布:推理能力更强 可达理科博士生水准
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 9 月 13 日消息,今日凌晨,OpenAI 正式推出了 OpenAI o1 预览模型。

对于复杂推理任务而言,新模型代表着人工智能能力的崭新水平,其特点就是会在回答之前花更多时间进行思考,就像人类思考解决问题的过程一样。

OpenAI 曾解释过,2023 年发布的 GPT-4 类似于高中生的智能水平,而 GPT-5 则是完成 AI 从 " 高中生跃升至博士 " 的成长,o1 模型就是其中关键的一步。

根据测试,o1 模型在国际数学奥林匹克的资格考试中,能够拿到 83% 的分数,而 GPT-4o 只能正确解决 13% 的问题。

而在编程能力比赛 Codeforces 中,o1 模型拿到 89% 百分位的成绩,而 GPT-4o 只有 11%。

OpenAI 表示,根据测试,在下一个更新的版本中,AI 在物理、化学和生物学的挑战性基准测试中,表现能够与博士生水平类似。

相较于 GPT-4o 等现有的大模型,OpenAI o1 能够解决更加困难的推理问题,同时改善过往模型中存在的机制性缺陷。

比如在解答编程问题时也会更有条理,在着手写代码前,把整个回答的流程全部思考完一遍,再动手输出代码。

o1 会花更多时间思考

在 o1 模型中,AI 会不断试错并打磨答案,从而显著提高生成结果的准确率和质量。

OpenAI 宣布,ChatGPT 订阅用户从 9 月 12 日起可以访问这两个新模型,o1-preview 每周消息数量限制为 30 条,o1-mini 则为 50 条。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

人工智能 编程 物理 资格考试 生物学
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论