驱动之家 08-02
全靠用户投票!GPT-4o、讯飞星火分列CompassArena大模型前二
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_font3.html

 

快科技 8 月 2 日消息,根据国内权威大模型评估平台 OpenCompass(司南)近日公布的 CompassArena 周榜,GPT-4o 和科大讯飞的星火大模型分别占据了排行榜的前两位。

榜单采用专业用户投票方式,结合了用户对各款大模型的真实体验,更具客观性和说服力,可谓是含金量十足。

OpenCompass 的评测体系涵盖了学科、语言、知识、理解、推理等多个维度,能够全面评估大模型的综合能力。

在最新三期的评选中,讯飞星火以 Elo-1078 和 Elo-1081 的高分连续三周位列前三,并两次获得第二,显示出其在大模型领域的强劲竞争力。

值得注意的是,科大讯飞在今年 6 月 27 日发布的星火 V4.0 版本上,已完成了对 GPT-4 Turbo 的整体超越。

根据八个国际主流测试集的横向评测,讯飞星火 V4.0 排名第一,在文本生成、语言理解、知识问答、逻辑推理、数学能力等方面完成了整体超越。

此前,讯飞星火在《麻省理工科技评论》的横评中也获得了高分,凭借领先的语言能力、数学、理综等多项核心能力,斩获国产主流大模型榜首席位。

目前,讯飞星火的安卓端 APP 累计下载量已超过 1.31 亿次,位列国内工具类通用大模型 APP 第一,持续领跑国内大模型第一梯队。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

麻省理工 安卓 讯飞星火 科大讯飞 数学
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论