Metaverse元宇宙 10-24
超越GPT-4,联手华为,科大讯飞全球1024开发者节亮点全揭秘
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

今日举办的科大讯飞全球 1024 开发者节上,作为一年一度的人工智能盛会,本届开发者节以 " 万物智联 生生不息——解放生产力,释放想象力 " 为主题。

这次的盛会上,科大讯飞晒出了全科成绩单,场景覆盖了汽车、医疗、教育等,甚至在许多 " 科目 " 中得到了第一名。

七大能力全面超 GPT-4 Turbo

据刘庆峰介绍,讯飞星火 4.0 Turbo 全新升级,七大能力全面超过 GPT-4 Turbo,数学能力、代码能力超过 GPT-4o ( Open AI 最新一代 GPT 模型 ) 。此外,星火 4.0 Turbo 效率相对提升 50%。

在数学能力上,讯飞星火已完成超长思维链、树搜索和自我反思评价等算法验证,预计今年底可实现类 o1 的高难度数学能力显著提升。

与 GPT 4o、Claude 3.5 Sonnet、Genmini1.5 pro 等国际同行对比,星火 4.0 Turbo 在国内外中英文 14 项主流测试集上,实现了 9 项 9 项第一。

科大讯飞董事长刘庆峰宣布,语音识别首次实现全国地级市方言全覆盖, 含 288 个地市 202 种方言。刘庆峰表示,未来将实现方言语音识别的细化,争取覆盖到每一个县,每一种方言。

星火超拟人数字人,表情动作媲美真人

据了解,星火超拟人数字人在业界率先实现语义贯穿的 " 口唇 - 表情 - 动作 " 的超拟人数字人生成。科大讯飞副总裁、研究院院长刘聪现场进行了真机演示,超拟人数字人可以展现出目瞪口呆、卖萌的表情,实时与用户实现交流。

星火超拟人数字人还可识别、分辨面霜、酒、模型、植物等物品,不仅能介绍产品、还能为用户进行推荐,实现哪里不会拍哪里。刘聪演示过程中,在桌子上摆了孙悟空、奥特曼、怪兽的玩偶,超拟人数字人直接根据玩偶的站位变化,讲述了一个生动的故事。

据悉,星火超拟人数字人还支持个性创建,仅需一张照片即可打造自己的数字分身,用户可自定义数字人的性格、介绍、声音等个性化设定。

科大讯飞表示,一句语音即可实现声音复刻,支持多种身份、性格、场景的人设打造,人设类型已超 1300 多种。目前,超拟人数字人能力已正式开通内测,所有开发者和行业人士可申请使用。

汽车端侧大模型,效果不输云端

会上,科大讯飞正式发布汽车端侧星火大模型,相较于云端大模型,汽车端侧星火大模型在无网环境下可用,且使用效果与云端相比几乎无差异。

科大讯飞介绍,很多用户在开车经过山洞隧道,或在其他特殊场景下,会遇到无网的情况 ; 还有些用户出于保护个人隐私需求,不希望将个人数据同步至云端。而科大讯飞首发的汽车端侧星火大模型,将大模型部署在汽车端本地,不依赖云端网络,完美解决以上用户的使用痛点和需求。

科大讯飞表示,虽然他们部署的汽车端测星火大模型,只有 1.3B 的参数产出,比现在通用模型降低了两个数量级,但在汽车典型应用场景中,这些应用场景中的实际效果只下降了 1%,实用效果几乎没有差异。

端侧首响应时间降低到 40 毫秒,在复杂场景下还可以调用云端模型,即便需要调各种信源,端云融合的响应时间也降低至 1.3 秒,汽车端侧星火大模型的技术效果和响应速度,属于全行业领先的水平。

科大讯飞透露,汽车端侧星火大模型不仅是今天首发软硬件一体化的模型,关键是从今年第四季度开始,奇瑞、广汽、长城等多款车型,正在陆续集成上线并开售,用户很快就能体验到。

联合华为共研小艺,解决语障问题

科大讯飞还宣布和华为联合研发了小艺声音修复技术,让 AI 技术帮助语障朋友自由沟通。该功能旨在帮助一些言语障碍人群,他们可以发出声音,但口语表达不够清晰,说话时可能别人听不太懂,只能理解个一半。

据悉,小艺声音修复功能利用 AI 技术对用户的语音进行实时分析、修复和优化,在保持音色相似的前提下,大大提升了用户发音的可懂度和清晰度,是业界首创的无障碍 " 黑科技 "。

无论是在生活还是工作中,有了小艺声音修复功能,言语障碍人士都可以跟人进行面对面交流沟通。

智能教师系统,AI 作业过滤器

科大讯飞联合中国科教院,首发高中数学智能教师系统,它是众多高中数学优秀教师集体智慧与 AI 大模型智能的综合体,是知识与智能双轮驱动、人师与机师双向赋能的技术创新,试点应用获得好评。

同时,最新星火智慧黑板 2.0 也将于 10 月 25 日第 84 届教育装备展上正式发布。其包括 AI 均衡视听更公平、AI 教学工具更高效、AI 教师助手更智慧、全国产化算力更安全四大特性推动黑板从板书工具跃迁成为教学 AI 助手。

面向家庭学习,科大讯飞发布了搭载到学习机上的 AI 作业过滤器,能够帮助学生对作业、考题筛选,基于其对学生的知识习得能力等进行判断,选出学生的必答题、选做题和可不做题。这一功能预计在 11 月中旬上线。

医疗大模型六大核心场景升级

讯飞星火医疗大模型 2.0 实现了六大核心场景能力升级,包括医疗海量知识问答、医疗复杂语言理解、医疗诊断治疗推荐、医疗专业文书生成、医疗多轮交互、医疗多模态交互。

在细分的医学影像方面,目前围绕医学影像的诊断治疗,存在影像科医生数量相对不足、拍片质量参差不齐、重复影像检查发生率达到 41.82% 的问题。

写在最后

刘庆峰公布了科大讯飞亮相星火大模型一年来的应用落地成绩单:讯飞星火央国企中标第一、教育医疗市场第一、智能汽车市场第一、智能硬件市场第一、工业大模型第一、赋能科研应用第一、大模型开发者生态第一。

未来,随着人工智能技术的不断发展和应用,不仅是科大讯飞,将会有更多大模型厂商为全球用户带来更多创新和价值。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

科大讯飞 数学 刘庆峰 语音识别 讯飞星火
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论