驱动之家 11-20
腾讯Angel获世界互联网大会领先科技奖:让通信成本降低70%
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 11 月 20 日消息,2024 年世界互联网大会今日在浙江乌镇开幕,腾讯获得全新设立的世界互联网大会杰出贡献奖—创新突破类。

据 " 腾讯 " 公众号介绍,腾讯 Angel 机器学习平台也获得了本年度世界互联网大会领先科技奖。

腾讯称,该奖项被视为科技行业的最高荣誉之一,在 270 个申报项目中,共有 20 个项目获奖。

评选委员会点评腾讯 Angel 机器学习平台:突破万亿级模型分布式训练和推理以及大规模应用部署等难题。

据了解,突破主要在通信、效率、规模三方面实现。

通信:

从网卡到交换机,再到路由协议,腾讯自研的 RDMA 网络实现了集群高速互联,单节点带宽达到 3.2T,相比于同类领先产品,性能提升 30%,成本降低 70%。

效率:

自研了训练 / 推理框架,提出显存加主存的一体化机制,实现多维并行和算子优化,相比开源框架,训练性能提升 2.6 倍,推理速度提升 2.3 倍。

规模:

实现了单任务万卡的线性扩展,GPU 集群加速比从 50% 提升到 99%。

腾讯 Angel 机器学习平台是干嘛的,如果你手握一堆数据,想从零开始训练一个大模型,整个过程可以分成三层,Angel 会在中间层发挥作用。

其中,底层 GPU、云服务器等计算硬件提供算力支持,中层是机器学习平台,负责处理数据、开发算法和执行训练任务,上层是训练好的大模型。

简单来说,Angel 机器学习平台可以把一堆杂乱的数据经过清洗、训练、加工等工序,变成一个强大的大模型。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

腾讯 angel 机器学习 gpu
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论