(全球 TMT2025 年 2 月 13 日讯)移远通信基于边缘计算模组 SG885G,已成功实现 DeepSeek 模型的稳定运行,并完成了针对性微调。目前,该模型正在多款智能终端上进行深入测试与优化。DeepSeek 在模型架构、蒸馏技术以及强化学习等方面实现了突破性创新,完整版 DeepSeek-V3 模型采用创新的 MoE 架构,拥有 6,710 亿参数,擅长处理复杂任务和高精度场景。同时,DeepSeek-R1 版本通过高效蒸馏技术,将大模型的推理能力迁移到更小、更高效的版本中,成为端侧部署的理想选择。
移远通信搭载高通 QCS8550 平台的边缘计算模组 SG885G,成功实现了 DeepSeek-R1 蒸馏小模型的稳定运行。实测数据显示,其生成 Tokens 的速度超过每秒 40 个 Tokens,且未来随着性能的不断优化,速度还将进一步提升,为智能终端设备带来更强大的 AI 能力。此外,在成功实现 DeepSeek 模型端侧运行的基础上,移远通信还完成了该模型的针对性微调,并应用于自身的大模型解决方案中,为客户提供更精准、更高效的端侧 AI 服务。
登录后才可以发布评论哦
打开小程序可以发布评论哦