自从 AMD Zen 架构登陆移动端后,其锐龙 4000、锐龙 5000 系列中的 Vega 核显、锐龙 6000、7000、8000 系列中的 RDNA 2/RDNA 3 架构核显凭借着同时代下优秀的实际性能表现和终端产品上更高的性价比," 核显 " 成为了一直以来大家关注 AMD 锐龙处理器时的焦点,也是不少人选择 AMD 锐龙处理器的重要原因之一。
本代的 AI 300 系列处理器在核显方面有着较大的升级,旗舰型号 AI 9 HX 370 中的核显代号改为了 Radeon 890M,架构由前两代的 RDNA 3 升级为了 RDNA 3.5,规格也从 12Cu 升级到了 16Cu,升级幅度着实不小,那么它的性能如何?和独立显卡比又如何呢?
CPU 部分,Strix Point 也有较大程度的革新,使用到了同架构大小核的设计,旗舰型号 AI 9 HX 370 共拥有 4 个 Zen5 大核 +8 个 Zen5c 小核心,24 线程,AMD 锐龙在消费级首个将被大面积搭载的大小核心架构处理器表现又是怎样的呢?
本次用来测试 AI 9 HX 370 的机型定位是高端轻薄本,主打的是高阶质感 + 静音体验,Stress FPU 单烤时的功耗为 28W,风扇噪音非常安静,并不是目前市面上主流级轻薄本的性能释放水平,所以这台产品中的 AI 9 HX 370,性能表现可以被视为一个比较基础的成绩,在大部分性能释放更高的机型中,无论理论性能还是实际表现肯定会比它更好一些。
一、AI 9 HX 370 核显部分
首先来看下 Radeon 890M 在 3DMARK 中的性能表现,代表 DX11 性能的 Fire Strike Extreme 得分 4205 分,代表 DX12 性能的 Time Spy 得分 3275 分。
另外,测试机型具备手动分配显存的功能,可手动分配 1GB、2GB、4GB 和 8GB 的显存,在分配了 8GB 显存后,Fire Strike Extreme 得分 4284 分,Time Spy 得分 3489 分。
以 Time Spy 的得分为例,先来看看 Radeon 890M 相比于上代的 Radeon 780M 有多大的提升。
测试机型中的内存频率为 LPDDR5 7500MHz;对比搭载了 R7 7840HS 的机型,内存频率为 LPDDR5 6400MHz,单烤 Stress FPU 性能释放 54W,在这种情况下 Radeon 780M 的 Time Spy 跑分大致为 2900 分左右,也就是说在功耗差距接近一倍的情况下,Radeon 890M 相比于 Radeon 780M 就已经有了 13%~20% 左右的性能提升,而如果是同样在功耗释放比较宽泛的机型中,Radeon 890M 的 Time Spy 跑分能够达到 3700~3800 的水平,提升幅度会达到 27.5%~30% 左右,很接近从 12Cu 提升到 16Cu 三分之一的规格提升了。
不过,Radeon 890M 可不仅仅是规格提升了,架构也升级了呀,虽然并不是从 RDNA "3" 提升到 RDNA "4" 的代际提升,但是 RDNA "3.5" 怎么也算半代的升级啊,再加上增多了三分之一的核心数量,怎么看都应该是至少 33% 往上的性能提升,可实际的性能表现和预期存在一定的距离,这是怎么一回事呢?
这是由于内存带宽喂不饱 Radeon 890M 的高规格核显,虽然 LPDDR5x 7500MHz 的内存已经是相当可观了,但是对于 " 显存 " 来说,双通道 LPDDR5x 7500MHz 还是不太富裕的,远没有独显上的 GDDR6/GDDR6x 显存来的猛,Radeon 890M 上面又没有 AMD Infinity Cache,所以内存成为了 Radeon 890M 的瓶颈,造成了它的性能表现并没有预期来的那么强,这也很好的说明了为什么在手动分配显存后,拥有了专用显存的 Radeon 890M 在 Time Spy 中会有一定的性能提升了—— Radeon 890M 获得了一部分只可以自己取用的内存,而不是与 CPU 共享。
LPDDR5-7500MHz 内存带宽 / 延迟测试
反映到实际游戏上面,如果是在本身就对于 CPU 和内存带宽要求比较高的游戏中,例如 PUBG,那么 Radeon 890M 与 CPU 互抢内存带宽的情况就会加剧,更加吃不饱的 Radeon 890M 帧数表现与上一代的 Radeon 780M 差距就会更被缩进了。
由于我拿到机子之后测试时间有限,只来得及测试了两款 3A 游戏,分别为《古墓丽影:暗影》与《赛博朋克 2077》
在《古墓丽影:暗影》中,1080P 低画质,运行游戏内的 BenchMark:
显存自动:平均帧 61;
分配 8GB 显存后:平均帧 62。
在赛博朋克 2077 中,1080P 低画质,打开 AMD FSR 2.1 至性能档位,运行游戏内的 BenchMark:
显存自动:平均帧 68.21 帧;
分配 8GB 显存后:平均帧 68.93 帧。
在大部分 3A 游戏中,压力基本都集中在 GPU 而不是 CPU,所以在这两款 3A 游戏中我们并没有看到在手动分配专用显存后,Radeon 890M 有什么帧数上面的差距。两款游戏的帧数就权当是给大家做一个参考了。
接着我们再来看看 Radeon 890M 的 Time Spy 跑分能够与哪几款移动端的独立显卡进行比较,直接看图:
移动端的 GTX 1650 在 50W 功耗下,Time Spy 得分 3450 分左右;50W 的 1650Ti Time Spy 跑分在 3750 分左右;50W 的 RTX 2050 得分在 3850 分左右;末代 MX 系列旗舰 MX570 在 30W 时 Time Spy 在 3100 分左右。
从 Time Spy 的跑分来看,Radeon 890M 的性能表现在 28W 时就已经可以齐平 GTX 1650 了,超出了 MX570;而如果是在高功耗的机型中,Radeon 890M 可以达到 GTX 1650Ti 或者 RTX 2050 的性能,基本和 NVIDIA 图灵架构、安培架构的入门级独显相当了。
二、AI 9 HX 370 CPU 部分
当然各种场景下并不能光看显卡,处理器也是至关重要的,Strix Point 这次在 CPU 部分也进行了革新,采用了大小核设计,不过与英特尔的异构大小核不同的是,Strix Point 为同架构大小核心,具体到 AI 9 HX 370 上,共 4 个 Zen5 大核心(最大睿频 5.1GHz)+8 个 Zen5c 小核心(最大睿频 3.3GHz),均支持超线程,4 个 Zen5 核心为一个 CCX,8 个 Zen5c 核心为一个 CCX。其中 4 个 Zen5 大核心共享 16MB L3 缓存,8 个 Zen5c 小核心共享 8MB L3 缓存,每个 Zen5/Zen5c 核心均提供 1MB L2 缓存。
这样的架构设计显然会提供更强的多核心性能,毕竟拥有高达 12 个支持超线程的核心,在 CINEBENCH R23 和 CINEBENCH 2024 中,多核成绩分别为 17451 分和 960 分(同样的,这是 28W 性能释放的表现)。
单核方面在 Zen5 架构的支持下同样有不小的提升,CINEBENCH R23 和 CINEBENCH 2024 中的单核成绩分别为 1909 分和 111 分。
如果您是专业软件用户,那么恭喜您,全新的 AI 300 系列处理器很有可能让您享受到更好的性能表现,两个 CCX 之间的核心延迟、8 个 Zen5c 核心过小的 L3 缓存都不怎么会影响到这方面的性能表现,完全可以吃到大小核架构提供的多核性能红利。
而如果您在寻求游戏表现或所需应用对缓存与内存带宽比较敏感,那么核心占用在 4 个以内的游戏或应用,通过手动限制跑在 4 个 Zen5 大核上则会有更好的表现,而如果说核心占用需要大于 4 个核心,那么 8 个 Zen5c 过小的共享缓存以及两个 CCX 之间的核心访问延迟,则会拖累性能表现。所以如果是比较喜欢折腾的朋友,对自己经常使用的应用或经常玩的游戏手动限制一下负载核心,然后前后对比一下,可能能够寻求到更好的性能表现,毕竟大小核心的调度问题,从 12 代酷睿开始就用上大小核的英特尔也不能说是整明白了,这是老大难问题了,也不能过于苛求 AMD 一上来就做得很好。
三、写在最后
虽然本篇文章几乎一半都在 " 唱衰 "Strix Point,指出它身上存在的一些问题,但是不可置否的是,其 CPU 性能和核显性能在绝大多数场景下,依然是是当下最好的选择之一,无论对比上代还是来自隔壁同样为旗舰级处理器的竞争对手,它都能够提供更好的性能表现。
而本代 AI 300 中需要改进的点也非常的显而易见,规格出众的核显由于内存带宽问题在部分场景中性能受限、双 CCX 之间核心访问延迟较大、Zen5c 核心共享的 L3 缓存过小、大小核心的优化与调度需要继续精进,这四个问题相信也是接下来 40Cu 的 Strix Halo(不过它是全大核心设计,并没有采用大小核心设计)以及后续迭代产品中需要 AMD 重点解决与优化的对象,希望我们在之后可以看到补足短板后的 AMD 锐龙产品吧!
登录后才可以发布评论哦
打开小程序可以发布评论哦