用给化石算命!别笑想法上了
6月份,AMD发布全新的锐龙9000系列桌面级处理器、X870/X870E系列芯片组以及面向AIPC的锐龙AI300系列移动级处理器平台之后,用户对于AMD新平台的期待值可谓是日益高涨,只等新平台全面上市。
而就在上周(美国西部时间7月9日-10日),AMD举办了一场“AMDTECHDAY”技术分享活动,在新平台上市之前,让我们对其有了更加深入的了解。
·AMD锐龙9000系列处理器全面升级
7月31日,AMD锐龙9000系列桌面级处理器将与大众用户见面,它能够提供具有领导性的性能体验,超凡的能效表现,极致的超频体验以及更长的平台寿命,是迄今为止AMDZen架构处理器的集大成一代。
锐龙9000系列基于Zen5架构打造,新架构带来出色的性能体验以及优异的能效表现。同时它支持PCIe5.0以及更高频率的DDR5内存,而沿用AM5接口则体现了更长的平台寿命。同时AMD表示,AM5平台将延续到2027年之后,大大降低了未来用户焕新升级的成本。
在7月份即将上市的新品序列中,首发主要包含了四个型号:锐龙99950X、锐龙99900X、锐龙79700X以及锐龙59600X,其具体参数如下:
AMD锐龙99950X是本次新品的最高型号,采用16核32线程设计,频率加速最高达到5.7GHz,总缓存(L2 L3)高达80MB,默认TDP为170W。
锐龙99900X,12核24线程设计,5.6GHz加速频率,总缓存76MB,默认TDP120W。
性价比更高的锐龙7和锐龙5家族各有一款新品,分别为锐龙79700X以及锐龙59600X,前者为8核16线程设计,后者为6核12线程设计,加速频率分别为5.5GHz和5.4GHz,缓存容量分别为40MB和38MB,默认TDP均为65W。
全新的锐龙9000系列在性能体验上非常出色。以锐龙99900X为例,参考酷睿i9-14900K的生产力与内容创作性能以及游戏性能,锐龙99900X在生产力与内容创作方面,最少领先2%(ULProcyonOffice),最多领先41%(HandBrake编解码)。
游戏方面,锐龙99900X最少领先4%(无主之地3),最多领先22%(地平线:零之曙光),并且在《赛博朋克2077》、《F12023》等画质级大作上领先幅度超过13%,能够胜任更加重度的游戏负载,并为其提供出色的画面流畅度。
对位酷睿i7-14700K的锐龙79700X,在生产力与内容创作以及游戏性能方面,同样有着更加出色的表现。在生产力与内容创作性能上,锐龙79700X最少领先4%(7-Zip压缩解压缩)、最高领先42%(HandBrake编解码);游戏方面最少领先4%(无主之地3),最高领先31%(地平线:零之曙光)。
锐龙59600X同样如此,在对位酷睿i5-14600K时,生产力与内容创作性能最少领先8%(ULProcyonOffice),最高领先达94%(HandBrake编解码);游戏性能方面最少领先5%(杀手3),最高领先29%(地平线:零之曙光)。
从官方给出的数据来看,锐龙9000系列桌面级处理器在视频编解码性能方面获得了极为显著的强化,同时在应对大型3D游戏时,也能够带来更加稳定流畅的画面帧数表现。
性能表现优异的全新的Zen5架构为锐龙9000系列带来了更加出色的能效表现,这意味着锐龙9000系列可以在较低功耗状态下,就能够达到与老款处理器同级或越级的性能表现。
以官方给出的锐龙79700X为例,在游戏性能方面,这颗处理器在65W功耗下,平均比105W功耗的第一代3DV-cache处理器锐龙75800X3D快12%!
锐龙9000系列桌面级处理器通过15%的热阻改善,使得同等TDP下,获得了7℃左右温度降低,因此耗电量更低,温度和噪音控制也更加出色。
对比锐龙7000系列,锐龙9000降低了锐龙99950X以下所有型号的TDP,但性能却得到全方位的提升,最低为11%,最高达到了22%。
当然,锐龙9000系列不仅仅在于处理器自身性能与能效等方面的升级,整个平台级的性能提升才能给用户带来更好体验。
因此在内存超频方面,更新AGESA之后将支持DDR5-8000超高速内存;同时支持新的运行中内存超频以及内存优化性能配置文件功能;而且所有AM5消费级芯片组上都可启用内存超频,同时JEDEC支持DDR5-5600。
新平台在Overdrive一键超频精度方面也得到了显著提升,如果用户希望优先考虑性能效率,特别是多线程工作负载,那么启用PBO后在较低的默认TDP下可以获得额外的性能提升空间。其中锐龙99900X为6%,锐龙79700X为15%,锐龙59600X为6%。
对应锐龙9000系列,AMD推出了全新的800系列芯片组。包含X870E、X870、B850以及B840,其中X870E和X870芯片组集成了USB4控制器,支持PCIe5.0;B850支持PCIe5.0的NVMe接口以及PCIe4.0的显卡接口,支持20Gbps速率的USB3.2。而B840为PCIe3.0以及10Gbps的USB3.2。
AM5平台在AI性能方面也有着极大幅度的提升。其被定义为内容创作、开发、生产力发烧友的终极AI平台。
AM5平台可以提供极为出色的图形性能,以应对AI大模型的算力需求,同时它具备更高的存储带宽速率,以提供更加快速的存储能力。通过锐龙99900X平台与酷睿i9-14900K平台对比可以看出,锐龙99900X在AI大模型算力方面高出1倍;PCIe5.0SSD写入速度高出58%。
在大语言模型AI加速方面,得益于AVX512以及VNNI的卓越性能加速支持,锐龙99900X在Llama大模型速度方面比i9-14900K快17%,Mistral速度快20%,AI性能表现优异。
全新的锐龙9000系列桌面级处理器在提供更加出色的性能的带来了更加优异的能效表现,同时在AI加速、内容创作与生产力综合表现以及游戏体验等方面,相比锐龙7000系列以及竞品而言都有了显著提升。在更加出色的内存超频加持下,锐龙9000系列将为用户提供平台级的性能跃升。
·富有灵活性的AMDZen5架构
到这里,我们有必要来看看AMDZen5架构到底有怎样的优势?
AMDZen5架构在基础核心架构方面做了四大升级:
其一,每个周期交付更多指令;
其二,调度和执行宽度扩大;
其三,缓存数据带宽加倍;
其四,强化AI加速能力。
在分支预测方面,Zen5架构具有高级分支预测的流水线取指特性,它实现了更低的延迟,更高的精度以及更大的吞吐量。改善了指令缓存延迟以及带宽,并且支持双解码流水线。
在调度和执行方面,Zen5架构拓宽了dispatch/retire(调度和引退)的宽度,集成了更加统一的ALU调度器以及更大的执行窗口,因而改善了调度和执行效率。
Zen5架构还增加了数据带宽,支持48KB12路L1数据缓存4周期加载,L1缓存和浮点单元带宽加倍,同时改进了数据预取。
此外为了提升整个处理器的AI性能,Zen5架构的AVX-512指令集具有完整的512位数据路径,同时提供了6条双周期延迟FADD流水线,并且支持更多数量的FP指令。
在这些特性加持之下,Zen5架构相对于Zen4架构来说,IPC平均提升幅度达到了16%。同时其机器学习性能提升32%(单核),AES-XTS加密算法性能提升35%(单核)。
Zen5架构有着非常不错的扩展性。更快、更小、更低功率的晶体管使得性能、能效得到优化;AMD与TSMC4nm、3nm制程技术进一步深度合作,从而覆盖到桌面、服务器、客户端以及嵌入式等各类硬件平台。
因此,Zen5架构不仅包含有锐龙9000桌面级处理器,更是有第五代EPYC处理器以及第三代AMD锐龙AI,也就是StrixPoint移动级处理器。
·锐龙AI300系列不妥协的AIPC解决方案
StrixPoint,用给化石算命!别笑想法上了也就是全新的锐龙AI300系列移动级处理器,AMD对其定义为“完整的、无妥协的AIPC解决方案”,再加上它的型号中直接带有“AI”字样,足见AMD对AI领域的重视。
此前,我们对新处理器的命名规则做过解释,这里不妨再来回顾一下:
以AMD锐龙AI9HX370处理器为例,AMD锐龙AI是品牌名,从中不难看出AMD着重强化了AI属性。接下来的9HX代表了处理器的等级,数字越大性能越强,尾缀的37代表系列,0代表SKU。除了锐龙AI9HX370之外,本次锐龙AI300系列的另外一款型号为锐龙AI9365。
台北电脑展上,AMD公布的锐龙AI300系列处理器包含了AMD锐龙AI9HX370以及锐龙AI9365两个型号,本次活动并未公布更多新的型号,因此首发阵容方面大概率就是这两款处理器了。
前者采用12核24线程设计,加速频率最高5.1GHz,总缓存36MB,NPU算力提升到了50TOPS,iGPU升级到了Radeon890M。后者则是一颗10核20线程处理器,加速频率最高为5GHz,总缓存34MB,NPU算力同样为50TOPS,iGPU型号为Radeon880M。
锐龙AI300系列处理器将为轻薄本、游戏本、设计师电脑、商务和中小企业笔记本以及移动工作站这些主流设备提供支持,体现了其设备生态的多样性。
性能方面,AMD锐龙AI9HX370对比英特尔酷睿Ultra9185H以及高通骁龙XEliteX1E-84-100,在PCMark10、ULProcyon等生产力性能方面都有着明显优势。
另外大家喜闻乐见的CINEBENCH单核/多核性能方面,锐龙AI9HX370相比竞品而言也有着更加亮眼的表现,尤其在多核性能方面实现全面领先。此外在Blender3D渲染性能方面,锐龙AI9HX370实现了高达3.8倍极大幅度的领先。
游戏性能方面,得益于RDNA3.5架构的全新RadeoniGPU,锐龙AI300系列处理器相比竞品也有着显著优势,在《孤岛惊魂6》、《古墓丽影:暗影》、《无主之地3》、《GTAV》、《赛博朋克2077》等主流游戏上表现优异,可以为玩家带来更加流畅的游戏体验。
作为“无妥协的AIPC解决方案”,锐龙AI300系列处理器与行业伙伴深度合作,为Copilot PC提供性能强大的硬件解决方案,深度支持各类系统级AI应用,同时更好地赋能Acer、华硕、惠普等OEM厂商的各类自研AI应用。
非常好用的AIGC软件AMUSE的2.0Beta版本也将在7月28日上线,这是一款支持文生图、图生图、绘画生图的超级简单好用的AIGC工具,其绘画生图功能将适配搭载锐龙AI300系列处理器的华硕灵耀16Air的触控笔功能,让AI绘画更加简单。
锐龙AI300系列处理器拥有完全的生态系统兼容性,有着完整的PC类型组合,全方位支持Copilot以及第三方AI软件,同时具备优异的性能表现以及全天候的续航能力。
·RDNA3.5以及XDNA2让iGPU与NPU性能显著提升
在锐龙AI300系列处理器平台中,有两大非常重要的架构更新,一个是针对iGPU的RDNA3.5,另一个是针对NPU的XDNA2。再加上针对CPU的Zen5,三大架构革新,使得锐龙AI300系列处理器真正成为“无妥协的AIPC解决方案”。
基于RDNA3.5架构的全新iGPU让人颇为期待。目前来看,它主要包含Radeon890M和Radeon880M两种型号。新架构计算单元升级到了16个,优化了每瓦的性能表现,优化了每bit的性能表现,同时通过优化电源管理带来更长的电池续航能力。
架构优化之后,锐龙AI300系列处理器的iGPU图形性能获得了较为明显的提升。在3DMarkTimeSpy以及NightRaid测试中,相比上一代而言,在相同的15W功耗下,图形性能分别提升32%以及19%。
XDNA2架构则为锐龙AI300系列处理器的NPU带来了指数级的性能提升,这使其算力达到了50TOPS,相比现役的锐龙8040系列的16TOPS而言是指数级增长。
对于AIPC来说,NPU的重要性伴随着大模型规模和多样性增长显得越来越重要,它已经成为AIPC系统不可或缺的部分。全新的NPU在AI模型算力方面带来了高达35x的每瓦性能提升,这使得基于锐龙AI300系列处理器打造的AIPC具备更加高效的AI计算能力。
根据AMD官方信息来看,2024年将有超过150家AI赋能的、不同应用领域的ISV为新一代AIPC带来全新体验。
锐龙AI300系列处理器的NPU支持BlockFP16数据类型。它兼顾了INT8的速度与FP16的精度,相比快而不精确的INT8以及精确而不够快的FP16来说优势明显。在当前绝大多数AI应用都采用16-bit设计的情况下,锐龙AI300系列处理器可以为这些应用提供既快速又精确的计算体验。
·结语
通过Zen5、RDNA3.5以及XDNA2三大核心架构革新,AMD借助其架构的灵活性与可扩展性,为行业带来了包括桌面级、移动级以及服务器终端设备的全新锐龙处理器平台覆盖,在生产力、内容创作、游戏、AI计算等方面为用户带来了全新体验,同时通过多种形态的终端设备触达各行各业,为不同领域、不同需求的用户提供了极其丰富的选择。这些基于底层架构的革新,让我们看到了AMD在芯片领域的超凡技术实力。