时间:2025-07-29 05:22 作者:墨罂粟
2025 GPU双雄拆解:英伟达Blackwell对阵AMD Radeon
本文由半导体产业纵横(ID:ICVIEWS)编译自eetimes
2025年是变革的一年。
与其他行业类似,半导体领域的产品开发周期也呈现出周期性迭代特征:每隔数年便会出现一次较大变革,而几乎每年都会有小幅更新。以智能手机处理器为例,这类产品虽每年都会推出新款,但细究之下便会发现,许多所谓的新款其实仅涉及知识产权(IP)模块的替换——比如更新CPU或GPU的版本,这便是行业内常说的大变化或小变化的具体体现。
智能手机处理器的集成度极高,除了核心的CPU、GPU和NPU之外,还包含众多辅助功能模块。其中既涵盖视频处理、音频处理、显示控制等基础多媒体功能单元,也集成了安全引擎、传感器中枢控制器等专用组件,这些模块共同构成了一颗完整的芯片。
若将芯片的构成划分为两大部分:一部分是CPU等核心处理器,另一部分则是上述各类外设功能模块。通常而言,外设模块的技术成熟度较高,多已实现商品化,因此在芯片迭代时往往可以直接沿用,无需随主芯片同步更换。我们通过持续对最新芯片进行开箱解析发现,当深入观察芯片的内部架构时,各家厂商在技术路线上的重大调整与差异化创新,都会变得清晰可辨。
每隔几年,芯片行业便会迎来一次标志性的技术革新——各家企业会对芯片的内部功能布局及终端配置进行全方位的重大调整。最具代表性的案例当属苹果芯片的迭代:从A12 Bionic到A13 Bionic,CPU的物理布局发生了显著重构(类似的重大调整在A16与A17芯片中同样可见)。联发科的Dimensity系列也呈现类似特征,从1000系列升级至9000系列时,不仅芯片外观焕然一新,各IP模块的布局也实现了突破性重构。
这类重大变革之后,芯片往往会进入持续演进阶段,主要通过升级CPU、GPU等核心IP(即“替换式演进”)实现性能提升。这一过程通常会整合Arm等IP供应商的CPU/GPU开发路线图,以及DRAM接口等底层技术的演进成果,最终形成一套适配多产品线的布局规划——这种模式对IP替换而言效率极高。NVIDIA与AMD的GPU产品同样遵循类似规律,每隔数年便会迎来或大或小的技术迭代。
2025年正是这样一个变革节点。据行业动态显示,NVIDIA计划在2025年第一季度推出基于全新Blackwell架构的GPU,AMD也将同期发布采用RDNA 4新架构的产品——两家企业的上一代产品均于2022年第四季度问世。本文将聚焦这两款新GPU展开解析,需要说明的是,文中将暂略VRAM接口通道数等细节参数,重点聚焦核心技术演进。
Blackwell 搭载的GeForce RTX 5000系列分析
图 1 呈现了我们对搭载 NVIDIA Blackwell 架构的 GeForce RTX 5000 系列部分产品的分析结果(其他型号虽已完成解析,但在此暂不赘述)。该系列的发布节奏延续了以往惯例:1 月推出高端型号,2 月发布中高端型号,4 月上市中端型号,7 月则推出入门级产品。
近年来,“由高至低” 的发布策略已成为行业常见模式—— 不仅是芯片领域,智能手机市场亦是如此。苹果、谷歌、三星电子等企业均采用这一路线:先发布 Pro 等高端机型,间隔数月后再推出入门款。例如,苹果 iPhone 16 Pro 计划于 2024 年 9 月发布,而 iPhone 16e 则预计在 2025 年 2 月登场;谷歌 Pixel 9 系列也将遵循类似节奏,先推出 Pixel 9 Pro,再发布 Pixel 9a。
搭载 NVIDIA Blackwell 的 GeForce RTX 5000 系列 来源:Techanalye 报告
入门款和中等级对比
图 2 展示了 NVIDIA Blackwell GPU 中所采用的 GDDR7 显存与上一代 GDDR6X 的芯片对比(入门级型号 GeForce RTX 5050 未纳入此次对比范围)。关于两者的具体参数在此不做赘述,但值得注意的是,其制造工艺与芯片尺寸均存在明显差异。此外,内部功能区域的布局分配也有显著不同:GDDR7 通过缩短内存访问长度实现了速度提升,与之相对的是,IO、放大器等组件的面积占比出现了明显增加,整体特性更接近高带宽显存(HBM)。
就目前情况而言,截至 2025 年第一季度,NVIDIA Blackwell GPU 仅采用了三星的 GDDR7 产品;不过据行业动态显示,2025 年下半年美光等厂商的 GDDR7 产品也将陆续上市。
Blackwell 全面采用的 GDDR7来源:Techanalye 报告
图 3 呈现了 NVIDIA Blackwell 架构下,中端型号 GeForce RTX 5060(5060Ti 采用同款芯片)与中高端型号 RTX 5070 的封装形态及芯片型号标识。NVIDIA 延续了 “从高端到入门级” 的芯片命名逻辑:GB205 对应 RTX 5070,GB206 对应 RTX 5060,而计划 7 月发布的入门级型号 RTX 5050 则以 GB207 为芯片标识。这些型号的芯片均标注了流片年份,且统一为 2024 年。作为全新研发的产品,其在 2024 年完成原型设计与性能评估后,已正式进入量产阶段。
Blackwell 架构的应用场景十分广泛,NVIDIA 不仅将其用于游戏 GPU 领域,还将其拓展至生成式 AI 领域(如 GB200、GB300)、汽车领域(DRIVE Thor)以及工作站领域(DGX SPARK),实现了同一架构在多领域的部署落地。
即便是定位中端的 RTX 5060,其芯片引脚也达到 2088 个球,这一设计旨在提升 VRAM 带宽与供电能力。值得注意的是,该GPU的球数已超过台式机 CPU:英特尔最新的 Arrow Lake 为 1851 个球,AMD 的 AM5 则为 1718 个球。
GeForce RTX 5060(5060Ti 是同一款芯片)和RTX 5070芯片上的封装和型号名称 来源:Techanalye 报告
高端与超高端的比较
图 4 展示了 NVIDIA Blackwell 架构下的高端型号 RTX 5080(芯片型号 GB203)与超高端型号 RTX 5090(芯片型号 GB202)。这两款显卡的芯片均为 2024 年流片产品,与前述中端型号的流片年份保持一致。
RTX 5080 与 RTX 5070 的引脚数量相同,不过 RTX 5070 存在部分未启用的球脚。这种设计被认为是通过封装标准化来实现成本控制的策略。而超高端的 RTX 5090,其引脚球数更是高达 5775 个,处于高端显卡中的顶级水平(不过我们已确认,目前球数最高的是 Apple M3 Ultra,达到 7478 个球)。
NVIDIA Blackwell 高端 RTX 5080 GB203 和超高端 RTX 5090 GB202 来源:Techanalye 报告
四款芯片对比
图5 展示了四款 NVIDIA Blackwell 芯片,入门级的 RTX 5050(GB207)未包含在内。这是一套由精简元素构成的可扩展芯片体系,其运算核心与缓存的数量、VRAM 接口通道数量均会根据型号定位进行缩减。而单个核心与 PHY(物理层接口)则保持不变,通过调整规模来形成不同版本。这种扩展设计还具备可复用测试模式的优势,能提升研发效率。
在这一系列中,定位最高的RTX 5090(GB202)芯片设计难度最大。它包含海量晶体管,随着芯片面积增大,功耗控制、噪声抑制以及时钟偏移调整等问题的复杂度也会同步上升。因此,最合理的研发路径是先攻克难度最高的芯片设计,再以此为基础进行精简调整—— 通常来说,芯片面积越大,功耗下降幅度越明显,时钟偏移调整也越棘手,这使得高端大芯片的产品频率往往会略低于小芯片型号。
NVIDIA Blackwell 的四款芯片,不包括入门级 RTX 5050 GB207来源:Techanalye 报告
图6显示了目前市场上两款晶体管密度最大的芯片。两款芯片的晶体管密度均超过920亿个。虽然由于制造工艺不同,两者并非同轴比较,但晶体管密度都超过了每平方毫米1亿个。对于智能手机而言,每平方毫米晶体管密度超过2亿个的芯片已经上市,而且我们可能很快就会看到2纳米和1.4纳米制程工艺的芯片密度超过3亿个。
NVIDIA Blackwell 的四款芯片,不包括入门级 RTX 5050 GB207来源:Techanalye 报告
与25年前的芯片相比
图7将25年前的NVIDIANV11(开发代号)与最新的RTX 5090进行了比较。各项数据都高出数千倍。从这些数字中可以看到25年来的演变。虽然未来步伐会有所放缓,但我们似乎仍将不断看到创新的身影。
NV11 与 RTX 5090 的对比 来源:Techanalye 报告
Radeon回归单芯片
图8展示了搭载AMD全新架构RDNA 4的GPU Radeon RX 9070 XT(右),该GPU于2025年3月上市,以及上一代RDNA 3 GPU Radeon RX 7800 XT(左)。最大的区别在于,上一代采用了多芯片组合的芯片,而新款RX 9070 XT则回归了单芯片。之所以回归,是因为上一代Radeon RX 6000系列是单芯片。
搭载RDNA 4 的 GPURadeon RX 9070 XT(右)和上一代 RDNA 3 GPURadeon RX 7800 XT(左)来源:Techanalye 报告
尽管CHIPLET 有其优势,但毫无疑问,芯片种类的增加会增加复杂性。虽然由于制造工艺不同,两者无法进行同轴比较,但通过使用单芯片,集成度提高了 90% 以上。目前,有必要具备一定的灵活性,以便在某一代芯片上使用 CHIPLET,然后在可行的情况下恢复到单芯片。AMD 拥有足够的灵活性。
*声明:本文系原作者创作。文章内容系其个人观点,我方转载仅为分享与讨论,不代表我方赞成或认同,如有异议,请联系后台。
1、对话蜜度研发副总裁:AI智能体正重塑办公校对新范式,度秘是百度公司研发的智能机器人助理
2、韩国环保型汽车累计注册量首次突破300万辆,韩国环保措施