新闻速览:
工厂自动化、移动机器人中的物理 AI 以及其他 AI 驱动的边缘应用正在快速演进,并推动着对于能在始终在线环境里提供实时 AI 处理、确定性能与长期可靠性的计算平台的需求。
为了满足这些需求,AMD 正扩展其 AMD 锐龙(Ryzen™)AI 嵌入式 P100 系列处理器产品组合。与此前发布的采用相同紧凑型球栅阵列(BGA)封装的 P100 系列处理器相比,新款处理器可提供最高 2 倍的 CPU 核心数量、最高 8 倍的图形处理单元(GPU)算力,且系统级每秒万亿次运算(TOPS)性能预计提升 36%。①
新款 P100 系列处理器支持 AMD ROCm 软件,为开发人员和系统设计人员提供了更丰富且可扩展的、面向高能效边缘计算解决方案的产品组合。这些处理器可支持从视觉到控制到推理的实时 AI、提供先进的图形处理能力,同时还支持工业温度范围(−40°C 至 105°C)、7×24 小时连续运行以及 10 年产品生命周期。
为高要求应用提供可扩展的 AI 算力
该处理器具备 8 至 12 颗“Zen 5”核心、用于物理 AI 加速的最高可达 80 TOPS 的系统级算力、用于实时可视化的 AMD RDNA™ 3.5 图形处理能力,以及基于 AMD XDNA™ 2 架构、面向低时延且高能效 AI 推理的神经处理单元(NPU)——所有功能均集成于一颗芯片中。
从用于智慧工厂的工业 PC到自主机器人和医学成像设备,新款 x86 嵌入式处理器针对下一代工业和更广泛的边缘 AI 用例进行了优化。这些用例包括:
与上一代 AMD 锐龙嵌入式 8000 系列相比,P100 系列预计可提供最高提升 39% 的多线程性能和最高提升 2.1 倍的系统级总TOPS②。与现有 P100 系列相比,新款处理器提供了卓越的 AI 每瓦性能,并可支持近 2 倍数量的虚拟机以及更大规模的大语言模型(例如 Llama 3.2-Vision 11B),从而推动更先进的 AI 与混合型工作负载。
ROCm 软件支持与虚拟化参考堆栈
对 AMD ROCm 开放软件生态系统的支持,为嵌入式应用带来了一套业经验证的开源 AI 软件栈。开发人员可以在依赖开源编译器、运行时和库的同时运行标准 AI 框架,并且无需重写代码即可即时访问适用于嵌入式的模型。在编程层面,ROCm 软件采用开源的 HIP (Heterogeneous-computing Interface for Portability),将 GPU 编程从硬件中解耦,消除了软件栈和硬件之间的供应商锁定。
紧密集成的 CPU、GPU 和 NPU 架构能在混合工作负载下实现高效的工作负载分配,并确保可预测的时延;同时,使用熟悉的框架和软件栈有助于在广泛的用例中简化和精简开发与部署。这种集成水平还能在无需额外外部组件的情况下实现先进的计算与图形处理能力,使 OEM 厂商和系统集成商可以更轻松地设计可扩展的平台。
AMD “Zen 5”CPU 核心提供了隔离能力和充足的性能裕量,可以在单个平台上以确定性的多任务方式整合多个关键工作负载。此外,AMD 还为工业领域的混合关键型应用提供了一个封装式、垂直整合的虚拟参考堆栈。该堆栈基于 Xen 虚拟管理程序构建,可在隔离域中运行 Linux®、 Windows®、Ubuntu® 和 RTOS 环境,从而实现安全性、实时性能与灵活性。最终形成一个可扩展的、开放的架构,为下一代嵌入式系统简化设计并加速开发。
取得强劲业界支持
目前,来自全球原始设计制造商(ODM)合作伙伴、基于 AMD 锐龙 AI 嵌入式 P100 处理器的量产解决方案现已可供选用,合作伙伴包括研华科技(Advantech)、康佳特(congatec) 和控创(Kontron)。
Aaron Su,研华科技嵌入式物联网事业群副总裁
Florian Drittenthaler,congatec 产品线经理
Thomas Stanik,控创高级销售与业务发展经理
配备 8 至 12 颗核心的 AMD 锐龙 AI 嵌入式 P100 系列处理器现已提供样品,预计将于2026 年 7 月开始量产出货。P100 系列 4 至 6 核处理器目前也已提供样品,预计将于 2026 年第二季度量产。
# # #
1 基于 AMD 工程预测或截至 2026 年 2 月的早期测量结果的初步性能估算,可能会有所变更。GD-247a
2 基于 AMD 于 2025 年 11 月进行的内部分析,比较了 AMD 锐龙 AI嵌入 P100 系列处理器的预期 TOPS 规格与 AMD锐龙嵌入式 8000 系列处理器的已公布 TOPS 规格。REP-001