3000亿参数大模型可本地运行,AMD布局AI推理市场,份额46.2%创历史新高

资讯21小时前发布 测试用户
9 0 0

> 随着人工智能进入智能体(Agent)时代,中央处理器(CPU)的角色正经历深刻重构。超威半导体(AMD)通过发布全球首款支持3000亿参数大模型本地运行的x86处理器,并辅以百亿美元生态投资,直接瞄准AI推理市场,试图在智能体浪潮中抢占算力制高点。## 硬件突破:全球首款支持3000亿参数的x86处理器2026年6月,AMD正式发布**锐龙AI Max+ PRO 400系列处理器**,旗舰型号Ryzen AI Max+ PRO 495采用16核32线程设计,最高加速频率达5GHz,集成基于XDNA 2架构的NPU,AI算力可达55 TOPS。!(blockview://markdown-image-tos-cn-i-tt/d7f88af75d114724a80a92ac2c19690c)该系列被定义为“全球首款可运行300B+ LLM的x86客户端处理器”,平台最高支持**192 GB统一内存**,并可提供最高**160 GB VRAM**,为多智能体和更大参数模型的本地部署提供底层支持。!(blockview://markdown-image-tos-cn-i-tt/94f1ff54929a4e5e95ccdc080d08a7ab)AMD表示,这些处理器面向商用台式机、移动工作站及迷你主机,专为复杂并发的智能体工作流优化。## 市场拐点:CPU需求激增与份额提升AMD董事会主席兼CEO苏姿丰指出,AI智能体时代需要CPU负责任务编排、调度和数据处理,GPU仅负责推理环节,导致数据中心CPU与GPU配比从过去的1:4甚至1:8向1:1靠拢。市场数据印证了这一趋势:- 2026年一季度,AMD在全球服务器CPU市场的营收份额达到**46.2%**,创历史新高。- 公司已将2030年全球服务器CPU市场规模预期上调至**1200亿美元以上**,年复合增速超过35%。苏姿丰在2026年一季度业绩交流会上强调,专门为Agent工作流服务的CPU需求增速最快。## 生态加码:百亿美元投资台湾AI基础设施为保障硬件产能与性能,AMD宣布在台湾地区AI生态系统投资**超过100亿美元**,聚焦先进封装技术。该投资旨在与日月光、矽品等合作伙伴开发下一代2.5D桥接互连技术,提升芯片互连带宽与能效,支持第六代EPYC CPU及Instinct MI450X GPU的量产。这些进展将确保AMD Helios机架级平台于2026年下半年准时部署,助力大规模AI系统扩展。台湾半导体产业借此迎来技术升级与产能扩张机遇。## 应用落地:从制造业到投资界的智能体革命实际应用案例展示了AMD硬件在业务中的价值。在AMD锐龙AI智能体应用创新大赛中,开发者曹冬冬基于搭载AMD锐龙AI Max+395处理器的笔记本,打造了完全离线的CNC非标智造报价系统,该系统已在真实业务中完成**超1万订单交付**,确保工业图纸不出本机。曹冬冬表示,该方案实现了一个人、一台笔记本让AI应用下沉到制造业基层。另一案例AInvestor智能投研系统,内置本地大模型和12个AI投研角色,将投资分析报告生成时间从几周压缩到几小时,目前已用于首发展衍至基金等真实投资机构。这些应用凸显了本地部署在数据安全和成本控制上的优势。## 软件赋能:开放平台降低开发门槛AMD持续完善其AI开发软件栈,开源平台**AMD ROCm**新增支持新一代锐龙AI 400系列处理器,并从ROCm 7.2版本开始扩展对Windows和Linux的兼容性,实现高效部署。在中国市场,AMD推出免费GPU开发者计划,并与阿里云魔搭社区合作,让开发者可直接在在线环境中选用AMD GPU运行AI任务,无需额外配置。阶跃星辰CTO朱亦博分享称,其2000亿参数Step 3.5模型经过压缩后,可在AMD笔记本上完整运行,推理速度接近每秒100个token,本地推理token成本趋近于零。AMD的布局不仅限于硬件发布。2026年5月,AMD在上海举办首次北美以外的AI开发者大会,超2000名开发者参与,苏姿丰与零一万物CEO李开复对话探讨AI智能体新范式。李开复指出,中国企业出于数据主权需求,更倾向本地化部署方案。AMD还推出“智能体主机”新品类,惠普、华硕等合作伙伴已推出超过35款相关产品设计,支持高达200B参数模型的本地运行。随着智能体时代对本地算力需求的增长,AMD通过硬件创新、生态投资、应用落地和软件支持的全方位战略,正试图在AI推理市场构建竞争壁垒。这场变革可能重塑从云端到边缘的算力分布,为开发者和企业提供更灵活、安全的AI解决方案。

© 版权声明

相关文章

暂无评论

none
暂无评论...