{“UploadId”:”v03a62g10003d8tvtrqljht6ths5ht7g”,”Duration”:1344.611,”SourceProvider”:”readtt”,”ContentType”:1,”Extra”:{“audio_text”:”今天我们要聊的是,现在有哪些适合在家里跑大型语言模型的迷你主机。比如像 DeepSeek R1 235B 这种千亿参数的大模型,到底能不能在咱们自己的桌面上跑起来?对,这个话题最近真的很火,那我们就直接进入今天的讨论吧。咱们先来看看,作者现在用的开发环境是什么样的,然后他在日常使用中会遇到哪些实际的问题?他现在用的是Mac M4 Pro,六十四 g 的内存嗯。可以在本地跑Qwen量化的三二B模型,就是做一些小的测试啊,或者说一些边缘的任务是可以的,但是你要想做大的项目就不行了。他对于硬件的升级是怎么打算的?他的想法是到二零二六年再说。他现在还没有打算说,要升级到Strix Halo平台嗯嗯,虽然AMD是可以跑Deepseek R一的,但估计是量化版本,而且他的内容存储有八十五个g。运行起来应该也不会很快,所以就是能跑但是不流畅。那现在市场上的其他选择呢,国内的品牌和英伟达的产品,他怎么看?他觉得国内的这些迷你主机。虽然价格便宜,但是没有采用统一内存,所以整体的性能还是比不过这些原厂的大品牌嗯哼。然后英伟达的产品虽然说性能很强,但是价格还是偏高啊,他是说如果等到过年的时候能降到两万元以内,才会考虑。看来他对硬件的选择还是很有自己的想法的。那 AMD 最近新发布的这个 Ryzen AI Halo 迷你主机。它到底有哪些亮点?这个是在二零二六年六月十三号发布的,是AMD第一次推出自有品牌的AI开发者迷你工作站。它里面装的是Ryzen AI Max+三九五,这个其实不是一个全新的芯片啊。哦,那除了硬件之外,这套设备在软件方面有什么特别的吗?它是预装了完整的ROCm AI开发栈,还有标准化的千亿模型调校方案的。所以它是一整套的软硬件一体化的方案,不是说简单的换了个外壳而已哦。而且它的统一内存最大支持到一百二十八GB,就可以在本地离线跑DeepSeek R一的两千三百五十B的大模型。明白了,那如果说用户要去选购搭载了 AMD Ryzen AI Max+ 395 的设备,有哪些不同的机型可以选呢?如果你的预算有限,而且就是放在桌子上固定使用的话。极摩客的EVO X二是最划算的,它的价格是在一万六到一万九之间嗯嗯。要是你经常要带着电脑出门,或者说你想要用它来做一些触摸的创意工作。那可以考虑ROG幻X二零二五,它是一个二合一的笔记本电脑,一点二公斤非常的轻,而且顶配是一万六千九。那如果是专业做AI开发的人呢,有没有更合适的选择?如果说你是一个专业的AI开发者,需要官方的优化和双系统,那可以等AMD原厂的Ryzen AI Halo,它是三千九百九十九美元,大概就是两万七左右,虽然贵但是它是专门为开发者做的,有双系统和官方的技术支持没错。要是你主要是做CUDA的绘图和模型微调,那英伟达的DGX Spark是最好的,但是它的价格更高,而且在国内没有很好的Windows的支持。还有一些用户可能是苹果生态的,或者说预算比较有限的,那他们该怎么选呢?如果说你是苹果生态的,只是要跑七十B以下的模型,而且对噪音和功耗比较敏感,那可以选Mac Mini M四Pro六十四GB,它是一万多块钱是的。要是你的预算在一万块钱以内,只是想要体验一下本地的AI,那可以选铭凡或者零刻这种普通的锐龙迷你主机,但是它们是跑不了千亿参数模型的。好的,咱们已经聊了很多关于硬件选择的内容,然后我们来科普一下一些基础的概念,比如说什么是Ryzen,什么是APU,什么又是统一内存,它们之间到底有什么区别?Ryzen其实是AMD的一个消费级处理器的品牌。它这个名字是由Rising和Horizon这两个词组合而来的,官方的中文名字叫锐龙哦。然后Zen呢是CPU的一个底层的架构的代号。这两者是不能直接划等号的。原来是这样啊,那APU这个东西到底特别在哪?APU的全称是加速处理器,它是AMD在二零一一年的时候推出的一个芯片品类OK。它的特别之处就在于,它是把X八六的CPU和高性能的RDNA的GPU,还有独立的NPU都集成在了一块芯片上面,然后它们可以共享同一个内存池。这样就解决了以前CPU的内存和显卡的显存之间的那种性能瓶颈。这么说的话,那是不是其他的芯片,比如说像集成显卡,或者说像苹果的M系列,也跟这个APU差不多呢?从原理上来说是有相似的地方,但是只有AMD的这种产品才被官方叫做APU哦。然后现在APU的旗舰级的标准呢,就是它得是Zen五的CPU,满血的RDNA三点五的GPU,然后支持最高一百二十八GB的LPDDR五X的统一内存,并且它的功耗是在四十五到一百二十瓦之间可调度的。像Ryzen AI Max+三九五就是目前消费级里面最顶级的APU了。哦,那统一内存这个东西到底对本地跑大模型有多大的影响?影响非常大,因为传统的独立显卡,比如说RTX五零九零它只有三十二GB的显存。你要跑一个七十B以上的模型,就必须要频繁的从硬盘里面交换数据,所以就会非常的卡嗯哼。而像Ryzen AI Max+三九五这种,它是有一百二十八GB的LPDDR五X的统一内存,它可以把最高九十六GB的内存当作显存来用。所以它可以在单设备上面直接把两千三百五十亿参数的MoE模型全部都加载进去,不需要任何的多卡拼接或者说硬盘交换,所以它的速度会快很多。懂了懂了,那我们接下来就重点看看,AMD的这几款,搭载了Ryzen AI Max+三九五的机型,比如说这个极摩客的EVO X二,它作为全球首款桌面形态的Strix Halo整机,它到底有哪些核心的硬件优势?它是在二零二五年的五月份上市的,然后它最大的亮点呢,就是它是完整的配备了这个旗舰级的APU,Ryzen AI Max+三九五,然后是原生的一百二十八GB的LPDDR五X的统一内存哦,所以它是可以长时间的稳定在一百二十瓦的满功耗下运行的。即使你长时间的跑这种千亿参数的大模型,它也不会出现降频的情况。听着很不错啊,那在价格和购买渠道方面,它有什么特点呢?它是一万六到一万九,就可以买到一百二十八GB加两TB的配置,而且它是在京东和天猫的官方旗舰店都有现货的嗯嗯。另外它的优点是价格低,散热强,然后是国产的嘛,所以它的售后也非常的方便,Windows的系统也是原生适配的。缺点呢就是它只预装了Windows,你要自己去手动配置ROCm的环境,而且它没有官方的开发者的技术支持。明白了,那这个ROG幻X二零二五呢,它又有哪些核心的硬件优势?幻X二零二五其实是在二零二五年的二月份就已经首发了,它同样也是采用了这个Ryzen AI Max+三九五的APU,然后最高可以选到一百二十八GB的定制的统一内存OK。它是一个十三点四英寸的触控屏,整台机器呢只有一点二千克,还自带电池,所以你拿着它就可以随时随地的出门带着它去工作。这么说的话,它岂不是特别适合那种移动办公,或者说经常需要在外面进行AI推理的人?对没错,像它的六十四GB的版本是一万四千九百九十九元,然后一百二十八GB的定制版是一万六千九百九十九元嗯。它的优点除了刚刚说的轻薄,能触控之外,就是它可以在没有外接电源的情况下使用。但是它的缺点也很明显,因为它的机身散热有限,所以它长时间高负载运行只能维持八十瓦的功率,所以它的持续性能是要比那些桌面的迷你主机要弱一些的。然后就是那个刚刚发布的AMD原厂的Ryzen AI Halo,它跟前面两款相比,它的升级的重点主要在哪些方面呢?这个Ryzen AI Halo它是在二零二六年的六月十三号的,AMD的AI开发者大会上面首次亮相的哦。它其实是AMD第一次推出自己品牌的AI迷你工作站,它里面用的这个处理器依然还是Ryzen AI Max+三九五,然后搭配的是一百二十八GB的统一内存,所以在硬件的算力上面其实它和极摩客的EVO X二,还有这个ROG幻X二零二五是差不多的。既然硬件差不多,那它的这个差异化到底体现在哪里呢?它的这个独家的升级呢,一个是它用了定制的VC均热板的散热,所以它可以保证在出厂的时候就已经调校到了持续稳定的一百二十瓦的功耗OK。另外呢它是出厂就预装了Windows十一Pro和Linux的双系统,然后它还预部署了完整的ROCm开发栈,还有DeepSeek和Qwen等这些千亿模型,所以你开箱之后就可以直接用。它还加入了AMD官方的这个开发者的技术通道,还有企业级的售后和持续的驱动的升级,所以它对于专业的AI开发者来讲是特别有吸引力的。了解了,那这个东西定价多少,什么时候能买到呢?它的定价是三千九百九十九美元,换算过来大概是两万七千一百块钱左右,然后它是二零二六年的六月开始在海外预售嗯,但是目前国内还没有官方的行货的渠道,所以它的优点就是它是一整套的官方的AI软件的优化,然后有双系统和长期的驱动的更新,缺点就是它的价格比较高,国内买不到现货,也没有国产的这种线下的售后的渠道。说到这个,AMD在生态支持上面跟英伟达相比,还有哪些短板吗?其实DGX Spark它最大的优势并不是说它的硬件有多强,它最大的优势是它有这个NVIDIA CUDA的生态。而AMD一直以来的问题就是在于它的ROCm,虽然说它二零二四年之后有了很大的进步,但是它在框架的支持,文档和社区这几个方面还是要落后于CUDA的。然后咱们来把目光转向其他的竞品,比如说英伟达的DGX Spark,这个设备在硬件和生态上面,有哪些比较突出的优势和短板?这个设备它用的是自己家研发的GB一零Grace Blackwell的ARM的架构,然后它是配备了一百二十八GB的统一内存,理论上面是可以支持两百B以上的大模型的运行的哦。它的价格在二零二六年涨到了四千六百九十九美元,然后国内的第三方的渠道是要花三万四到三万七才能买得到。这么看的话,它的硬件配置确实挺高的,那它在软件和日常使用上面有什么问题吗?它的最大的问题就是,它是只预装了Linux系统的,没有Windows,所以你日常办公或者说你想要用一些通用的软件的话,兼容性就非常的差嗯哼。然后ARM的生态也不是很完善,所以普通用户想要上手的话门槛还是很高的。但是它的优点就是它的CUDA生态是非常完整的,所以它在Stable Diffusion的绘图和QLoRA的模型微调上面,是非常非常快的,它现在在海外是有大量的现货的,但是在国内你就只能通过海淘的方式去买。哦,那苹果的Mac Mini M四Pro和即将要发布的M五Mini,它们在运行本地AI模型的时候,会有哪些限制呢?M四Pro的话它的统一内存的上限只有六十四GB,然后它最多就是可以流畅的跑七十B的量化模型。像那种两千三百五十B的这种千亿的MoE模型,它是完全没有办法加载的哦。它的整机满载的时候也只有三十瓦的功耗,所以它是非常安静的,你可以常年不关,然后它的价格是从一万零九百九十九元起,但是它的内存是不能自己再升级的。即将发布的M五Mini会不会在这方面有一个很大的提升呢?M五Mini的话它是在二零二六年的WWDC上面亮相,然后国内大概是七八月可以买到,它的AI算力会提升三点五倍。但是它的统一内存还是限制在六十四GB,所以它依然还是没有办法跑这种千亿参数的大模型是的。然后它的AI绘图和微调这些性能,因为没有CUDA的支持,所以还是要比这个N卡和AMD的要慢很多。那现在市面上那些,价格在一万块钱以内的这种国产的迷你主机。它们在硬件和性能上面有哪些短板,然后适合哪类用户呢?比如说像铭凡的M二Ultra七,天钡的MACO四七,还有零刻的ME Pro这种,它们都是用的普通的锐龙的AI处理器嗯哼。然后没有这个原生的一百二十八GB的统一内存的架构,所以它的内存和核显的显存是分开的,这种电脑最多就是可以流畅的跑十四B以下的小模型。也就是说,如果你想要跑更大的模型的话,这些机器就完全不行了?这些主机它的价格是在四千到一万块钱之间。非常适合那种刚接触AI的新手,或者说平时只是做一些本地的知识库,或者说只是日常办公想要顺带用一下AI功能的这种场景OK。但是你想要跑千亿参数的大模型,那肯定是不现实的。明白了,然后我们来做一个五大家用AI主机的核心参数的对比。看看这几款热门的机型,在核心芯片,最大统一内存,可完整运行的模型,这几个关键的指标上面,到底有多大的差距?极摩客的EVO X二,ROG的幻X二零二五,还有AMD的原厂的Ryzen AI Halo,它们三个都是用的Ryzen AI Max+三九五的X八六芯片。然后最大统一内存都是一百二十八GB,其中有九十六GB是可以当作显存来用的没错。所以它们三个都是可以完整的跑DeepSeek R一的二三五B的模型的,而且它们的推理速度都是比RTX五零八零要快三倍以上的,但是幻X二零二五因为散热的原因,会有一点小的衰减。这么说的话,这三款AMD的机器在性能方面是非常接近的,那其他品牌呢?英伟达的DGX Spark它用的是GB十的ARM芯片,然后也是一百二十八GB的统一内存。它是可以跑两百B级别的模型的,推理速度的话因为它有CUDA的优化,所以会比RTX五零八零还要再高一些OK。而Mac Mini M四Pro 六十四GB它是用的Apple M四Pro的芯片,然后统一内存只有六十四GB,所以它只能跑七十B量化的模型,推理速度是比RTX五零八零要快百分之三十到五十。懂了懂了,那这几款机器在功耗,价格,包括系统适配,还有便携性这几个方面,又有哪些比较明显的区别呢?在功耗方面的话,极摩客的EVO X二和AMD的原厂的Ryzen AI Halo它们两个满载都是一百二十瓦。ROG的幻X二零二五是八十瓦,然后DGX Spark是一百四十瓦,Mac Mini M四Pro 六十四GB它只有三十瓦哦。所以Mac Mini M四Pro 六十四GB是最节能的,DGX Spark是最耗电的。价格和购买渠道上面呢,是不是也有不少差异?是的,极摩客的EVO X二是一万六到一万九。幻X二零二五的一百二十八GB的版本是一万六千九。然后AMD的这个原厂的Halo它是要两万七千一,DGX Spark是三万四到三万七,Mac Mini M四Pro 六十四GB它是一万一千起OK。系统适配的话,前两个都是Windows,AMD的Halo是Windows加Linux双系统,DGX Spark它是只能跑Linux,Mac Mini M四Pro 六十四GB它当然就是只能跑macOS MLX。便携性的话,幻X二零二五是一点二公斤,带电池可以随时带走,其他的基本上都是桌面级的,不太方便移动,只有Mac Mini M四Pro 六十四GB它是比较小巧安静,可以长时间的放在那运行。行,我们已经了解了这些主机的各种参数和性能,那我们接下来就来做一个精准的选购指南。比如说,有用户他就是要在本地离线跑两百B以上的这种千亿大模型,还要搭建自己的隐私知识库,那有哪些主机是可以选的?如果是这样的需求的话,极摩客的EVO X二是绝对的首选,因为它不光是现货充足,价格也是所有能跑这种大模型的主机里面最低的,而且它的桌面级的散热可以保证你长时间的稳定运行嗯。然后官方甚至有测算说,用它来跑本地的大模型,每个月可以省下来大概七百五十美元的云端的算力的费用,基本上三四个月就可以把买机器的钱省回来。那如果这个用户他有的时候需要带着电脑出门,或者说他就是一个专业的开发者,预算也比较充足,那他还有什么选择?要是经常移动办公的话,就可以选ROG的幻X,它虽然说性能会比EVO X二要弱一点,但是它非常的轻薄,然后也可以离线使用没错。如果说你是专业的开发者,也不着急,而且预算比较充足的话,就可以等AMD的原厂的Halo,它是对于开发的环境是最友好的。好的,那如果是用户他就是要做这种重度的AI绘图,或者说模型的微调,他离不开CUDA这个生态,那他的首选会是什么?这种情况的话就只能选英伟达的DGX Spark了,它是专门为这种专业的工作室来设计的,而且它的CUDA生态是非常完善的嗯嗯。但是它的价格会比较高,而且它只有Linux系统,所以日常使用起来可能没有那么方便,然后在国内也没有很好的售后的支持,所以不太适合普通的家庭用户。明白了,那如果是一个用户他就是喜欢苹果的生态,平时就是跑一些七B到七十B的这种中小型的模型,那他的主机该怎么选呢?那Mac Mini M四Pro 六十四GB就完全可以满足他的需求了,而且它非常的安静,功耗也很低,你可以一直开着也不用担心哦。要是你不着急的话可以等到二零二六年的七八月份,等M五的Mini出来,它的AI性能会有明显的提升,但是它的内存的上限还是没有办法支持千亿参数的大模型。还有一些用户可能预算比较有限,刚刚接触AI,那他们选什么主机比较合适呢?如果你的预算就是在一万块钱以内,而且主要是想要体验一下本地的AI的话。可以选铭凡或者说零刻的这种普通的锐龙的迷你主机,但是千万不要想着说我可以用它来跑七十B以上的大模型,因为它的硬件的内存的架构决定了它是跑不了的是的。如果是专业的AI开发者,需要用到ROCm开发环境,或者说企业的团队。那其实最适合的就是等AMD的原厂的Ryzen AI Halo,它是国内行货一上架就可以买了。看来选对主机还是很重要的,那我们下面来聊一聊二零二六年买这种家用的AI主机,有哪些比较容易忽略的坑?比如说统一内存和普通的这种分离的内存,到底有什么本质的区别?其实真正能够让你在本地跑起来千亿参数大模型的,就是靠这个原生的统一内存。像Ryzen AI Max+三九五,DGX Spark,还有Mac的M系列,都是有这个东西的嗯。但是很多国产的迷你主机,或者说你去买那种带RTX独立显卡的电脑,它的内存和显存是分开的,就算它俩加起来的总容量和统一内存一样大,但是实际能跑的模型的规模可能只有人家的三分之一,这个是有专业的测评测过的。最近大家都在关注AMD的这个发布会,那在这次发布会上推出的新品有没有什么容易让人误解的地方呢?这次其实很容易让人误以为是发布了新的芯片,但其实Ryzen AI Max+三九五这个芯片在二零二五年年初就已经有了,像极摩客还有ROG在二零二五年就已经有现货了对。那AMD在二零二六年发布的,其实是自己品牌的整机,以及配套的AI软件栈。它的芯片本身的算力是没有任何提升的。那如果说,有人就是想拿英伟达的消费级显卡来跑这种超大模型,会遇到什么问题呢?像RTX五零九零它虽然说有三十二GB的独立显存,但是它依然没有办法装下这个二百三十五B的模型嗯哼。那如果你要搞多卡拼接的话,首先这个整机的价格会超过五万,而且它的功耗和体积也会非常大,完全不适合家用,性价比也非常低。很多人在选机器的时候会很关心这个量化模型的内存的需求,有没有什么具体的标准可以参考呢?比如说七B的模型,它的Q四量化版本大概是需要八GB的显存,七十B的模型差不多是四十GB,像这个两千三百五十亿的MoE模型,它至少需要八十五GB的等效显存是的。然后还有就是在国内买的话,一定要注意,像极摩客和ROG你一定要去官方的旗舰店买。Mac Mini的话你只能在苹果的官网去定制内存。要是你买这个AMD的原厂的Halo的话,目前国内是没有自营的渠道的,所以你要是海淘的话,是有一定的售后风险的。好的,我们最后来总结一下啊,就是二零二六年咱们到底该怎么去选家用的AI主机?有没有什么核心的标准,或者说有哪些机型是比较值得推荐的?二零二六年其实是一个分水岭,就是你能不能够在自己家里的这一台设备上面离线的跑起来千亿参数的大模型,关键就在于有没有这个一百二十八GB的原生统一内存的旗舰级的APU是的。那这次新出的这个AMD的Ryzen AI Halo,其实它的芯片和极摩客还有ROG去年的那几款是一样的,只不过是补齐了官方对于专业开发者的支持的产品线。这么说的话,那大家在选的时候其实就不用太纠结于硬件的算力,更多的是要根据自己的使用场景和预算来选,对不对?没错,要是追求性价比和现货的话,那肯定就是极摩客的EVO X二是首选。如果是经常要移动办公,需要随时随地都可以用AI的,那肯定是选ROG的幻X二零二五OK。要是专门做CUDA的绘图和微调的,那还是得选英伟达的DGX Spark。要是就喜欢苹果生态,想要安静的低功耗的去跑一些小模型的,那Mac Mini M四Pro就可以了。OK,那今天我们算是把,能够跑大模型的这些家用的迷你主机,给大家彻底的梳理了一遍。然后也给不同需求和预算的朋友,都找到了适合你们的那一款。好啦,那这一期播客我们就到这里啦,感谢大家的收听,咱们下次再见,拜拜拜拜。”,”tts_meta_addr”:”https://tosv.byted.org/obj/tos-tingtoutiao/ai_podcast_meta/7654440399390147106_0.json”,”voice_type”:”sami_ai_podcast”}}
© 版权声明
文章版权归作者所有,未经允许请勿转载。
暂无评论...