2025年12月20日,“国产GPU第一股”摩尔线程(股票代码:688795)在北京举办首届MUSA开发者大会,正式推出第五代GPU架构“花港”,同步发布基于该架构的“华山”AI训推一体芯片与“庐山”图形渲染芯片,并宣布两款芯片将于2026年量产上市。此次发布不仅标志着国产全功能GPU技术实现跨越式突破,更将为
GPU服务器在智算集群、高端渲染等场景的规模化应用提供核心支撑。
作为摩尔线程MUSA架构路线图的关键迭代成果,“花港”架构从算力、能效、互联能力三大维度重构GPU性能标准。据摩尔线程创始人、董事长兼CEO张建中介绍,该架构搭载新一代指令集,算力密度较上一代提升50%,能效更是实现10倍优化,同时集成全精度端到端加速技术,支持从FP4到FP64的全精度计算,可灵活适配AI训练、科学计算、图形渲染等多元需求——这一特性使其成为GPU服务器的理想核心组件,既能满足智算中心对高密度算力的需求,也能降低GPU服务器集群的能耗成本。
在GPU服务器的集群扩展能力上,“花港”架构展现出突出优势。其集成新一代异步编程模型,优化任务调度与并行机制,搭配自研MTLink高速互联技术,可直接支持十万卡以上规模智算集群搭建。当天同步亮相的“夸娥万卡”智算集群,便是基于该架构打造,浮点运算能力达10EFLOPS(每秒百亿亿次浮点运算),多项关键精度指标达到国际主流水平,能够为万亿参数大模型训练提供稳定算力支撑,进一步验证了“花港”架构在大型GPU服务器集群中的工程化可靠性。
基于“花港”架构的两款芯片,更是针对性强化了GPU服务器的场景适配能力。其中,“华山”AI训推一体芯片集成全精度张量计算单元,访存容量超越英伟达Hopper架构芯片,访存带宽与Blackwell架构芯片持平,可作为GPU服务器的核心算力单元,为AI模型训练与推理提供高效支撑;“庐山”图形渲染芯片则实现性能全面跃升,与上一代产品S80相比,3A游戏性能提升15倍、AI性能提升64倍、光线追踪性能提升50倍,能够满足高端GPU服务器在数字孪生、影视渲染、3A游戏开发等场景的图形处理需求。
软件生态层面,摩尔线程自研的MUSA架构迎来全栈升级,形成覆盖芯片、板卡到GPU服务器集群的统一软件栈,不仅兼容主流开发工具与应用场景,还能为GPU服务器提供从驱动程序到算力管理平台的全流程支持。张建中在大会上强调:“生态体系是GPU行业的核心护城河,依托MUSA架构的全栈优势,我们正推动GPU服务器从硬件到软件的协同优化,构建自立自强的国产计算产业生态。”
值得关注的是,除了面向数据中心的GPU服务器核心技术,摩尔线程还同步拓展消费端算力场景,发布搭载“长江”智能SoC芯片的AI算力本MTT AIBOOK,目前已在京东开放预售,标价9999元,将于2026年1月10日正式开售。这款产品内置AI智能体与AI数字人,支持Android、Windows、Linux三系统切换,既是MUSA架构全场景能力的延伸,也为GPU技术从数据中心走向个人终端搭建了桥梁。
从2020年成立至今,摩尔线程仅用五年时间便构建起从芯片、板卡到GPU服务器集群及软件方案的全栈布局,业务覆盖“云边端”全场景。此次“花港”架构及系列产品的发布,不仅推动国产GPU技术向高端市场突破,更将为GPU服务器在智算基建、产业数字化转型中的规模化应用注入新动能,加速国产算力生态的自立自强进程。