充分利用先进的计算平台，综合运用CPU、GPU、FPGA等异构平台

为客户打造高性能计算资源

摩尔线程发布“花港”GPU架构：能效提升10倍，筑牢国产GPU服务器算力底座

12月 22, 2025 — 来源：慧点数码

2025年12月20日，“国产GPU第一股”摩尔线程（股票代码：688795）在北京举办首届MUSA开发者大会，正式推出第五代GPU架构“花港”，同步发布基于该架构的“华山”AI训推一体芯片与“庐山”图形渲染芯片，并宣布两款芯片将于2026年量产上市。此次发布不仅标志着国产全功能GPU技术实现跨越式突破，更将为GPU服务器在智算集群、高端渲染等场景的规模化应用提供核心支撑。

作为摩尔线程MUSA架构路线图的关键迭代成果，“花港”架构从算力、能效、互联能力三大维度重构GPU性能标准。据摩尔线程创始人、董事长兼CEO张建中介绍，该架构搭载新一代指令集，算力密度较上一代提升50%，能效更是实现10倍优化，同时集成全精度端到端加速技术，支持从FP4到FP64的全精度计算，可灵活适配AI训练、科学计算、图形渲染等多元需求——这一特性使其成为GPU服务器的理想核心组件，既能满足智算中心对高密度算力的需求，也能降低GPU服务器集群的能耗成本。

在GPU服务器的集群扩展能力上，“花港”架构展现出突出优势。其集成新一代异步编程模型，优化任务调度与并行机制，搭配自研MTLink高速互联技术，可直接支持十万卡以上规模智算集群搭建。当天同步亮相的“夸娥万卡”智算集群，便是基于该架构打造，浮点运算能力达10EFLOPS（每秒百亿亿次浮点运算），多项关键精度指标达到国际主流水平，能够为万亿参数大模型训练提供稳定算力支撑，进一步验证了“花港”架构在大型GPU服务器集群中的工程化可靠性。

基于“花港”架构的两款芯片，更是针对性强化了GPU服务器的场景适配能力。其中，“华山”AI训推一体芯片集成全精度张量计算单元，访存容量超越英伟达Hopper架构芯片，访存带宽与Blackwell架构芯片持平，可作为GPU服务器的核心算力单元，为AI模型训练与推理提供高效支撑；“庐山”图形渲染芯片则实现性能全面跃升，与上一代产品S80相比，3A游戏性能提升15倍、AI性能提升64倍、光线追踪性能提升50倍，能够满足高端GPU服务器在数字孪生、影视渲染、3A游戏开发等场景的图形处理需求。

软件生态层面，摩尔线程自研的MUSA架构迎来全栈升级，形成覆盖芯片、板卡到GPU服务器集群的统一软件栈，不仅兼容主流开发工具与应用场景，还能为GPU服务器提供从驱动程序到算力管理平台的全流程支持。张建中在大会上强调：“生态体系是GPU行业的核心护城河，依托MUSA架构的全栈优势，我们正推动GPU服务器从硬件到软件的协同优化，构建自立自强的国产计算产业生态。”

值得关注的是，除了面向数据中心的GPU服务器核心技术，摩尔线程还同步拓展消费端算力场景，发布搭载“长江”智能SoC芯片的AI算力本MTT AIBOOK，目前已在京东开放预售，标价9999元，将于2026年1月10日正式开售。这款产品内置AI智能体与AI数字人，支持Android、Windows、Linux三系统切换，既是MUSA架构全场景能力的延伸，也为GPU技术从数据中心走向个人终端搭建了桥梁。

从2020年成立至今，摩尔线程仅用五年时间便构建起从芯片、板卡到GPU服务器集群及软件方案的全栈布局，业务覆盖“云边端”全场景。此次“花港”架构及系列产品的发布，不仅推动国产GPU技术向高端市场突破，更将为GPU服务器在智算基建、产业数字化转型中的规模化应用注入新动能，加速国产算力生态的自立自强进程。