摩尔线程CEO张建中在主题演讲中带来重磅发布,包括大模型智算加速卡MTT S4000,以及专为千亿参数大模型演习和推理供应强大支持的摩尔线程KUAE平台,他表示:“摩尔线程KUAE智算中央的正式启用,是公司发展的主要里程碑。摩尔线程构建了从芯片到显卡到集群的智算产品线,依托全功能GPU的多元打算上风,旨在知足不断增长的大模型演习和推理需求,以绿色、安全的智能算力,大力推动AIGC、数字孪生、物理仿真、元宇宙等多模态运用的落地和千行百业的高质量发展。”
全新智算加速卡MTT S4000:训推兼顾,专为大模型打造
摩尔线程大模型智算加速卡MTT S4000,采取第三代MUSA内核,单卡支持48GB显存和768GB/s的显存带宽。基于摩尔线程自研MTLink1.0技能,MTT S4000可以支持多卡互联,助力千亿大模型的分布式打算加速。同时,MTT S4000供应前辈的图形渲染能力、视频编解码能力和超高清8K HDR显示能力,助力AI打算、图形渲染、多媒体等综合运用处景的落地。尤为主要的是,借助摩尔线程自研MUSIFY开拓工具,MTT S4000打算卡可以充分利用现有CUDA软件生态,实现CUDA代码零本钱迁移到MUSA平台。
摩尔线程KUAE智算中央办理方案:软硬一体,开箱即用
摩尔线程KUAE智算中央办理方案以全功能GPU为底座,是软硬一体化的全栈办理方案,包括以KUAE打算集群为核心的根本举动步伐、KUAE Platform集群管理平台以及KUAE ModelStudio模型做事,旨在以一体化交付的办法办理大规模GPU算力的培植和运营管理问题。该方案可实现开箱即用,大大降落传统算力培植、运用开拓和运维运营平台搭建的韶光本钱,实现快速投放市场开展商业化运营。
根本举动步伐:包含KUAE打算集群、RDMA网络与分布式存储。这次发布的摩尔线程KUAE千卡模型演习平台,培植周期只需30天,支持千亿参数模型的预演习、微调和推理,可实现高达91%的千卡集群性能扩展系数。基于MTT S4000和双路8卡GPU做事器MCCX D800,摩尔线程KUAE集群支持从单机多卡到多机多卡,从单卡到千卡集群的无缝扩展,未来将推出更大规模的集群,以知足更大规模的大模型演习需求。
KUAE Platform集群管理平台:用于AI大模型演习、分布式图形渲染、流媒体处理和科学打算的软硬件一体化平台,深度集玉成功能GPU打算、网络和存储,供应高可靠、高算力做事。通过该平台,用户可灵巧管理多数据中央、多集群算力资源,集成多维度运维监控、告警和日志系统,帮助智算中央实现运维自动化。
KUAE ModelStudio模型做事:覆盖大模型预演习、微调和推理全流程,支持所有主流开源大模型。通过摩尔线程MUSIFY开拓工具,可以轻松复用CUDA运用生态,内置的容器化办理方案,则可实现API一键支配。该平台意在供应大模型生命周期管理,通过简洁、易操作的交互界面,用户可按需组织事情流,大幅降落大模型的利用门槛。
摩尔线程KUAE千卡集群:多重上风,助力大模型高效演习
分布式并行打算是实现AI大模型演习的关键手段。摩尔线程KUAE支持包括DeepSpeed、Megatron-DeepSpeed、Colossal-AI、FlagScale在内的业界主飘泊布式框架,并领悟了多种并行算法策略,包括数据并行、张量并行、流水线并行和ZeRO,且针对高效通信打算并行和Flash Attention做了额外优化。
目前,摩尔线程支持包括LLaMA、GLM、Aquila、Baichuan、GPT、Bloom、玉言等各种主流大模型的演习和微调。基于摩尔线程KUAE千卡集群,70B到130B参数的大模型演习,线性加速比均可达到91%,算力利用率基本保持不变。以2000亿演习数据量为例,智源研究院700亿参数Aquila2可在33天完成演习;1300亿参数规模的模型可在56天完成演习。此外,摩尔线程KUAE千卡集群支持永劫光连续稳定运行,支持断点续训,异步Checkpoint少于2分钟。
摩尔线程KUAE千卡打算集群凭借高兼容性、高稳定性、高扩展性和高算力利用率等综合上风,将成为大模型演习坚实可靠的前辈根本举动步伐。
智算和大模型生态同盟:多方协作,促进生态领悟
大模型时期,以GPU为代表的智能算力是基石,也是天生式AI天下的中央。摩尔线程联合中国移动北京公司、中国电信北京分公司、遐想、世纪互联、光环新网、中联数据、数道智算、中发展智源、企商在线、北电数智北京数字经济算力中央、紫光恒越、瑞华家当控股(山东)、赛尔网络、中科金财、中耘智算、金舟远航(排名不分先后)等十余家企业,共同宣告“摩尔线程PES - KUAE智算同盟”成立。同盟将大力培植和推广从底层硬件到软件、工具到运用的全国产智算平台,旨在实现集群的高利用率,以好用、易用的全栈智算办理方案成为大模型演习首选。
活动现场,摩尔线程分别与中联数据和数道智算进行了现场签约,并共同为摩尔线程KUAE智算中央揭牌。现场200多名与会高朋一同见证了这一主要时候。
人工智能运用的打破,生态是关键。为此,摩尔线程携手360、飞桨、京东言犀、智谱AI、超对称、无问芯穹、滴普科技、网易、清华大学、复旦大学、浙江大学、北京理工大学、凌云光、瑞莱聪慧、南威软件(排名不分先后)等多家大模型生态伙伴,发起并成立“摩尔线程PES - 大模型生态同盟”。摩尔线程将以MUSA为中央的软硬一体化大模型办理方案,积极与广泛的生态伙伴开展兼容适配及技能调头等事情,共同推动国产大模型生态的全面繁荣。
在末了的圆桌对话环节,摩尔线程副总裁董龙飞与中能建绿色数字科技(中卫)有限公司董事长墙虎、智谱AI CEO张鹏、京东云首席AI科学家裴积全、中金成本董事总经理翟赢、超对称创始人吴恒魁、数道智算董事长甄鉴等重磅高朋,就当前大模型的算力需求和智算中央的培植与运营等话题展开了深入磋商。高朋同等认为,智算中央不应只是硬件的堆积,更是对软硬一体化的GPU智算系统整合能力的磨练,GPU分布式打算系统的适配、算力集群的管理和高效推理引擎的运用等,都是提高算力中央可用性的主要成分。国产智算中央的发展,更是依托于将各方需求和上风充分领悟,家当聚力才能实现全体生态的协同,推动国产奇迹往前发展。
关于摩尔线程:
摩尔线程智能科技(北京)有限任务公司是一家以全功能GPU芯片设计为主的集成电路高科技公司,能够为广泛的科技生态互助伙伴供应强大的打算加速能力,致力于打造为下一代互联网供应多元算力的元打算平台。欲理解更多信息,请您访问摩尔线程官方网站https://www.mthreads.com/
雷峰网