聚焦多样运用处景 算力平台协同创新
随着人工智能、大数据等技能的快速发展,高校面临着提升算力资源利用效率和做事能力的寻衅。如何实现平台化的统一管理、如何让算力资源实现有效调动和不同层级用户的合理分配,如何进行日常的运维管理与可持续发展,成为摆在许多高校面前的难题。加之当下全体社会对付能源的利用率与绿色低碳等需求,让不少高校在算力运用的过程中变适合机赓续、旁边难堪,亟需首创出一条既符合科研创新又保持绿色低碳的新领悟之路。
2016年,采取温水水冷办理方案的北大“未名一号”集群便是海内首个利用温水水冷系统的大规模超算集群,而不久之前北京大学发布的“未名二号”集群同样也是海内首个采取RoCE技能连接的大规模高性能打算和AI领悟集群。北京大学打算中央系统管理室主任、北京大学打算与数字经济研究院算力网络研究中央主任、正高等工程师樊春分享高校算力、算力网络与算力平台的培植与协同发展。通过剖析算力平台的架构、算力网络的连接性以及两者之间的协同浸染,提出了优化高校算力资源配置的策略和建议,以促进科研创新、传授教化改革和社会做事的全面提升,为构建智能校园供应坚实根本。同时,基于北京大学的创新实践,在构建算力网络的道路上迈出了坚实的一步,充分发挥算力资源的代价。
北京大学 樊春
数学推理长期以来被视为考验大模型能力的试金石,运用大模型应对数学寻衅成为新颖做法。多模态大型措辞模型 (MM-LLM) 在各种视觉问答中表现出了卓越的推理能力,然而,大模型在回答和解决数学推理问题时碰着了诸多寻衅。这些寻衅是由于数学须要严谨的推理并实行精确的打算。暨南大学广东聪慧教诲研究院副院长、博士生导师官全龙教授现场分享基于多模态大模型的数学推理问题研究。
如何增强大模型的能力助力办理数学推理问题,官教授团队设计了RaE(Reason-and-Execute)提示方法,这是为提高MM-LLM推理能力而设计的提示方法。详细来说,首先设计了基于数学领域知识的推理过程,采取逆向思维的方法,得出理解决数学问题所需的详细推理步骤。其次,基于以上的剖析推理过程,官教授团队又设计了程序代码块实行的提示模板,天生实行代码块的内容,大模型就可以求解出数学问题的答案。而基于华南理工大学超算中央的打算资源,暨南大学评估了9个模型在6个数学数据集的回答准确性,从领域知识、几何形状、对问题文本和措辞的理解等方面开展较为全面的比拟实验,验证了RaE方法的有效性,干系的源代码和提示工程文件已发布到 GitHub。
暨南大学 官全龙
随着打算需求的扩大和打算投入的增加,伴随着研究模式的发展,科研团队提出更多的算力利用需求,西湖大学环绕特定科研需求建立多个专用集群。西湖大学高性能打算中央主任李南博士,回顾西湖大学高性能打算中央培植进程和做事模式,西湖大学高性能打算中央从集群到多种算力做事拓展办法,为校内各种科研供应广泛科研支撑。
西湖大学 李南
AI的发展非常迅速,高校高性能打算需求越来越大,高性能打算与其他的信息化做事平分歧场景对应的根本举动步伐培植思路迥然不同。南京大学e-Science中央从属于人工微构造科学与技能协同创新中央,是2014年获教诲部、财政部认定的国家级协同创新中央。
南京大学高等工程师姚舸现场分享e-Science中央的发展进程,e-Science校内用户超九万,在总结回顾第一代和第二代架构后,为知足当前的需求并适当展望未来,中央近几年正在逐步培植第三代架构中,在供应面向科研的科学和智能打算的根本上,不断扩展做事能力。已培植了包括云盘、协同表格、开源镜像、代码托管、LaTeX在内的十余种数字化做事,实现了科研、传授教化、管理的全场景覆盖。
南京大学 姚舸
在高校业务中,利用云打算、智算、超算场景从最开始的自成体系,逐步呈现交叉领悟,算力资源培植与管理也因此呈现出一些新问题,中南大学信息与网络中央高性能打算中央主任邹有现场分享了中南大学云智算一体化的探索与思考,从中南大学打算资源现状,基于超算、智算、通算业务场景,探索干系办理方案,将现阶段的事情与后期方案与同行分享和谈论。
中南大学 邹有
自研SCOW、鹤思、远程桌面与小蒜智能助手
推动算力管理运营创新
益企研究院发起的数字中国万里行稽核中创造,中国高校在数字化传授教化、聪慧校园等方面的探索与实践早已卓有成效。在高性能算力平台的演进进程中,多元算力、算网领悟、大模型技能、液冷技能等绿色算力办理方案正在高校加速落地。以北京大学为例,北京大学打算中央与北京大学长沙打算与数字经济研究院通过创新实践办理了算力网络市场中利用、接入和交易三个关键问题,其算力中央门户和管理平台SCOW(Super Computing On Web)。促进了算力网络的进一步发展,充分发挥了算力资源的代价,为国家的“东数西算”“双碳”计策供应了高质量支撑,为业界供应了宝贵的履历和启迪。
现在,北京大学打算中央与北京大学长沙打算与数字经济研究院已经将SCOW项目开源,便于更多的高校能够体验到统一支配与管理的上风。北京大学打算中央高等工程师,打算中央系统管理室副主任,北京大学长沙打算与数字经济研究院算力网络研究中央副主任李若淼分享了如何利用SCOW构建算力聚合平台,运维团队只须要一个浏览器就能完成算力中央的算力资源利用、管理全流程,实现算力中央资源易管理、易利用的目标。尤其在AI调度系统上,SCOW拥有良好的兼容性,与主流系统都做了对接,方便管理员搭建系统,做到开箱即用。目前全国已有50多个机构支配、测试或在利用SCOW。开源下载量在不到半年的韶光内已经超过10000次。在现场,华南理工大学作为利用者先容了利用中的管理、支配履历。
北京大学 李若淼
鹤思是北京大学打算中央与北京大学长沙打算与数字经济研究院联合研发的开源算力资源调度系统,北京大学打算中央工程师,北京大学长沙打算与数字经济研究院特聘副研究员马银萍先容,鹤思支持异构国产CPU和AI芯片,可调度10万节点以上的超大规模集群,并通过高效的调度算法,提升算力资源的利用效率,减少作业等待韶光,优化用户利用体验。而小蒜是一款智能校园助手,可以在高性能打算和校园生活等各种场景中为师生供应准确且高效的问答做事,极大提升校内师生的学习和事情便捷性与效率。
北京大学 马银萍
在电子设计自动化、打算机赞助工程、打算流体力学等领域快速发展的本日,拥有高性能的远程桌面办理方案是提升效率和灵巧性的关键。由北京大学开拓的远程桌面软件为这些专业人士供应了一个高效的事情环境。北京大学打算中央工程师、北京大学长沙打算与数字经济研究院特聘副研究员付振新分享了高性能打算平台中的远程桌面与安全,他表示算力平台的安全也是另一个关注要点,北京大学针对算力平台的安全设计了二次认证、透明堡垒机等多种安全提升方案。
北京大学 付振新
参不雅观海内最大校级数据中央
体验全栈液冷、算网领悟创新实践
作为广东省著名的双一流高校,华南理工大学也是全体华南地区一流的理工类大学。与会专家参不雅观了华南理工大学广州国际校区数据中央,作为全新校区,这也是全国唯一的所有学院、专业都是新工科、交叉学科的校区。数据中央建筑面积12,800平方米,设计660个机柜,总可用功率1万kW以上,是海内高校建筑面积最大的单体数据中央,按A+B级设计。
华南理工大学国际校区数据中央采取存算一栈式液冷办理方案,即选择打算液冷和存储液冷的全栈式方案,办理了长久以来困扰学校的数据中央高能耗、难散热等难题,实现能效和性能的双重目标,算力培植达到双精度7.3P和AI打算94P,并将存储容量扩展了近25PB。据测算,在利用液冷办理方案之后,华南理工大学数据中央整体能耗降落了30%。按照做事器、存储等IT根本举动步伐5年的生命周期打算,整体TCO有所节省的同时也为后续的升级和迭代供应了良好的根本条件。
通过集约化培植办法构建高效、绿色算力根本举动步伐为全校供应高端打算+AI的科学打算公共做事平台,采取易于支配、便捷的SCOW算力门户平台,华南理工大学科学打算公共做事平台支撑学校新材料、打算化学、生物医学、人工智能、芯片设计、汽车设计、建筑设计、海洋科学等科学研究和创新。
结 语
从历史悠久的超算,到以大模型为代表的AI运用,2024年算力平台与运用新技能论坛着眼运用和多样打算,环绕算力演进,存储平台、算力网络、聪慧科研、绿色算力等干系技能、家当、人才培养等话题深度磋商,通过不同高校的创新实践分享、互动互换、现场稽核的办法,多维度给行业内带来不同启示和思考,不断推动科技创新与绿色算力发展。
这也与益企研究院一贯秉持的“全栈数据中央”理念高度吻合,直通IT平台架构与数据中央根本举动步伐,把芯片、打算、存储、网络等技能直至数据中央根本举动步伐作为一个整体看待。从业务发展与多样运用处景需求变换着眼算力平台变革,上层业务需求的变革会通过芯片、打算和存储等IT设备传导到根本举动步伐层面,即数据中央作为根本举动步伐也会相应地产生自上而下的变革。
基于全栈理念,益企研究院未来将连续通过数字中国万里行走进高校系列,关注高校算力平台的演进进程中,多元算力、算网领悟、大模型技能、液冷技能等绿色算力办理方案的落地,推动中国的数字教诲发展。欢迎关注!