关于ZAKER 合作
钛媒体 21分钟前

顶尖大学竞逐超算:复合型人才和“三算”融合是关键

在青海大学的体育馆内,一场世界级计算机竞赛激战正酣。

参赛者不仅有来自中国的北京大学、清华大学、南京大学等在内的多所国内高校,还有来自泰国、德国、南非、哥伦比亚等地的海外大学生团队,他们不时紧盯记分牌,关注着自己组建超算集群的功率是否超标,不时紧盯自己电脑的屏幕,确保集群正常运行。数十名评委则在体育馆的看台上,时刻记录着比赛的进程。

这一幕发生在近日举办的 2025 ASC 世界大学生超级计算机竞赛总决赛的赛场上。本届 ASC 的决赛赛题包括了 RNA 甲基化修饰位点检测、宇宙中微子探测模拟、DeepSeek 推理优化、青藏高原气候数值模拟、AlphaFold3 推理优化、超算基准测试 HPL 和 HPCG 等七不同方向。

对比近几届 ASC 大赛赛题可以看出,大模型应用与调优,以及超算在具体细分场景下的应用落地已经成为近年来的趋势。

" 飞入寻常百姓家 " 的超算

超级计算机,原本是一个离我们生活很遥远的存在。甚至仅在几年之前,超算还只是用于一些高精尖的科研项目,诸如科学计算、工程模拟、气象预测、基因分析等尖端领域。

但随着数字技术的发展,超级计算机逐渐有更多的应用场景涌现,而超算也不仅局限于各国展示科技实力的工具,更多的实际价值得以体现。

近年来,中国超算进入快速发展的阶段,以国家级超算中心为主的国内超算平台正在积极寻求可持续性发展。

从政策发展来看,中国超算行业政策经历了由推动超算中心建设到强化算力统筹智能调度再到梯次布局算力基础设施的转变。

2016 年,中国发布的《国家创新驱动发展战略纲要》中就提出,建设超算中心等数字化基础设施。随后,《" 十四五 " 规划》中还进一步强调:加快构建全国一体化大数据中心体系,强化算力统筹智能调度,建设 E 级和 10E 级超级计算中心 ......

从应用层面出发,原先超算对于各个国家来说,一方面是展现科技硬实力,用于 " 秀肌肉 " 的产物;另一方面,超算最初主要应用于科学计算、工程模拟、气象预测、基因分析等尖端领域。

随着技术的不断发展,超算已经从传统的气象预测、核能模拟等科研领域,逐步渗透到工业设计、生物医药、金融分析、新能源开发等产业。

三算融合、算网协同仍是挑战

数据显示,中国算力规模近五年年均增速近 30%,算力运用已成为科学研究和企业创新的必备技能。而这些算力主要集中在超算中心、智算中心,以及传统数据中心之中。不过这 " 哥仨儿 " 的应用场景、技术架构却大相径庭。

在数字经济快速发展的大背景下,数智化应用场景及负载日益多样化,成为推动多元化算力发展的新动力。基于此,

超算与智算、传统数据中心之间最大的差别是应用场景不同。超算主要应用于大规模科学计算、工程仿真、气象预报、生物信息等领域,这些应用需要处理海量数据和高复杂度计算,对计算性能要求极高。

智算则主要应用于人工智能、机器学习、图像处理、语音识别等领域,这些应用需要快速迭代和优化模型,对计算效率要求较高。而相较于超算、智算而言,传统数据中心的应用则更加广泛,包括云计算、大数据分析、企业级应用等。

因为超算、智算、通算三种算力的架构不尽相同。传统超算早期以 CPU 为核心,现代超算则是 CPU+GPU/ 加速器的异构架构,主要面向高精度科学计算(FP64),而智算依赖 GPU、ASIC 等 AI 芯片进行低精度并行计算(如 FP16/INT8),两者的硬件架构和计算范式存在本质差异。

例如,超算的 " 时间复杂度 " 与智算的 " 空间复杂度 " 难以兼容。融合需从芯片设计、存储网络到算法层面实现软硬协同创新,例如通过动态异构资源池化技术解决算力调度问题。所以 " 三算 " 融合目前仍是一个比较棘手的问题。

另一方面,在大模型的带动下,算力需求不断攀升的同时,芯片能耗也在增加,单机柜的功率也随之增长。增长的算力需求与能耗情况也对算力集群协同发展提出了更高的要求和更迫切的需求。

在此背景下,算网融合,协同不同算力集群共同完成一个任务是目前比较好的解决方案,但如何融合、怎么调用才能将损耗降到最低,这些问题都是当下算网融合面临的比较大的挑战。超算中心间网络带宽不足,跨域数据调度效率低等问题仍然存在。

对此,国家超级计算无锡中心主任杨广文曾表示,为了解决中国超算中心运行面临的挑战,提升中国超算的应用水平,推动超算中心从提供裸机时向提供多领域应用服务转变,构建超算互联网势在必行。

ASC 世界大学生超级计算机竞赛作为世界三大国际大学生超算竞赛之一,也紧跟产业实际需求,今年的 ASC 总决赛第一次将限制功耗从 3KW 提升到了 4KW,并且要求参赛选手必须组建超过 3 个节点,且单节点最大功耗不能超过 2KW。

当笔者对此举提出疑问时,ASC 组委会委员刘羽告诉笔者,目前世界上最先进的芯片,单个芯片的功耗已经可达千瓦级别,在此背景下,如果还将功耗要求的比较低,不利于参赛选手的培养,失去了 ASC 比赛的初衷。" 此外,为了能让参赛选手更好地理解超算是一个多机组合的系统,我们特别设定了必须超过 3 个节点,达到并联的效果,并且每个节点都需要承担一部分任务负载的规范要求。" 刘羽强调。

复合型人才成 " 香饽饽 "

紧跟趋势的比赛规则仅仅是对人才培养的一个缩影,在超算快速发展的过程中,其在各行各业中涌现出了不少落地的应用场景。这也对于超算与各行业融合也提出了更高的要求,从业人员既要具备丰富的计算机学科知识,又要有相关场景下,各行业属性的知识储备。

培养具备软硬件协同优化能力的工程创新人才已成为时代命题。特别是 DeepSeek 的创新发展,面向应用的系统性工程优化的价值日益凸显。而这种系统性的工程方法需要跨学科的知识和技能,因为其涉及到从硬件到软件、从理论到实践的多个层面。

在 ASC25 决赛期间,刘羽对笔者表示,在实际应用中,我们会遇见很多问题,比如一些突发的情况,以及一些特定场景下的限制,而这部分在书本中是不可能体现出来的," 书本上所教的内容并不是不好,只是我们掌握这些知识最终的目的还是要到实际应用中,而有一些内容只有真正放到实际场景中才能显现,这部分内容是无法从书本中获得的。" 刘羽强调。

在一些细分场景下,不是通过单一学科的理念、知识、方法、工具可实现的,亟需学科之间、科学与技术之间、自然科学与社会科学之间的交叉融合。同时具备技术能力和行业知识储备能力的人才显然已经成为今后数字技术与行业深度融合的关键,复合型的人才已经成为炙手可热般的存在。

因此,跨学科人才在科研活动中起核心作用,外加诸多应用科学研究自身就带有工程技术的特点,如生命科学逐渐向定量、精确、可视化、交叉汇聚方向发展。因此,培养高层次创新型、复合型、应用型的 " 科技新青年 " 也逐步成为科技革命的关键支撑力量。

而复合型人才的团队建设效果也在本届 ASC 上得以显现,本届 ASC 夺得冠军的上海交通大学代表队就由来自电气工程专业、计算机专业、航天航空专业等多个跨学科专业的大学生组成。这种团队的组合也给他们提供了更强竞争力,也是他们得以夺魁的关键。

值得注意的是,除了 ASC 大赛以外,另外两大全球性超算大赛—— SC(国际大学生超级计算机竞赛)和 ISC(国际超级计算大会)近年来在赛题设置上,也均采用了与各学科深度交叉的方式,显然这种超算与各学科深度融合的形式已经成为未来很长一段时间内,超算赋能各行业的重要抓手。而这些大赛不仅推动了超算技术的发展和应用,也为全球的超算青年人才提供了展示和交流的机会,促进了科技与产业的创新。(本文首发于钛媒体 APP,作者|张申宇,编辑丨盖虹达)

相关标签

最新评论

没有更多评论了

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容