马上注册,结交更多好友,享用更多功能,让你轻松玩转社区
您需要 登录 才可以下载或查看,没有账号?立即注册
×
1 国内外超级计算发展概述 1.1 国外超级计算发展现状 超级计算能力是国家综合科技实力的核心要素,不仅为重大科学工程提供算力保障,更在驱动国家科学研究、经济高质量发展和维护国家战略安全层面展现出独特价值。全球科技强国均将超级计算纳入战略发展方向,持续的提供政策与资金投入以保持其领先性。 美国高度重视超级计算技术发展,依托美国能源部(DOE)、国家科学基金会(NSF)和国家航空航天局(NASA)构建的三大超级计算体系,多年来通过实施“战略计算机计划”(SCP)、“高性能计算和通信计划”(HPCC)、“加速战略计算”(ASCI)、“先进模拟和计算”(PACI)、“高生产率计算机”(HPCS)等多项国家计划,带动了美国诸多行业的突破性创新]。 2022年5月美国橡树岭国家实验室(ORNL)研制的超级计算机 Frontier获得 TOP500 榜首。2024 年 11 月劳伦斯利弗摩尔国家实验室在“Sierra”的基础上部署的 E级机“El Capitan”摘得TOP500超算榜单第1名。 日本综合自然科学研究所理研 RIKEN加入到中美超算竞争,对超算系统投入了相当多的人力和资金。投资 72.7 亿元打造的“富岳”继“京”超算系统后时隔 9年于 2020年 5月获得 TOP500榜首,率先迈出了E级超算系统第一步。该机构初步规划下一代超级计算机“富岳 NEXT”将在2030年投入运营,其有效性能提升将至“富岳”的5 至 10 倍,计算能力突破 3EFLOPS、AI 性能超50EFLOPS,远超当前最强系统“El Capitan”。该系统的研制体现了日本在高性能计算和人工智能领域的深耕,以及绿色节能理念的坚持。 欧洲也一直是高性能计算的活跃区域,欧洲分布式超级计算应用基础设施联盟(DEISA)和欧洲高级计算合作计划(PRACE)等项目推动了欧盟的超级计算发展[3]。2018 年欧盟成员国共同投资 10亿欧元成立欧洲高性能计算共同计划(EuroHPC JU),计划在 2019-2026 年间投资 8.4亿欧元,建设8台世界级超级计算机。2020年欧盟对该计划加大投资至80亿欧元[4],进行百亿亿次超级计算机以及量子计算机的研制工作,维持欧洲在超级计算以及量子计算领域的主导地位。
随着各国的国家超算战略计划逐步推行落地,全球迎来了一次大规模超算系统更替潮,系统性能步入E级时代的同时,系统体系架构的多样化、大数据与人工智能融合应用需求的迅速增长,使超算创新应用的开发成为业界关注的焦点。2024 年 11 月 ISC 2024 大会公布了 TOP500超算榜单,下表是Top500前10名。 1.2 国内超级计算发展现状 “九五”以来我国积聚发展起来一批超级计算机研发的中坚力量。国家并行计算机工程技术研究中心、中国科学院计算技术研究所国家智能中心、国防科技大学计算机学院、曙光公司等在高性能计算机研制方面长足发展,研制出了计算性能世界领先的超计算系统。 2008年联想公司和曙光公司分别研制成功“深腾 7000”和“曙光 5000”百万亿次计算机。2009 年,国防科技大学研制成功“天河一号”千万亿次计算机,使我国成为全球第二个掌握千万亿次计算能力的国家。2010年6月,曙光公司研制成功“星云”千万亿次计算机,性能列世界 TOP500 第二位。同年 11 月,“天河-1A”系统首次登顶全球超算榜首,随后“天河二号”连续四次蝉联 TOP500 第一名,展现了我国在超算领域的持续突破。在自主 CPU 芯片研制方面我国也取得重大突破,2016年采用40,960个中国自主研发的“申威 26010”众核处理器的“神威·太湖之光”超级计算机研制成功,安装在国家超级计算无锡中心。该系统在 2016 年 6 月的国际超算大会上首次问鼎 TOP500 榜首,并连续四次保持全球第一的领先地位。
2019 年 6 月美国商务部将我国三家 E级超算研制单位列入实体清单,试图限制我国超算技术的发展。在此背景下,国产多核处理器“龙芯”、“神威”、“飞腾”、“海光”等系列的研发取得显著进展,而且围绕这些国产处理器的软件生态建设也在稳步推进,包括操作系统适配、编译器优化以及领域专用库的开发等工作,为构建自主可控的超算技术体系奠定了重要基础。 我国的大型超级计算机的建设和运行以科技部支持的国家超算中心为依托单位,自“十一五”计划开始至今,全国共批复建设完成天津、广州、长沙、深圳、济南、无锡、郑州、昆山、成都和西安等 14 家国家超级计算中心[7],服务于气象、能源、生物医药、人工智能等关键领域。
除了超算中心,人工智能计算中心的布局同样充满看点。目前国内已经建成并运营的城市有7座,其中深圳的计算能力达到1,000PFLOPS,武汉为 200PFLOPS,西安和成都各为 300PFLOPS,许昌、南京和杭州也分别拥有 40 至 100PFLOPS不等的算力[8]。随着东数西算的国家战略深入推进,未来西部地区将逐步成为人工智能算力新兴布局的重要区域。 2 中国科学院超级计算中心发展 2.1 引进七代超算系统 (1)第一代(1996 年):SGI Power ChallengeXL 1996年6月,计算机网络信息中心超级计算应用室引进美国 SGI 公司的共享存储并行计算机 SGI Power Challenge XL,是当时中端市场中最畅销的 HPC 服务器。系统基于美国 Silicon Graphics(SGI)公司的 Power Challenge XL 系统,采用 MIPS RISC 处理器和对称多处理(SMP)架构,包括 16个 MIPS R10000处理器,峰值浮点性能每秒 64亿次,适用于气象模拟、流体力学等科学计算任务。作为中国早期引进的高性能计算系统,为国内超算研究提供了重要的技术参考,推动了并行计算软件的开发。 (2)第二代(1998年):Hitachi SR2201 1998 年,中国科学院引入了 Hitachi SR2201超级计算机,该系统由日本日立(Hitachi)公司研制,属于当时国际先进的大规模并行处理(MPP)系统。SR2201的部署标志着中国超算从早期的SMP架构向更高可扩展性的并行计算体系迈进,为国内科研机构提供了更强的计算能力支撑。 系统采用日立自主研发的PA-RISC架构处理器,主频约150 MHz,支持超标量流水线技术。系统峰值浮点性能每秒 96亿次,具有高可扩展性、低通信开销等特点。 (3)第三代(2000 年):曙光 2000,Dawning-2000 2000 年,中国自主研发的曙光 2000(Dawning-2000)超级计算机正式投入使用,标志着中国超算开始摆脱对国外技术的依赖,进入自主创新的快速发展阶段。该系统由中国科学院计算技术研究所与曙光公司联合研制,强调高速数据交换能力,适用于大规模科学计算。峰值性能达到111.7 GFlops(千亿次浮点运算/秒),成为当时国内最先进的高性能计算平台之一。曙光系列的崛起,代表中国开始自主研发超算系统,减少对国外技术的依赖。曙光 2000是中国首台突破百亿次计算的自主超算,为后续曙光系列(如曙光4000、曙光5000)奠定基础。 (4)第四代(2003 年):深腾 6800 超级计算机 ,Lenovo DeepComp6800 2003 年,由国家 863 项目和中国科学院“十五”信息化专项共同支持、联想公司自主研发的深腾 6800(DeepComp 6800)超级计算机成功面世,峰值性能达到 5.3 TFlops(万亿次浮点运算/秒)。该系统在2003年全球TOP500超级计算机排行榜中位列第 14 名,标志着中国超算首次进入世界前列,并展现了国产超算在商业化与高性能计算结合方面的突破。
(5)第五代(2008 年):深腾 7000 超级计算机 ,Lenovo DeepComp7000
2008 年 ,联 想 集 团 推 出 深 腾 7000(Deep Comp 7000)超级计算机,峰值性能达到 102.8TFlops,成为我国首台突破百万亿次计算的超级计算机。“深腾 7000”是联想集团、北京航空航天大学、中国科学院计算机网络信息中心联合攻关,国家 863计划的重大科技成果。系统采用混合集群架构,结合传统 CPU 计算与 GPU 加速。 CPU 为 Intel Xeon E54xx 系列四核处理器,主频2.33-3.0 GHz,部分节点配备NVIDIA Tesla GPU,实现CPU-GPU异构计算,峰值性能102.8 TFlops。深腾 7000是当时世界上规模最大的节点无盘启动机群系统,也是世界上率先实现对所有硬件部件统一管理和监控功能的机群系统,是国内第一个实际性能突破每秒百万亿次的异构机群系统,在 2008 年 11 月全球 TOP500 排行榜中位列第 19名,标志着中国超算正式迈入“千万亿次时代”。 (6)第六代(2014 年):“元”超级计算机,Era Supercomputer 2014年3月,安装运行在计算机网络信息中心怀柔园区的超级计算机系统“元”启动建设,并分三期建设完成。2014年6月,一期系统完成设备安装,2014 年 11 月上线服务;2015 年 12 月,“元”二期系统完成设备安装,2016年8月上线服务;2017年12月,“元”三期“人工智能集群”完成设备安装,建成人工智能平台并提供试运行服务,2018年10月正式对用户开放服务。 系统采用混合架构,支持异构计算,双精度浮点峰值计算能力约 2.69Pflops,其中 CPU 通用计算能力 750.07 Tflops,采用 Intel MIC 及 Nvidia GPU 的计算能力共1.94Pflops。系统内存总量约152TB,存储总裸容量超过6.9PB。 (7)第七代(2019 年):“东方”超级计算机,ORISE Supercomputer 2019年,中国科学院发挥建制化优势研制了新一代计算机“东方”超级计算系统,面向E级计算重大需求,为中国科学院信息化建设和科研能力提升提供重大支撑。系统采用面向多领域的超融合体系结构,融合了层次化分布式并行存储系统、高效全浸没式相变冷却、超融合资源和调度等最新成果,计算性能卓越。配置基于 x86架构 的 国 产 通 用 处 理 器 和 加 速 卡 ,曙 光 Parastor300S并行存储系统,100PB大容量数据存储,全线速、无阻塞的 200Gb HDR Infiniband 专用计算网络,以及完整、高效、专业的基础软件,包括操作系统、并行编译开发环境等,支持 CPU 和加速卡的多种编译环境及应用,主要包括编译器、调试器、MPI并行开发环境及数学库等。 2.2 研发算法与软件 科学计算涉及众多应用领域。中国科学院超级计算中心以实际应用需求为牵引,从基础软件研究入手,持续设计高效基础算法,自主研发并行框架软件。 2.2.1 自主研发基础软件 (1)并行算法软件包HPSEPS 在科学与工程领域,大规模特征值问题是计算核心,广泛应用于结构动力学分析、量子化学、电子结构和材料科学等多方面。为解决相关计算难题,中心自主研发了目前国际上唯一提供稠密和稀疏特征问题等多个并行求解器的并行算法软件包HPSEPS(High Performance Symmetric Ei genproblem Solvers)。
(2)多预条件稀疏线性代数计算框架HPLES 在科研与工程领域,稀疏线性代数问题的高效求解至关重要。为满足复杂数值计算需求,提升计算效率与精度,中心科研团队自主研制了多预条件稀疏线性代数计算框架HPLES(High Performance Linear Equition Solver)。 HPLES 已在船舶流体仿真、多物理量精确求解、超大规模“多相多组分渗流全隐式模拟”精确求解等多个领域应用,为相关科研工作提供了可靠的计算支持,取得了良好的计算效果。
|