环球科创网

今日时讯:织密算网 超算接入“寻常百姓家”可期

更新时间:2023-07-18 10:20:00

导读 在江苏无锡蠡湖北侧一栋低调的大楼里,中国证券报记者看到曾4次登上世界超级计算机TOP 500榜单第一的国之重器——国家超级计算无锡中心(...

在江苏无锡蠡湖北侧一栋低调的大楼里,中国证券报记者看到曾4次登上世界超级计算机TOP 500榜单第一的国之重器——国家超级计算无锡中心(简称“无锡超算”)“神威·太湖之光”超级计算机。自2016年6月发布以来,“神威·太湖之光”已稳定运行7个年头,支撑了1000多项应用课题的运算需求。记者了解到,无锡超算近日联合中国移动成立国产超算并网实验室,力图攻克并网、传输、调度等方面的难题,降低超算使用门槛。专家认为,超算接入“寻常百姓家”可期。

支持1000多项应用课题

记者来到“神威·太湖之光”超算机房发现,这里只有轻微的环境空调声音。在其他数据中心,风机产生很大噪音,与人交流几乎全靠“吼”。

之所以能做到如此“安静”,工作人员介绍,这是因为“神威·太湖之光”采用水冷的方式降温,超算基本上不会产生噪音。

记者贴近机柜,几乎听不到机器运转的声音,只有水冷设备工作时轻微的流水声。每组运算单元接着两根细细的水管。工作人员强调,水管的接头部件非常关键,要确保不存在任何泄露。得益于高效的低功耗设计与控制体系,“神威·太湖之光”相比同期其他国际顶尖超算系统节能60%以上。同时,各运算单元实现高密度排列,超算中心的寿命也得以有效延长。

整个机房包括40个运算机柜和8个网络机柜,每个运算机柜由4组32块运算插件组成,共安装了40960个自主研发的“申威26010”众核处理器。2016年发布时,凭借每秒12.5亿亿次峰值计算速度,“神威·太湖之光”成为世界上第一台运算速度超过十亿亿次的超级计算机,并连续四次荣获世界超级计算机TOP500榜单第一。

工作人员表示,无锡超算“神威·太湖之光”已应用于航空航天、地球科学、海洋环境、气象气候、生物医药、工业制造等20多个领域,服务用户超300家,已经完成1000余项应用课题的计算任务。

除了支持科研,超算对产业经济、社会民生同样意义重大。例如,无锡超算与远景能源合作开展智慧风场项目,为远景能源提供风资源预测、风场精细选址和风机建造等服务,仅用12天就完成全国风资源数据测算,比原本的45天提速近4倍,数据误差控制到0.5%。

在环保领域,“神威·太湖之光”亦表现不俗。多年来,长三角尤其是环太湖沿边区域持续受到蓝藻污染影响,无锡超算联合国内多家科研院所,实现了对蓝藻出现区域及时间的预测,缩小治理范围,节约治理成本,并确保及时处理。

算力并网让超算更易用

记者调研了解到,近期,无锡超算联合中国移动成立了国产超算并网实验室,共同推进超算智算并网等领域研究,同时在算力感知、算力调度、算力交易、存算一体等关键技术领域进行攻关。

目前,中国移动江苏分公司与无锡超算已经完成运营层对接,并上线了首个云市场超算产品——“神工坊”,为工业企业提供高计算精度、短设计周期、低实验成本的工业仿真服务。2023年,中国移动将重点建设超算并网调度平台,并推进该平台与移动自身的算网大脑联调对接,最终实现算网大脑对超算资源的编排调度。

无锡超算高性能计算技术研究中心副主任、并行优化部部长、高级工程师刘钊告诉中国证券报记者:“在双方合作框架下,把无锡超算的算力纳入到中国移动的算网,通过网络技术以及云平台等手段支持,能够让更多普通用户更便利访问并使用超算的算力资源。”

这对于超算在更多行业应用意义非凡。“中小企业和科研单位经费紧张,不可能自己建一个超算系统,织密算力互联网,能让中小微用户快速通过云服务、租用的方式,开展科学研究。”无锡超算神威生态发展研究中心副主任叶跃进说。

刘钊表示,除了与中国移动联合攻关超算并网技术,无锡超算还参与科技部组织的国家超算互联网项目,推动实现全国超算资源统筹调度。

为满足超算算力多样化和个性化的市场需求,今年4月,科技部高新技术司组织召开国家超算互联网工作启动会。按照计划,到2025年底,国家超算互联网将形成技术先进、模式创新、服务优质、生态完善的总体布局。

对于超算互联网项目,中国工程院院士李国杰认为,我国超级计算机已进入世界第一方阵,但超算应用特别是工业企业的应用与国外还有相当差距。为尽快补齐超算应用短板,让社会各方可以像使用淘宝一样用超算,应尽快连接成高效的超算互联网。

数据传输能力是关键

要实现超算算力的统一编排调度使用,传输能力是关键。然而,受限于技术、成本等因素,很多时候只能采用传统的“人工”送硬盘拷数据的“笨”方法。

“北京4T容量数据要传到无锡,在网络不出错情况下需要5天时间,100T容量数据怎么办?刻成光盘走快递运送。”中国工程院院士、清华大学计算机科学与技术系教授郑纬民日前在2023算力互联互通大会上坦言,算力互联互通建设任重道远。

解决算力互联互通难题迫在眉睫。据了解,某证券公司有一批金融模型需通过“神威·太湖之光”超级计算机训练,因数据量较大,每次传输数据都在TB量级,如使用高速专线,每月费用近百万元,成本过大,而传统物流快递无法满足金融数据的安全要求,目前该机构只能使用人工方式运送数据。

如何以较低成本将数据快速安全地传输至无锡超算?中国移动接下了这一“考题”,并在今年6月底成功攻克技术难题,实现网络弹性服务“神机”的全球首发。中国移动云能力中心副总经理孙少陵介绍,中国移动研发了全球首个网络弹性服务“神机”,实现了传输效率与成本的平衡。

目前,该技术成果已成功应用于无锡超算中心数据传输业务,通过“神机”完成了合肥数据中心与无锡超算机房的网络联通,实现了3小时4T数据的稳定传输,传输效率明显提升;同时,“神机”网络支持弹性计费,随关随停,数据传输成本大幅下降。

免责声明:本文由用户上传,如有侵权请联系删除!