财经
实探“神威·太湖之光”!“高大上”的超算要惠及“寻常百姓家”一个深爱的女孩歌词
2023-11-09 12:00  浏览:45

  在江苏无锡蠡湖北侧一幢十分低调的大楼里,中国证券报记者看到了曾4次登上世界超级计算机TOP500榜单第一的国之重器——国家超级计算无锡中心“神威·太湖之光”超级计算机。自2016年6月发布以来,“神威·太湖之光”已稳定运行了7个年头,支撑了1000多项应用课题的运算需求。如今,国家超级计算无锡中心(简称“无锡超算”)希望向更多行业、更多用户赋能,持续发挥“神威·太湖之光”超算资源的“光和热”。

  记者了解到,无锡超算近日联合中国移动成立国产超算并网实验室,力图攻克并网、传输、调度等方面的难题,降低普通用户使用超算的门槛。

  “安静”地支持1000多项应用课题

  来到“神威·太湖之光”机房,记者发现,这里意外地并不吵,只有轻微的环境空调的声音。要知道,在一些数据中心,风机产生的噪音巨大,想要在机房完成调研采访几乎全靠“吼”。

  之所以能做到如此“安静”,工作人员介绍,这是因为“神威·太湖之光”采用了水冷的方式降温,超算本身基本不产生运算噪音。

  记者在贴近机柜时,确实几乎听不到机器运转的声音,只有水冷设备工作时轻微的流水声。同时可以看到,每组运算单元上都接着两根细细的水管。工作人员强调,水管的接头部件非常关键,以确保不存在任何泄露的可能性。得益于全方位高效的低功耗设计与控制体系,“神威·太湖之光”比同时期其他国际顶尖超算系统节能60%以上,各运算单元也能够实现高密度排列,整个超算中心的寿命也得以有效延长。

  整个机房有三列大的黑色机柜组,共包括40个运算机柜和8个网络机柜,每个运算机柜都由4组32块运算插件组成,共安装了40960个中国自主研发的“申威26010”众核处理器。2016年对外发布时,凭借每秒12.5亿亿次峰值计算速度,“神威·太湖之光”成为世界上第一台运算速度超过十亿亿次的超级计算机。2016年发布以来,连续四次荣获世界超级计算机TOP500榜单第一,多次斩获高性能计算应用领域最高奖“戈登·贝尔”奖。

  工作人员表示,无锡超算“神威·太湖之光”已应用于航空航天、地球科学、海洋环境、气象气候、生物医药、工业制造等20多个领域,服务用户超300家,已经完成1000余项应用课题的计算任务,平均每天完成超7000项作业任务。

  推进并网让超算更易用

  在调研中,记者了解到,近期,无锡超算联合中国移动成立了国产超算并网实验室,共同推进超算智算并网等领域研究,同时在算力感知、算力调度、算力交易、存算一体等关键技术领域进行攻关。

  双方按照运营层对接、管理编排层对接、云原生纳管三大步骤进行并网技术方案研究,完成对超算资源的调度和纳管,实现超算算力并网,并对外提供服务。

  目前,中国移动江苏分公司与无锡超算已经完成运营层对接,并上线了首个云市场的超算产品——“神工坊”,为工业企业提供高计算精度、短设计周期、低实验成本的工业仿真服务。2023年,中国移动将重点建设超算并网调度平台,并推进该平台与移动自身的算网大脑的联调对接,最终实现算网大脑对超算资源的编排调度。

  国家超级计算无锡中心高性能计算技术研究中心副主任、并行优化部部长、高级工程师刘钊告诉中国证券报记者:“在双方合作框架下,我们把无锡超算的算力纳入到中国移动的算网里,通过一些网络技术以及云平台等技术的支持,能够让更多普通用户更便利地访问并使用超算的算力资源。”

  这对于推广扩大超算在更多行业应用意义非凡。“中小企业和科研单位经费紧张,不可能自己建一个超算系统,织密一张算力的互联网,能让这些中小微用户快速地通过云服务、租用的方式,开展科学研究。” 国家超级计算无锡中心神威生态发展研究中心副主任叶跃进说。

  刘钊还表示,除了与中国移动联合攻关超算并网,无锡超算还在参与科技部组织的国家超算互联网项目,推动实现全国超算资源统筹调度。

  对于超算互联网项目,中国工程院院士李国杰在接受媒体采访时指出,我国超级计算机已进入世界第一方阵,但超算应用特别是工业企业的应用与国外还有着相当的差距。为尽快补齐超算应用的短板,让社会各方可以像使用淘宝一样用超算,应尽快连接成高效的超算互联网。

  互联互通技术是关键

  采访中,记者了解到,受限于技术和成本等因素,派专人拿硬盘来超算中心拷数据做运算并不是玩笑话,而是不得不面对的无奈现实。算力的互联互通技术成为当前产业界关切的关键问题。据了解,某证券公司有一批金融模型需通过“神威·太湖之光”超级计算机训练,因数据量较大,每次传输数据都在TB量级,如使用高速专线,每月费用达近百万元,成本过大,而传统物流快递又无法满足金融数据安全,因此该机构目前只能使用人工方式运送硬拷贝,每次传递数据往返周期长达数天。

  如何才能帮助该公司以较低成本将数据快速安全地传输至无锡超算?

  中国移动接下了这一“考题”,并在今年6月底成功攻关,实现网络弹性服务“神机”的全球首发。中国移动云能力中心副总经理孙少陵介绍,中国移动研发了全球首个网络弹性服务“神机”,实现了传输效率与成本的平衡。

  目前该技术成果已成功应用于无锡超算中心数据传输业务,通过“神机”网络完成合肥数据中心与无锡超算中心本地机房的网络联通,实现了3小时4T数据的稳定传输,传输速率相比之前传统网络数据传输方式有着明显提升;同时“神机”网络支持弹性计费,随关随停,按照超算中心数据传输场景,1天中1次4T数据传输工作仅3小时收费,成本相较于传统专线24小时收费可节省87.5%。

  对于这一成果,超算领域专家,中国工程院院士郑纬民也予以公开“点赞”:“这一成果,有效解决了当前超算在科研、商业化应用时,遇到的数据传输问题,不仅为我国超算领域带来了重大突破,也为其他领域提供了可靠的数据传输解决方案。”

发表评论
0评