0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

超算芯片霸主之争,终究将迎来结局

如意 来源:虎嗅APP 作者:虎嗅APP 2020-11-17 11:07 次阅读

2020年4月,以近70亿美元被英伟达最终收购的以色列顶级数据中心网络威廉希尔官方网站 公司Mellanox,在长达半年多的“沉默”后,在11月迎来了两件足以引起业内轰动的大事。首先,陪Mellanox走了21年,并一手促成这笔交易的创始人兼首席执行官Eyal Waldman宣布离职,并留下了一句颇为潇洒的话:

“在达成这笔交易时,我就知道我要离开了。你知道我用几十年创建一家公司并做出所有决策,不是用来做第二名的。”

其次,就在今天,Mellanox作为英伟达GPU家族的一部分,被英伟达融入了新的网络连接架构产品——NVIDIA Mellanox 400G InfiniBand。

此后,它将以“GPU伴侣”的身份,率先打入数据中心市场的最精锐部队——超级计算机市场。

NVIDIA Mellanox 400G InfiniBand产品的架构组成。简单来说,就是一个用以连接其他服务器与英伟达产品的组件

英伟达在今天的全球超级计算大会上,再次刷新了自己最强大GPU产品线——企业级加速器A100的 性能纪录。

新一代的A100 GPU将高带宽内存提升至80GB,比上一代扩大一倍。这意味着,每秒超过2TB的内存带宽,会让数据在内存与GPU之间流通得更加迅速,以便“承受”研究人员建立更大规模人工智能模型和数据集带来的压力。

“现在要在AI和高性能计算(HPC)的研究成果上继续突破上限,科学家们必须要构建更大更复杂的模型,那么便需要比以往更大的内存容量与更高的带宽。” 英伟达应用深度学习研究副总裁Bryan Catanzaro指出。

英伟达在英国剑桥的超算中心部署了由若干块A10080GB组成的DGX系统

实际上,除了改变芯片产品的架构,把成百上千块芯片用最高效的形式“连”起来,当然也能解决科学家们每秒/百亿亿次的超大计算需求,而收购的Mellanox的用意便在于此。

如果你见过位于无锡的中国超级计算机“太湖之光”,就会发现“这台计算机”其实是一个由成百上千台黑色机柜组成的计算机集群,可以填满一间约1000平米的屋子。

它既可以被称为“高性能计算机群”,也可以被看做是一个不小规模的数据中心。

当然,这些黑色机柜的性能,要比普通服务器强大太多,由4万多块不同种类的国产芯片组成,仅集成它们就是一项极为艰巨的任务,用时两年,总投入超过了18亿人民币。

位于无锡超算中心的太湖之光

而NVIDIA Mellanox 400G InfiniBand的作用,便是将超级计算机中上万块CPU、GPU以及其他种类芯片“连接”在一起。在发挥性能最大化的同时,每块芯片的数据传输效率也不能有太多损耗。

“之前CPU与GPU之间的互联,都是通过英伟达的NVlinks(一种总线及其通信协议),但这个东西互联的效率没有特别好,不能简单扩展到上千块芯片互联的超算场景。”参与研发过TPU,芯英科技联合创始人杨龚轶凡告诉虎嗅,Mellanox擅长的便是此前英伟达最大的短板之一,

“一台超级计算机,各品牌芯片之间的高效配合,极为重要。之前英伟达的NVlinks只能和IBM的CPU互联。而收购Mellanox后,英伟达增强了用芯片构建超算系统的可扩展性,可以让GPU与其他品牌和种类的芯片进行连接。”

换句话说,英伟达找到了“让自己产品轻松插进包括英特尔在内,所有服务器芯片接口”的方法。

超算市场,不可忽视的芯片掘金地

英伟达的这次全系列产品,无一例外面向的都是“烧钱魔窟”——超级计算机市场。

举个例子,在2020年6月颁布的全球超级计算机Top500榜单上,排名第二的美国橡树岭国家实验室超级计算机Summit,在每个节点配备了2个IBM的 Power9 CPU和 6个英伟达的Tesla V100。这样的节点有4356个,总耗资2亿美元。

而在2019年3月,美国能源部阿贡实验室公开宣布,将耗资5亿美元搭建新一代超级计算机 Aurora 。这台将在2021年实现交付的超级计算机,并非追求一味追求计算速度,而是需要针对人工智能等新威廉希尔官方网站 应用采用新的设计思路。

那么这笔巨额政府合同的主要受益者是谁?外界猜测是美国最大的CPU生产商英特尔与著名超算系统集成商Cray。

但不可忽视的是,随着超算系统被用在人工智能研究领域的次数越来越多,额外装载的加速芯片GPU,逐渐成为搭建超级计算机的必选品。

因此,英伟达也在全球许多超算项目中获得了颇为丰厚的收益,包括美国威廉希尔官方网站 最强大的国家实验室——橡树岭实验室、阿贡实验室,都是英伟达最好性能产品的首批尝鲜者。

美国迄今最强的超级计算机Summit(巅峰),在最新的Top500榜单中排名第2。

超级计算机之间的竞争,从来都被看作是国家之间威廉希尔官方网站 实力的竞争。

尽管这是一个狭隘的衡量标准,但这些超级计算机群的确在很多军事与科学任务中发挥着极为重要的作用,譬如武器设计与密码破译,再譬如interwetten与威廉的赔率体系 气候变化,研究与诊断新冠病毒。

很多前所未有的材料与化学实验,不太可能在云端执行,因此部署高性能服务器便显得格外重要。

“没有人愿意烧很多钱去做一些几十年没成果的新威廉希尔官方网站 研究,但是这些研究却很有必要,那么这些新威廉希尔官方网站 的运算就需要超级计算机来支持。”一位业内人士告诉虎嗅。

而这场竞争中,中国与美国理所当然是最为强劲的参赛选手,也是最愿意砸钱做超算系统的两个科技大国。

2020年6月,尽管Top500的榜首之位,被日本神户理研计算中心耗资10亿美元的超算系统Fugaku夺走,但在这500个超级计算机中,中国拥有其中226个系统,而美国则占据114个。

2020年6月最新榜单的前10名。在2016年~2017年蝉联4次冠军的中国超级计算机太湖之光位于第四名,天河二号第五名。

因此,如果按照每台超级计算机单价上亿美元来计算,这是一个令人垂涎的市场。而政府一次又一次创下记录的巨额订单,对商业公司产生着越来越大的吸引力;

此外,毫无疑问,由于超级计算机运行的都是难度最高的威廉希尔官方网站 研发任务,它们的存在,是未来威廉希尔官方网站 下沉到工业和消费级市场的源动力。

国家之间的超级计算机之战从几十年前就已打响。一开始,大多数超级计算机使用的微处理器都是从英特尔和AMD的PC芯片演变而来,然而,就是在过去5年里,数据量开始如爆炸般增长,新威廉希尔官方网站 应用层出不穷,因此最强大的超级计算机已经开始加大专业芯片的使用力度,而英伟达,便是最大的受益者之一。

从图中可以看出,2020年~2025年产生的数据量,是2010~2020年数据量的三倍。图片来自英伟达。

不过有意思的是,日本Fugaku打败中国和美国最强计算机的“源动力”,竟然是富士通的48核 A64FX SoC,这应该是榜单上第一个由ARM处理器提供动力的超算系统(虽然不想把英伟达和ARM的收购联系起来,但这好歹是个开始)。

“未来超算市场,目前现在的共识是HPC+AI。也就是说,未来AI是超算的典型应用,而且量级很大。所以英伟达,想要作为未来霸主,保持在这个市场的领先地位。当然,高性能计算市场,一切都没那么容易。”
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    455

    文章

    50772

    浏览量

    423431
  • NVIDIA
    +关注

    关注

    14

    文章

    4985

    浏览量

    103027
  • 超级计算机
    +关注

    关注

    2

    文章

    462

    浏览量

    41945
收藏 人收藏

    评论

    相关推荐

    ETH-X节点:开辟AI力约束突破的新路径

    AI力提升新途径,为构建ETH-X节点互联开放协作产业生态提供支撑。同时,共同编制相关威廉希尔官方网站 规范,为行业树立标准,引导节点威廉希尔官方网站 高质发展。
    的头像 发表于 11-09 10:03 762次阅读
    ETH-X<b class='flag-5'>超</b>节点:开辟AI<b class='flag-5'>算</b>力约束突破的新路径

    本源“量融合先进计算平台”入选2024力中国·年度重大成果

    入选。图为2024中国力大会“力中国·年度重大成果”“量融合先进计算平台”项目奖项证书该量融合先进计算平台项目量子计算和超级计算的
    的头像 发表于 10-16 08:06 370次阅读
    本源“量<b class='flag-5'>超</b>融合先进计算平台”入选2024<b class='flag-5'>算</b>力中国·年度重大成果

    哈尔滨即将迎来力新纪元:中国移动智中心节点盛大启用

    8月22日,来自“哈尔滨发布”公众号的最新消息振奋人心,宣布了中国移动智中心(哈尔滨)节点的一项重大进展——其万卡智集群将于8月30日正式投入运营。这一里程碑式的投用,不仅标志着哈尔滨市在人工智能研发领域的
    的头像 发表于 08-22 15:19 664次阅读

    光子计算芯片最新突破,峰值1000tops,比电芯片更适合大模型

    电子发烧友网报道(文/李弯弯)近日,国内光计算芯片公司光本位科技宣布,公司已完成算力密度和力精度均达到商用标准的光计算芯片流片。这颗芯片的矩阵规模为128×128,峰值
    的头像 发表于 07-08 07:18 4632次阅读
    光子计算<b class='flag-5'>芯片</b>最新突破,峰值<b class='flag-5'>算</b>力<b class='flag-5'>超</b>1000tops,比电<b class='flag-5'>芯片</b>更适合大模型

    预定下代第一?富士通144核Arm处理器公开

    设计A64FX SoC,整个集群的峰值性能可以达到537.21PFlop/s。如此强大的性能,甚至于日本东京工业大学、日本东北大学等都宣布借助富岳来开发日语生成式AI。   然而在最新的TOP500排行榜上,随着更新的英特
    的头像 发表于 06-24 00:26 2769次阅读
    预定下代<b class='flag-5'>超</b><b class='flag-5'>算</b>第一?富士通144核Arm处理器公开

    最新Top500榜单公布:Frontier再夺魁首,Aurora破百亿大关

    此次Top500排行榜中只有一个显著变动:瑞士国家超级计算机中心的Alps凭借270 PFlop/s的Rmax LINPACK FP64力排名上升至第六,超过了IBM POWER9处理器和Nvidia Volta GV10
    的头像 发表于 05-14 09:36 823次阅读

    思必驰DFM-2大模型入驻国家互联网平台

    近日,思必驰DFM-2大模型入驻国家互联网平台,双方携手共进,共同推动大模型的落地应用,为传统产业提质焕新提供新动能。
    的头像 发表于 05-11 10:25 629次阅读
    思必驰DFM-2大模型入驻国家<b class='flag-5'>超</b><b class='flag-5'>算</b>互联网平台

    揭秘芯片力:为何它如此关键?

    在数字化时代,芯片作为电子设备的核心组件,其性能直接关系到设备的运行速度和处理能力。而芯片力,即其计算能力,更是衡量芯片性能的重要指标。那么,
    的头像 发表于 05-09 08:27 1047次阅读
    揭秘<b class='flag-5'>芯片</b><b class='flag-5'>算</b>力:为何它如此关键?

    科学计算的下一轮创新,AI与数字孪生

    随着超大规模云服务厂商、互联网巨头和各国中心纷纷投入到AI的开发中来,这类系统的应用范围已经被极大地扩宽了,比如数字孪生等。就连SDA厂商Cadence,也加入搭建AI
    的头像 发表于 05-07 00:16 2004次阅读
    科学计算的下一轮创新,AI<b class='flag-5'>超</b><b class='flag-5'>算</b>与数字孪生

    “捷智”正式入驻国家互联网平台

    ABSTRACT摘要2024年4月2日,本公司旗下力服务品牌“捷智”正式入驻国家互联网平台,开设云gpu旗舰店。我们借助国家
    的头像 发表于 04-12 08:26 571次阅读
    “捷智<b class='flag-5'>算</b>”正式入驻国家<b class='flag-5'>超</b><b class='flag-5'>算</b>互联网平台

    千亿美元打造一个系统,成本越来越高的AI

    电子发烧友网报道(文/周凯扬)从近年来新发布的算机器和新的HPC AI性能榜单可以看出,AI力已经在中成了不可忽视的性能指标之一,但也为厂商带来了更大的成本挑战。比如微软近期就
    的头像 发表于 04-09 00:19 3056次阅读

    赛昉科技与聚变达成战略合作,RISC-V在数据中心迎来历史性跨越

    ;赛昉科技联合创新中心,赛昉科技为数据中心场景打造的首款研发代号为“狮子山”的RISC-V芯片应用在聚变的智产品中。贯彻发展新质生产力的时代要求,赛昉科技
    的头像 发表于 03-23 08:18 921次阅读
    赛昉科技与<b class='flag-5'>超</b>聚变达成战略合作,RISC-V在数据中心<b class='flag-5'>迎来</b>历史性跨越

    智能力规模通用力,大模型对智能力提出高要求

    的缩写,即每秒所能够进行的浮点运算数目(每秒浮点运算量)。   力可以分为通用力、智能力和算算力。早前通用力占整体
    的头像 发表于 02-06 00:08 6334次阅读

    国产ARM建设历程 Arm计算在领域的实践

    ARM 指令集兼容架构已成为HPC 主流威廉希尔官方网站 与未来发展的重要趋势,可满足大型系统与商用HPC 系统的威廉希尔官方网站 需求。
    的头像 发表于 01-25 14:06 1248次阅读
    国产ARM<b class='flag-5'>超</b><b class='flag-5'>算</b>建设历程 Arm计算在<b class='flag-5'>超</b><b class='flag-5'>算</b>领域的实践

    力网络面临三大挑战

    2024年,以AIGC为代表的人工智能威廉希尔官方网站 进一步激发力需求,力网络、智中心、中心
    的头像 发表于 01-12 10:39 1099次阅读