电子发烧友原创 章鹰
“美国的高端GPU对中国禁售,即使是英伟达面对中国市场供应的A800,也是一卡难求。现在一些互联网大厂已经在抢英伟达2024年产品了,本来供需矛盾就在,今年加上ChatGPT为代表的生成式 AI 应用引发新一轮算力需求,导致供需矛盾特别突出。”沐曦高级产品总监周彬表示。
数字时代爆发的威廉希尔官方网站
变革,使得智能化加速。根据 IDC 数据,2023年全球高性能 AI 服务器市场规模预计达 248 亿美元,年增率预计高达 27%。国产GPU有哪些突破?国产图形处理器厂商沐曦最新带来了哪些旗舰产品?本文为你详细报道。
国产GPU现状不容乐观! 沐曦发力通用GPU芯片
“目前在人工智能的负载,CPU+GPU的异构计算引领计算新趋势。CPU负责逻辑控制,GPU来专职做计算;另一方面,GPU本身的迭代速度比CPU快很多。根据调研机构IDC的数据,GPU作为现如今通用算力的核心基础设施承接了约90%的算力供应。” 沐曦高级产品总监周彬分析说,“现在的市场格局,基本上英伟达一家占据86%的市场份额,再加上AMD、英特尔,总计占据99%的市场,目前国产GPU的市场份额基本上可以忽略不计。”
国产GPU迫在眉睫,突破之路也是任重道远。沐曦集成电路成立于2020年9月,致力于研发具有自主知识产权的国产高性能GPU芯片及其应用生态,设计的GPU芯片将广泛应用于数据中心、AI以及其他需要高性能计算的行业。
“沐曦集成电路聚焦打造世界一流的GPU芯片和计算平台,这是软硬件的集合。英伟达最强的是GPU芯片和CUDA生态平台结合。” 周彬指出,“沐曦自主研发了三大产品线,包括曦思N系列,曦云C系列和曦彩G三大系列高性能通用计算GPU及方案。曦思N系列面向AI推理,可以适用于智慧城市和视频分析,还有视频转码场景;曦云C系列是面向AI训练的产品线,面向大小模型的AI推理;曦彩G系列产品是带有渲染功能的,GPU面向数据中心的大规模云端渲染,还有未来元宇宙应用场景。”
沐曦首款人工智能推理GPU曦思N100量产
沐曦高级产品总监周彬介绍,2022年,沐熙集成电路推出了曦思N100,现在处于规模化量产和大规模出货状态。
图:曦思N100 来自沐熙官方微信
曦思N100是沐曦面向人工智能推理场景推出的高效能GPU产品,内置 MXN100 异构 GPGPU 处理器以及 HBM2E 显存,单卡算力达 160TOPS(INT8)和 80TFLOPS(FP16),能够提供最高 128 路编码和 96 路解码的视频处理能力,兼容 HEVC、H.264、AV1、AVS2 等多种视频格式,最高支持 8K 分辨率。
同时,曦思N100配备了沐曦自主研发的MXMACA软件栈,支持多种主流框架的网络模型,其中包括简单易用的MacaRT推理引擎、开箱即用的Model Zoo和应用实例,同时也对主流软件生态如FFMPEG、OpenCV等进行了兼容支持,实现了各类应用场景和业务模型的快速迁移。支持应用于智慧城市、智慧安防、智慧交通、云计算、智能视频处理等场景。
沐曦首款面向AI训练和通用计算芯片曦云C500流片
周彬透露,沐曦首款面向人工智能训练及通用计算的旗舰产品曦云C500在今年6月流片,这款芯片提供强大高精度及多精度混合算力,配备大规格高带宽显存,片间互联MetaXLink无缝链接多GPU系统,自主研发的MXMACA软件栈可兼容主流GPU生态,能够全面满足大模型推理和训练需求。
曦云MXC500芯片已于2023年6月13日完成基础测试,预计将于今年年底实现量产。
图:曦云C500 来自沐曦官方微信
曦云C500单卡算力高达30TFlops FP32,单卡64GB HBM2E高带宽显存,带宽1.8TB/s,这张卡还配备自研MetaXlink高速接口,适合于大模型训练。4卡既可以支持65B大模型推理,8卡可以支持130B模型推理。采用通用 GPU 架构,兼容 CUDA,预计年底规模出货。
-
gpu
+关注
关注
28文章
4729浏览量
128893
发布评论请先 登录
相关推荐
评论