0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

开箱即用,AISBench测试展示英特尔至强处理器的卓越推理性能

looger123 来源:looger123 作者:looger123 2024-09-06 15:33 次阅读

近期,第五代英特尔®至强®可扩展处理器通过了中国电子威廉希尔官方网站 标准化研究院组织的人工智能服务器系统性能测试(AISBench)。英特尔成为首批通过AISBench大语言模型(LLM)推理性能测试的企业。

中国电子威廉希尔官方网站 标准化研究院赛西实验室依据国家标准《人工智能服务器系统性能测试规范》(征求意见稿)相关要求,使用AISBench2.0测试工具,完成了第五代英特尔至强可扩展处理器的AI大模型推理性能和精度测试。测试中,第五代英特尔至强在ChatGLM V2-6B(60亿参数)以及 Llama2-13B(130亿参数)两个模型上均展现出卓越推理性能,能够满足轻量级大语言模型的实时推理要求。

wKgZombasFCAOb28AAQWiisN-UI496.png

测试结果:此次单机性能测试中,在满足人类正常阅读速度要求(生成延迟小于100毫秒)的情况下,在封闭测试场景中构造数据集,基于第五代英特尔至强的服务器可实现:

在60亿参数的ChatGLM V2模型通用推理中,当输入输出序列为256时可达每秒2493 token的性能,当输入输出序列为2048时可达每秒926 token。

在130亿参数的Llama2模型通用推理中,当输入输出为256时可达每秒513 token,当输入输出序列为2048时可达每秒132 token1。


作为通用处理器,第五代英特尔至强在人工智能、网络、存储、数据库等关键工作负载均能提供出色性能。AISBench2.0的测试结果验证了英特尔至强在运行轻量级大语言模型时展现出的优异推理性能,使得客户可以使用基于至强的服务器,构建一个通用AI系统进行数据预处理、模型推理和部署,从而获得兼具AI性能、效率、准确性和可扩展性的组合。这也彰显了英特尔至强可以为企业提供“开箱即用”的功能,即可以在通用系统上部署一部分AI工作负载,从而为客户带来更佳的总体拥有成本(TCO)优势。

软硬结合,至强展现AI优势

英特尔至强的内置AI加速器使其成为在通用处理器上运行部分AI工作负载的理想解决方案,不仅如此,英特尔还配备了经过优化的、易于编程的开放软件,可降低客户和生态伙伴在数据中心部署从云到智能边缘各种基于AI的解决方案的门槛。

第五代英特尔至强可扩展处理器充分发挥了系统级优势(包括缓存、内存等),因此推理速度实现了大幅提升。

其内置的AI加速器——英特尔®高级矩阵扩展(AMX),通过提供专用的矩阵运算加速模块(TMUL),以及支持INT8和BF16这类低精度数据类型,可实现对计算资源的充分利用,从而大幅提升运算效率。

xFasterTransformer(简称xFT)是英特尔提供的在CPU平台上部署大语言模型的深度优化开放解决方案,通过C++Python两种API接口,更易于用户使用和将其集成到自有业务框架中。

关于AISBench

AISBench基准是一套应用于人工智能计算产品的性能测试基准,由中国电子威廉希尔官方网站 标准化研究院牵头研制。与MLPerf等国际先进计算基准类似,该基准用于测试多种人工智能计算产品形态,并支持丰富的测试场景、模式、类型和指标。

产品与性能信息

1.服务器:在搭载第五代英特尔®至强®处理器的Quanta Cloud Technology 服务器 QuantaGrid D54Q-2U上测量,CPU:英特尔至强铂金8592+、64核,超线程开启、睿频开启、NUMA 4,内存:1.5 TB、硬盘:Intel P5800X 3.2TB NVME ,、操作系统:Ubuntu 22.04、测试软件:AISBench、深度学习框架:PyTorch 2.3.1、模型数据精度:BF16。英特尔于2024年6月26日至7月26日进行测试。

客户端:第十一代英特尔®酷睿™i7-1185G7:在戴尔Latitude 7420上测量,内存:16.0 GB、硬盘:256 GB、操作系统:Microsoft Windows 11Enterprise、测试软件:MobaXtermPersonalEdition v22.0 Build 4858。英特尔于2024年6月26日至7月26日进行测试。

测试工具:性能测试工具AISBench 2.0。

免责声明

性能因使用情况、配置和其他因素而异。欲了解更多信息,请访问性能指数网站。性能结果基于截至所示日期的测试,可能无法反映所有公开可用的更新。请参阅备份以了解配置详情。没有任何产品或组件是绝对安全的。您的成本和结果可能会有所不同。英特尔威廉希尔官方网站 可能需要启用硬件、软件或激活服务。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    9983

    浏览量

    171944
  • 至强处理器
    +关注

    关注

    0

    文章

    23

    浏览量

    9201
收藏 人收藏

    评论

    相关推荐

    英特尔至强品牌新战略发布

    品牌是企业使命和发展的象征,也承载着产品特质和市场认可。在英特尔GTC科技体验中心的英特尔 至强 6 能效核处理器发布会上,英特尔公司全球副
    的头像 发表于 10-12 10:13 450次阅读

    英特尔发布至强6性能处理器

    近日,英特尔正式推出了其全新的英特尔® 至强® 6性能处理器(代号Granite Rapids),旨在为AI、数据分析、科学计算等计算密集
    的头像 发表于 09-30 16:22 450次阅读

    英特尔®至强®可扩展处理器助力智慧医疗的数字化转型

    在现代医疗行业,人工智能(AI)、物联网(IoT)和5G网络等前沿威廉希尔官方网站 正在重新定义医疗服务的提供方式。英特尔®至强®可扩展处理器通过在医院从边缘到云端的全面部署,构建了一个高效的数字化解决方案,帮助
    发表于 09-29 11:13 6099次阅读
    <b class='flag-5'>英特尔</b>®<b class='flag-5'>至强</b>®可扩展<b class='flag-5'>处理器</b>助力智慧医疗的数字化转型

    128核性能猛兽,剑指云数据中心算力升级!英特尔发布至强6性能处理器

    9月26日,在全国五十多家媒体和多家合作伙伴的见证下,英特尔发布了英特尔至强6性能处理器(代号Granite Rapids),这是继今年6
    的头像 发表于 09-29 07:53 4504次阅读
    128核<b class='flag-5'>性能</b>猛兽,剑指云数据中心算力升级!<b class='flag-5'>英特尔</b>发布<b class='flag-5'>至强</b>6<b class='flag-5'>性能</b>核<b class='flag-5'>处理器</b>

    英特尔发布至强6性能处理器,携手生态加速数据中心算力升级

    9月26日,英特尔正式发布英特尔® 至强® 6性能处理器(代号Granite Rapids),为AI、数据分析、科学计算等计算密集型业务提
    的头像 发表于 09-27 10:54 4065次阅读
    <b class='flag-5'>英特尔</b>发布<b class='flag-5'>至强</b>6<b class='flag-5'>性能</b>核<b class='flag-5'>处理器</b>,携手生态加速数据中心算力升级

    英特尔发布至强6处理器产品

    以“绿色向新,释放新质生产力”为主题的英特尔至强6能效核处理器新品发布会在北京举行。会上,英特尔重磅推出首款配备能效核的英特尔
    的头像 发表于 09-23 15:48 370次阅读

    采用144核,能效提升66%!英特尔至强6处理器震撼上市,加速数据中心升级

    6能效核处理器基于Intel 3制程工艺,凭借高核心密度及出色的每瓦性能,可在提供高效算力的同时显著降低能源成本。英特尔至强6700E采用144核,可以满足高密度计算需求。令人兴奋的是
    的头像 发表于 06-11 18:13 7493次阅读
    采用144核,能效提升66%!<b class='flag-5'>英特尔</b><b class='flag-5'>至强</b>6<b class='flag-5'>处理器</b>震撼上市,加速数据中心升级

    英特尔首款至强6处理器上市

    在北京这座古都的现代舞台上,英特尔®举行了一场别开生面的新品发布会,主题为“绿色向新,释放新质生产力”。此次盛会聚焦在英特尔至强® 6能效核处理器上,这一划时代的产品不仅代表着
    的头像 发表于 06-11 09:51 588次阅读

    英特尔发布至强6能效核处理器

    英特尔近日发布了一款革命性的处理器产品——至强6(代号Sierra Forest)。这款处理器以其独特的能效核设计和基于Intel 3制程工艺的威廉希尔官方网站 ,在提供
    的头像 发表于 06-07 15:55 580次阅读

    浪潮信息元脑®服务率先支持英特尔®至强®6处理器

    支持最新英特尔®至强®6处理器,具备更出色的性能和能效表现,相比第三代至强处理器
    的头像 发表于 06-07 15:36 405次阅读
    浪潮信息元脑®服务<b class='flag-5'>器</b>率先支持<b class='flag-5'>英特尔</b>®<b class='flag-5'>至强</b>®6<b class='flag-5'>处理器</b>

    宁畅B5000 G5多节点服务采用第五代英特尔至强可扩展处理器

    “基于第五代英特尔 至强 可扩展处理器的宁畅B5000 G5多节点服务,可以在满足大量AI推理场景在吞吐量、时延、容量、并发能力等方面的需
    的头像 发表于 05-27 11:46 845次阅读
    宁畅B5000 G5多节点服务<b class='flag-5'>器</b>采用第五代<b class='flag-5'>英特尔</b><b class='flag-5'>至强</b>可扩展<b class='flag-5'>处理器</b>

    英特尔展示下一代至强处理器,助力vRAN性能显著提升

    里程碑事件不仅凸显了移动行业推动vRAN和Open RAN发展的长期投入,也表明了英特尔正在持续践行其以领先的产品路线图助力行业发展的坚定承诺。代号为Granite Rapids–D的下一代至强处理器将于2025年发布,这款
    的头像 发表于 03-01 15:43 443次阅读
    <b class='flag-5'>英特尔</b><b class='flag-5'>展示</b>下一代<b class='flag-5'>至强</b><b class='flag-5'>处理器</b>,助力vRAN<b class='flag-5'>性能</b>显著提升

    英特尔至强处理器优化升级,助力打造未来高能效数据中心

    英特尔最新发布的第五代至强可扩展处理器,拥有多达64个核心,性能提升高达1.4倍。 英特尔于去年12月正式推出了拥有多达64个核心的第五代
    的头像 发表于 02-26 17:39 751次阅读

    性能存储实现新突破的英特尔至强处理器

    基于第四代英特尔 至强 可扩展处理器的 Curve 高性能分布式存储方案在吞吐、时延、TCO 等方面具备出色优势,能够为金融、互联网、交通、能源等各行业提供高效的云原生存储解决方案。
    发表于 02-26 14:01 511次阅读
    高<b class='flag-5'>性能</b>存储实现新突破的<b class='flag-5'>英特尔</b><b class='flag-5'>至强</b><b class='flag-5'>处理器</b>

    英特尔和AMD处理器的区别和特点

    英特尔和AMD处理器的区别和特点 英特尔(Intel)和AMD是全球最著名的两个处理器制造商。他们都提供高性能、可靠的芯片,为消费者和企业用
    的头像 发表于 01-30 14:28 2572次阅读