0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AMD ROCm 6.1升级MIPOpen 3.1,引入AI参数预测模型

微云疏影 来源:综合整理 作者:综合整理 2024-02-29 14:33 次阅读

最新消息,自 AMD 去年 12 月份公布 ROCm 6.0 以来,已经开始积极筹备 6.1 版的发布,以提高与英伟达(NVIDIA)CUDA 竞争的核心实力。

在此期间,AMD 频繁向GitHub公共仓库推送有关 ROCm 6.1 的最新开发进展,透露出不久后有可能正式上线新版本的意图。

据悉,此次 ROCm 6.1 主要的突破在于其升级至全新版本的 MIPOpen 3.1;新增了使用AI进行参数预测的 conv_hip_igemm_group_fwd_xdlops 求解器;解决了当前版本的众多 BUG,以及引入了新的求解器算法

此外,该系列还努力提升了系统性能,尤其是优化了MIGraphX功能,包含但不限于加入对FP8精度的支持,以及增加更多运算符等,同时更新了针对 Whisper / Llama-2 / Stable Diffusion 2.1 的文档示例,以及提供新的ONNX示例,以便更好地适应 GEMM 的BLAS自动调整。

更重要的是,为了改善在Microsoft Windows 环境下运行 MIGraphX的效率,AMD特别推出了全新的“hipother”资源库。

值得一提的是,HIP 威廉希尔官方网站 是AMD专有的C++运行时API和内核语言,适配可移植的AMD/NVIDIA GPU应用程序,而HIPIFY 工具则能协助将CUDA源码便捷地转化成HIP脚本。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5470

    浏览量

    134203
  • 英伟达
    +关注

    关注

    22

    文章

    3778

    浏览量

    91151
  • 求解器
    +关注

    关注

    0

    文章

    77

    浏览量

    4535
收藏 人收藏

    评论

    相关推荐

    AI模型部署边缘设备的奇妙之旅:目标检测模型

    ,PReLU仍然能够在正输入区域促进稀疏激活,这对模型的学习是有利的。 缺点 增加模型复杂度:由于引入了额外的可学习参数 α,这增加了模型
    发表于 12-19 14:33

    AMD发布10亿参数开源AI模型OLMo

    AMD公司近日宣布了一项重大进展,推出了首个完全开放的10亿参数语言模型系列——AMD OLMo。这一举措为开发者和研究人员提供了强大的AI
    的头像 发表于 11-12 18:08 448次阅读

    解锁新玩法 | 迅为龙芯3A5000升级UEFI,全面支持银河麒麟系统

    解锁新玩法 | 迅为龙芯3A5000升级UEFI,全面支持银河麒麟系统
    的头像 发表于 10-21 11:23 365次阅读
    解锁新玩法 | 迅为龙芯3A5000<b class='flag-5'>升级</b>UEFI,全面支持银河麒麟系统

    从ADS7813升级到ADS8513

    电子发烧友网站提供《从ADS7813升级到ADS8513.pdf》资料免费下载
    发表于 10-21 09:59 0次下载
    从ADS7813<b class='flag-5'>升级</b>到ADS8513

    英伟达发布AI模型 Llama-3.1-Nemotron-51B AI模型

    英伟达公司宣布推出 Llama-3.1-Nemotron-51B AI 模型,这个AI模型是源自 Meta 公司的 Llama-
    的头像 发表于 09-26 17:30 610次阅读

    Meta Llama 3.1系列模型可在Google Cloud上使用

    我们很高兴宣布,Llama 3.1 系列模型已添加到 Vertex AI Model Garden,这包括全新的 405B,即 Meta 迄今为止功能最强大、用途最广泛的模型。这些
    的头像 发表于 08-02 15:42 397次阅读

    Meta发布全新开源大模型Llama 3.1

    科技巨头Meta近期震撼发布了其最新的开源人工智能(AI模型——Llama 3.1,这一举措标志着Meta在AI领域的又一重大突破。Meta创始人马克·扎克伯格亲自站台,盛赞Llam
    的头像 发表于 07-24 18:25 1445次阅读

    NVIDIA AI Foundry 为全球企业打造自定义 Llama 3.1 生成式 AI 模型

    借助 NVIDIA AI Foundry,企业和各国现在能够使用自有数据与 Llama 3.1 405B 和 NVIDIA Nemotron 模型配对,来构建“超级模型” NVIDIA
    发表于 07-24 09:39 715次阅读
    NVIDIA <b class='flag-5'>AI</b> Foundry 为全球企业打造自定义 Llama <b class='flag-5'>3.1</b> 生成式 <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>

    将Non-OS SDK从1.3.0升级到1.4.0后,AT CWLAP命令将无法再找到我的AP,为什么?

    将Non-OS SDK从1.3.0升级到1.4.0(AT版本0.40升级到0.50)后,AT CWLAP命令将无法再找到我的AP。它仍然会找到一些 AP,但不是我想使用的 AP,它在物理上最接近
    发表于 07-17 06:00

    如何将stm32f207的以太网库中lwip1.3.2升级到1.4.1?

    如何将stm32f207的以太网库中lwip1.3.2升级到1.4.1
    发表于 05-17 08:04

    通义千问开源千亿参数模型

    通义千问近日开源了其首个千亿参数模型Qwen1.5-110B,这是其全系列中首个达到千亿级别的开源模型。Qwen1.5-110B模型继承了Qwen1.5系列的Transformer解
    的头像 发表于 05-08 11:01 757次阅读

    微软MSN天气服务引入全新AI模型

    微软在天气预测领域取得了突破性的进展,为MSN天气服务引入了全新的AI预测模型。该模型由微软St
    的头像 发表于 05-07 09:25 570次阅读

    STM32CubeMX版本升级由6.2.1升级到6.3.0后原工程重新编译code文件变大什么原因?

    STM32CubeMX版本升级由6.2.1升级到6.3.0后原工程重新编译code文件变大什么原因
    发表于 04-02 07:31

    防止AI模型被黑客病毒入侵控制(原创)聆思大模型AI开发套件评测4

    模型并为其提供了输入数据。最后,我运行了模型的推理,并输出了预测结果。此外,还需要考虑其他因素,如模型的优化器、损失函数和评估指标等。 为了防止A
    发表于 03-19 11:18

    用Psoc Programmer给Miniprog4升级失败了,导致工具一直闪烁黄灯怎么解决?

    我这边用Psoc Programmer给Miniprog4升级失败了,导致工具一直闪烁黄灯,红灯常亮,插在电脑上无法识别,请帮忙解决,谢谢。
    发表于 02-19 07:31