0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Imagination 与 MulticoreWare 合作将 GPU 威廉希尔官方网站 用于全新的双目视觉方案

颖脉Imgtec 2022-11-30 15:41 次阅读

Imagination 近日宣布了与MulticoreWare.Inc公司的合作,后者是多核和异构计算环境软件解决方案和开发工具的领先供应商。MulticoreWare公司在展锐T710开发板上实现双目视觉算法stereoBM的openCL版本的移植和优化,移植后的算法在GPU平台上性能提升明显。展锐T710开发板内部集成了Imagination GM9446显示芯片,主频为800MHz,采用12nm工艺制造,支持openCL4.0, openCL1.2和openGL3.0版本,最高性能能够达到128 FP32 FLOPs/Clock 和256 FP16 FLOPs/Clock。CPU支持八核处理器,主频2.0GHz, 内部集成AI神经网络处理器NPU,综合算力达4.2TOPS。29a56fb8-7045-11ed-b116-dac502259ad0.png为了进一步提升开发板的算力,MulticoreWare团队在双目视觉stereoBM的OpenCL实现中,使用了开发板的Imagination GM9446系列GPU作为运算核心,相对于传统CPU的双目视觉算法stereo版本得到了极高的加速比。这组算法的设计充分使用了Imagination GM9446的特点,采用大窗口尺寸和小分辨率图像620x188,local memory存储优化等方式提高了程序的性能。

算法经过调整不同的参数,窗口winSize大小为21,n_disp为64的时候,性能达到最佳。通常kernel越复杂,寄存器占用的空间就越大,最大工作组的大小就越小,有时候发挥不出来并行流水线的最大数量,从而影响性能。

29c21514-7045-11ed-b116-dac502259ad0.png

MulticoreWare公司团队在对kernel代码优化内部的寄存器使用量,根据GM9446内部结构,设置合理的global全局工作组大小256x图片高度,local工作大小为256,从而最大程度发挥GPU并行流水线的并发量,一般情况下,第一个维度的工作组大小应该是wave大小的倍数(例如32),这样可以充分利用wave资源,MulticoreWare团队根据多年优化经验,手动调整工作组大小以满足这个条件来保证性能有所提升。29d69908-7045-11ed-b116-dac502259ad0.png此外内存读取也是影响kernel运行效率的一方面,在OpenCL中一般有全局global内存,本地local内存,常量Constant和Private四种形式组成,MulticoreWare公司团队在将stereo算法重新调整内存布局,将主机内存使用零拷贝威廉希尔官方网站 与GPU内存直接填充,另外将内核kernel多次内存访问的数据,从global内存转存到local内存中,虽然增加了一次转存数据的时间,但是对于对此存取数据整体时间是缩减的,从降低IO时间的角度整体提高了kernel内核的运行效率,性能也有所改善。运行10次后进行效率对比,GPU比CPU计算最高提速80倍左右,平均提速50倍左右。

CPU(展锐T710 2.0GHz)

CPU(Unisoc T710, 2.0GHz)

GPU

(Imagination GM9446)

倍数

Multiple

131.935 ms0.76 ms41.9
256.17 ms0.699 ms80.3
354.22 ms0.72 ms75.3
451.67 ms0.77 ms67
531.72 ms0.74 ms42.8
627.12 ms0.73 ms37.1
733.35 ms0.77 ms43.3
850.12 ms0.75 ms66.8
931.29 ms0.71 ms44
1029.73 ms0.72 ms41.29

未来Imagination和MulticoreWare两家公司将致力于共同促进OpenCL在行业中的广泛采用,鼓励OpenCL广泛应用于异构计算、APU、以及CPU和GPU独立计算的领域中,实现计算资源利用率最大化、高效率处理数据传输。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4730

    浏览量

    128905
收藏 人收藏

    评论

    相关推荐

    Imagination 系列研讨会 |中国生成式 AI 的发展

    近期,Imagination陆续推出全新系列研讨会,涵盖边缘AI如何推动工业物联网的发展,生成式AI,智能汽车未来发展趋势等等多个热门话题。本期研讨会中,Imagination中国区
    的头像 发表于 12-09 16:57 256次阅读
    <b class='flag-5'>Imagination</b> 系列研讨会 |中国生成式 AI 的发展

    用于机器视觉应用的智能机器视觉控制平台

    看51camera的合作伙伴Neousys宸曜科技的Nuvis系列工控机。Nuvis系列机器视觉控制平台是适用于现如今机器视觉市场的高整合机器视觉解
    的头像 发表于 11-23 01:08 169次阅读
    适<b class='flag-5'>用于</b>机器<b class='flag-5'>视觉</b>应用的智能机器<b class='flag-5'>视觉</b>控制平台

    Imagination DXS GPU荣获ASIL-B官方认证

    全球硅知识产权(IP)领域的佼佼者Imagination Technologies宣布了一项重要成就:其专为汽车领域打造的Imagination DXS GPU IP,已成功通过SGS-TÜV Saar的全面审核与评估,正式获得
    的头像 发表于 11-14 16:37 441次阅读

    在线研讨会 | Imagination产品总监全面解读最新DXS GPU

    不久前,Imagination重磅推出其最新的、用于车载智能和交互的汽车图形处理器(GPU)IP产品ImaginationDXSGPU。为了让更多对GPU感兴趣的读者全面了解DXSGP
    的头像 发表于 10-10 08:07 199次阅读
    在线研讨会 | <b class='flag-5'>Imagination</b>产品总监全面解读最新DXS <b class='flag-5'>GPU</b>

    Imagination DXS GPU:重塑汽车智能与交互的未来

    增长。在此背景下,Imagination公司最新推出的DXS GPU IP产品,以其可扩展性、灵活性和强大的计算能力,为车载智能与交互系统注入了新的活力。
    的头像 发表于 09-23 13:06 782次阅读

    Imagination推出性能最高且具有高等级功能安全性的汽车GPU IP

    Imagination DXS GPU 进一步扩大其在汽车领域的领先地位
    的头像 发表于 09-14 17:41 365次阅读

    Imagination GPU为边缘智能提供高效率的加速

    作者:Imagination
    的头像 发表于 09-11 13:10 250次阅读
    <b class='flag-5'>Imagination</b> <b class='flag-5'>GPU</b>为边缘智能提供高效率的加速

    新加坡电信与日立深化合作,共推数据中心与GPU威廉希尔官方网站

    新加坡电信与日立公司近日宣布,双方已正式签署谅解备忘录,标志着双方在数据中心及图形处理器(GPU)云威廉希尔官方网站 领域的合作迈入新阶段。此次合作是在双方6月初步
    的头像 发表于 08-26 16:25 596次阅读

    什么是GPU威廉希尔官方网站 ?它有哪些应用?

    GPU威廉希尔官方网站 ,即图形处理器(Graphics Processing Unit)威廉希尔官方网站 ,是一种专门设计用于处理图像和图形数据的微处理器威廉希尔官方网站 。随着计
    的头像 发表于 08-22 14:34 2322次阅读

    微链道爱与浪潮信息合作,AI视觉威廉希尔官方网站 迈入全新阶段

    的服务器解决方案提供商浪潮信息正式签署了元脑生态战略合作协议,标志着双方在AI视觉威廉希尔官方网站 领域的合作迈入了一个
    的头像 发表于 07-08 17:00 536次阅读

    大模型快速发展,GPU IP有何作用

      电子发烧友网报道(文/李弯弯)随着人工智能威廉希尔官方网站 的快速发展,GPU作为重要的算力支撑时常被提及。国内外重要的GPU芯片公司也为人熟知,包括英伟达、AMD、英特尔,景嘉微、海光信息、天数智芯、摩尔
    的头像 发表于 05-29 00:05 2333次阅读

    奥比中光正式发布全新Gemini 330系列双目3D相机

    4月29日,奥比中光正式发布全新Gemini 330系列双目3D相机,首发产品包括Gemini 335、Gemini 335L两款通用型高性能双目3D相机。
    的头像 发表于 04-30 10:41 633次阅读
    奥比中光正式发布<b class='flag-5'>全新</b>Gemini 330系列<b class='flag-5'>双目</b>3D相机

    FPGA在深度学习应用中或取代GPU

    对神经网络进行任何更改,也不需要学习任何新工具。不过你可以保留你的 GPU 用于训练。” Zebra 提供了深度学习代码转换为 FPGA 硬件指令的抽象层 AI 硬件前景
    发表于 03-21 15:19

    视觉、激光、结构光?扫地机器人导航避障威廉希尔官方网站 盘点

    的核心标准。 目前主流的扫地机器人导航避障威廉希尔官方网站 路径为双目视觉、激光雷达、3D结构光(线激光)三条,每条威廉希尔官方网站 路径都存在着各自的特点。 视觉方案
    的头像 发表于 02-01 16:01 1292次阅读

    MulticoreWareImagination一同按下汽车计算工作负载的“加速键”

    和高级驾驶辅助系统(ADAS)常见工作负载性能的跃升。此次合作使得在高分辨率(3200x2000)图像上使用GPU运行StereoBM(StereoBlockMatc
    的头像 发表于 01-09 08:27 330次阅读
    <b class='flag-5'>MulticoreWare</b>与<b class='flag-5'>Imagination</b>一同按下汽车计算工作负载的“加速键”