完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>
1、软硬件协同与AI编译软件栈介绍 2个核心要点,都是钱砸出来的感悟。 对于SIMD为主的DSA,指令的图灵完备决定了芯片的可编程性。例如某些算子不能使用NPU编程,还需要在另外一个cpu上编程,这种异构就会把现有的事情变得复杂。尤其是AI编译器就很难做的健壮,客观需要一个过程去逐步识别哪些是软件本身的问题,还是硬件本身就无法做到。 片上的内存和片内带宽。从DDR到计算部件的内存层级设计,非常关键,也决定了芯片的可编程性。如果数据从DDR到计算部件的开销比较大,自然是希望中间结果可以驻留在片上(片上的缓存最好也足够大),不溢出到DDR上,这样会让ai编译器变得异常复杂,那解决方案自然需要更长的时间成熟和稳定。 |
|
相关推荐
|
|
飞凌嵌入式ElfBoard ELF 1板卡-移植前准备之git管理内核源码
403 浏览 0 评论
702 浏览 0 评论
迅为RK3568开发板篇OpenHarmony实操HDF驱动控制LED-接口函数
752 浏览 0 评论
飞凌嵌入式ElfBoard ELF 1板卡-本地仓库管理之分支间的操作
667 浏览 0 评论
飞凌嵌入式ElfBoard ELF 1板卡-本地仓库管理之当前分支内的操作
1005 浏览 0 评论
小黑屋| 手机版| Archiver| 电子发烧友 ( 湘ICP备2023018690号 )
GMT+8, 2025-1-23 07:16 , Processed in 0.566735 second(s), Total 68, Slave 50 queries .
Powered by 电子发烧友网
© 2015 bbs.elecfans.com
关注我们的微信
下载发烧友APP
电子发烧友观察
版权所有 © 湖南华秋数字科技有限公司
电子发烧友 (电路图) 湘公网安备 43011202000918 号 电信与信息服务业务经营许可证:合字B2-20210191 工商网监 湘ICP备2023018690号