完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>
1、软硬件协同与AI编译软件栈介绍 2个核心要点,都是钱砸出来的感悟。 对于SIMD为主的DSA,指令的图灵完备决定了芯片的可编程性。例如某些算子不能使用NPU编程,还需要在另外一个cpu上编程,这种异构就会把现有的事情变得复杂。尤其是AI编译器就很难做的健壮,客观需要一个过程去逐步识别哪些是软件本身的问题,还是硬件本身就无法做到。 片上的内存和片内带宽。从DDR到计算部件的内存层级设计,非常关键,也决定了芯片的可编程性。如果数据从DDR到计算部件的开销比较大,自然是希望中间结果可以驻留在片上(片上的缓存最好也足够大),不溢出到DDR上,这样会让ai编译器变得异常复杂,那解决方案自然需要更长的时间成熟和稳定。 |
|
相关推荐
|
|
飞凌嵌入式-ELFBOARD ELF 1外设扩展硬件分享第一期
774 浏览 0 评论
2147 浏览 0 评论
1268 浏览 0 评论
1548 浏览 0 评论
采用NSA2860X芯片,采样压力传感器的电压,采用IIC总线与STM32F103C8T6通信,问题:采用的数据一直是FFFFFFF
2533 浏览 1 评论
小黑屋| 手机版| Archiver| 电子发烧友 ( 湘ICP备2023018690号 )
GMT+8, 2024-9-22 01:56 , Processed in 0.615865 second(s), Total 68, Slave 50 queries .
Powered by 电子发烧友网
© 2015 bbs.elecfans.com
关注我们的微信
下载发烧友APP
电子发烧友观察
版权所有 © 湖南华秋数字科技有限公司
电子发烧友 (电路图) 湘公网安备 43011202000918 号 电信与信息服务业务经营许可证:合字B2-20210191 工商网监 湘ICP备2023018690号