完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>
首先感谢电子发烧友论坛提供的书籍和阅读评测的机会。 拿到书,先看一下封面介绍。这本书的中文名是《AI加速器架构设计与实现》,英文名是Accelerator Based on CNN Design。 从名字上就能看出来书里可能覆盖的内容是和CNN加速器有关的内容了。 作者在前言里说这本书主要讨论Inference(推理)的过程,“主要讨论神经网络硬件,尤其是芯片设计层面的内容”。这本书的第2,3章,分别讨论了运算子系统和存储子系统的设计,其它部分的内容可以看目录. 第二章的标题是运算子系统的设计 2。1节从加速器要包含的模块和组成关系开始,介绍了神经网络加速器的模块: DMA,加速器外部的数据和内部数据的搬运 Memory, Conv, Pool, Activation, 对比了筒形数据流结构和星形数据流结构![] 上面两张图展示了NVDLA和TPU的数据流的设计 2.2节从算力和带宽的角度介绍 2.3节介绍了卷积乘法阵列的设计,这里的内容比较多。可以看一下目录。 这一节有5个小节,第一个小节是算法的介绍,2-5小节是4个案例。 2.3.1是Conv算法的分析,介绍了Conv的并行,并且分析了并行性的利用。 2.3.2节介绍的NVDLA的乘法阵列 这里的图片介绍还是非常直观的。 其它具体案例的介绍也有很多图片,还有这个几个案例的分析和对比。感兴趣的话可以好好看看。 2.4和2.5小节分别介绍了卷积顺序的选择和池化模块的设计。这两节的介绍也很详细,图片也很多。 阅读感受 |
|
相关推荐 |
|
【「OpenHarmony开发与实践 | 基于红莓RK2206开发板」阅读体验】+初体验2连发发
425 浏览 0 评论
ARM MCU嵌入式开发 | 基于国产GD32F10x芯片+嵌入的开始
753 浏览 0 评论
【书籍评测活动NO.44】AI for Science:人工智能驱动科学创新
1011 浏览 6 评论
925 浏览 0 评论
ARM MCU嵌入式开发 | 基于国产GD32F10x芯片+开始篇
487 浏览 0 评论
小黑屋| 手机版| Archiver| 电子发烧友 ( 湘ICP备2023018690号 )
GMT+8, 2024-9-22 01:04 , Processed in 0.608345 second(s), Total 52, Slave 38 queries .
Powered by 电子发烧友网
© 2015 bbs.elecfans.com
关注我们的微信
下载发烧友APP
电子发烧友观察
版权所有 © 湖南华秋数字科技有限公司
电子发烧友 (电路图) 湘公网安备 43011202000918 号 电信与信息服务业务经营许可证:合字B2-20210191 工商网监 湘ICP备2023018690号