算力不足和能效过低，有什么方法提高AI芯片的算力呢？-电子发烧友网

随着ChatGPT强势来袭，AI 人工智能应用层出不穷。智能化时代，数据量指数型增长，摩尔定律已经不能满足当前的数据处理需求，元器件的物理尺寸已经接近极限。人工智能的硬件平台面临两大艰巨挑战：算力不足和能效过低。那么，有什么方法提高芯片的算力呢？

其实关键还是在于系统设计和芯片加工。系统设计，重在高性能微架构和先进算术运算，芯片加工则有赖于先进工艺制程和先进封装制备。今年9月份的时候，EETOP曾从运算机制的角度，探讨了计算芯片算力的提升。本期，我们试着从芯片架构方面，继续探讨芯片算力提升的话题。

计算芯片架构趋势：存算一体

现在，无论是CPU还是GPU，采用的都是70年前的冯.诺伊曼体系架构。冯诺依曼体系结构是现代计算机的基础。在冯诺依曼架构中，计算和存储功能分别由中央处理器和存储器完成。计算机的 CPU 和存储器是相互独立发展的，也就是CPU和内存是在不同芯片上的，它们之间的通信要通过总线来进行。数据量少的时候没问题，但一旦数据变多，总线本身就会拥挤成为瓶颈。而现在的GPU，并行处理能力越来越强。当数据传输速度不够时，就会限制算力的天花板，严重影响目标应用程序的功率和性能。

业界很多也都在研究相关的解决方案，以实现更为有效的数据运算和更大的数据吞吐量，其中“存算一体”被认为是未来计算芯片的架构趋势。它是把之前集中存储在外面的数据改为存在GPU的每个计算单元内，每个计算单元既负责存储数据，又负责数据计算。

这几天，清华大学研制出全球首颗全系统集成的、支持高效片上学习（机器学习能在硬件端直接完成）的忆阻器存算一体芯片，可谓刷爆行业媒体圈。这项最新的研究证明了在全集成忆阻器存算一体系统上实现矩阵向量乘法的可行性。据了解，清华大学的研究团队对芯片算法、系统、架构、电路与器件进行了全层次协同优化设计：

器件层面，实现300万个具有高interwetten与威廉的赔率体系可编程性的忆阻器与CMOS电路的单片集成；

电路层面，提出电压模神经元电路，支持可变精度计算、激活操作、低功耗模数转换；

架构层面，提出双向TNSA（transposable neurosynaptic array）架构，以最小的面积、能耗开销实现灵活的数据流重构；

系统层面，48个CIM核心支持多种权重映射方案，提高推理任务并行度；算法层面，利用多种硬件-算法协同优化方案，降低硬件非理想特性对准确率的影响。

传统计算系统，其计算器件用的是场效应晶体管，计算范式是布尔逻辑数字计算，架构采用的是存算分离；而存算一体计算系统的计算器件是忆阻器，计算范式用的是物理定律模拟计算，架构是存算一体。存算一体架构彻底消除了数据在逻辑处理器与存储芯片之间的搬迁问题，减少能量消耗及延迟。据公开资料显示，相同任务下，该芯片实现片上学习的能耗仅为先进工艺下专用集成电路（ASIC）系统的1/35，同时有望实现75倍的能效提升。

摩尔定律很好的归纳了信息威廉希尔官方网站进步的速度，但随着半导体芯片威廉希尔官方网站的快速发展，摩尔定律已经不太适用于现在的半导体芯片发展规律了。冯诺依曼架构遇到了瓶颈，这时便需要忆阻器的魔力，来实现存算一体，打破传统的冯诺依曼架构，开拓新的存储器道路。谈到这里，我们就必须来认识认识忆阻器这个非线性电路元件了。

忆阻器的发展

忆阻器英文名为memristor,也被称为阻变存储器（RRAM），用符号M表示，与电阻R，电容C，电感L构成四种基本无源电路器件。它是连接磁通量与电荷之间关系的纽带，同时具备电阻和存储的性能，是一种新一代高速存储单元。其功耗，读写速度都要比传统的随机存储器优越，是硬件实现人工神经网络突触的最好方式，主要应用于非易失存储、逻辑运算以及类脑神经形态计算。

忆阻器全称记忆电阻，是一种具有电荷记忆功能的非线性电阻，于1971年，由加州大学伯克利分校的华裔科学家蔡少棠教授提出。蔡教授从电路完整性角度出发，从数学上推导出忆阻器的概念。不过，由于缺乏实验的支撑，而且传统存储器在工艺上和摩尔定律契合的很好，一直在刷新着自己的存储极限，所以在那之后的很长一段时间，人们认为没有必要花费时间和金钱去研究忆阻器。

忆阻器发展的拐点，发生在2000年之后。2000-2008年，A Beck等人在Cr掺杂的SrZrO3中观察到忆阻器滞回曲线，并指出器件具有存储功能，2006年HP实验室证明了Crossbar RRAM，并于2008年在《Nature》发表了“下落不明的忆阻器找到了”的相关文章，同年，HP公司制备出忆阻器。科学家们开始意识到忆阻器的优势和作用，全世界相关科学家都纷纷参与到忆阻器的研究中来，忆阻器研究高潮就此到来。

类脑计算及神经形态计算是当今科研热点之一，忆阻器是神经元网络的核心器件，它为发展信息存储与处理融合的新型计算体系架构，突破传统冯·诺伊曼架构瓶颈，提供了可行的路线，其性能直接影响神经元网络的计算能力。

下面为大家分享一段教学视频，是清华大学高滨教授主讲的“忆阻器存算一体芯片与类脑计算”。高滨老师表示，现有计算系统普遍采用存储和运算分离的架构，存在存储墙与功耗墙瓶颈，严重制约了系统算力和能效的提升。存算合一的电子突触就是忆阻器。不过，忆阻器也面临着严峻的挑战。核心挑战之一是器件非理想特性，即忆阻器件性能存在离散性和不稳定性，严重影响计算精度；另一个关键挑战就是模拟计算的误差累积。

清华大学高滨教授的教学视频

高滨教授介绍，解决的办法就是存算一体芯片的协同设计。存算一体芯片急需跨层次的协同优化方案，单一层面的优化已经难以达到高性能。其实忆阻器研究的每一次推进和成功，都离不开测试设备提供的数据支持。高滨表示：“测试设备的进步，为忆阻器的研发做出了重要的贡献！”

高滨教授关于忆阻器研究的几个关键时间点

忆阻器电学测试现状与展望

存算一体威廉希尔官方网站对忆阻器特性要求非常高，测试难度也很大。通常，忆阻器的测试可分为三大类，即：

忆阻器基础研究测试，包括忆阻器参数表征、分类及测试流程，以及分析器件在相应的交流、直流、脉冲电信号作用下的忆阻特性；

忆阻器性能研究特性，旨在提高忆阻器存储性能和模拟神经元的性能，如功耗、擦写速度、集成度和可靠性等各方面；

最后是忆阻器集成及应用研究测试，忆阻器单元集成结构是实现阵列忆阻器的关键，如1T1R、1TNR等cell及阵列结构的测试。

如果忆阻器被用于神经元方面的研究，其性能测试除了擦写次数和数据保留时间外，还需要进行神经突触阻变动力学测试。

结束语

在 AI 算力需求暴涨下，存算一体被认为是突破算力瓶颈最有前景的新赛道。目前，国内外很多科技企业及初创公司都在积极开展相关的研发。据相关预测数据显示，到 2030 年，基于存算一体威廉希尔官方网站的芯片市场规模有望超过千亿人民币。忆阻器在数据存储、存算一体、类脑计算等领域将发挥越来越重要的作用。目前，忆阻器已经具备在先进CMOS工艺平台集成的能力。不过，忆阻器依然面临着严峻的挑战，核心挑战之一是器件非理想特性，即忆阻器件性能存在离散性和不稳定性，严重影响计算精度；另一个关键挑战就是模拟计算的误差累积。

基于忆阻器的存算一体变革性威廉希尔官方网站正成为学术界和产业界关注的前沿热点。未来仍期待在多通道快切换、高时间分辨等方面取得更大进步。期待***走的更远、更高、更好！

审核编辑：刘清

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

场效应晶体管

场效应晶体管

+关注

关注
6

文章
360

浏览量
19484
人工智能

人工智能

+关注

关注
1791

文章
47044

浏览量
238030
忆阻器

忆阻器

+关注

关注
8

文章
73

浏览量
19851
CMOS电路

CMOS电路

+关注

关注
0

文章
49

浏览量
11505
ChatGPT

ChatGPT

+关注

关注
29

文章
1554

浏览量
7567

企业AI算力租赁是什么

企业AI算力租赁是指企业通过互联网向专业的算力提供商租用所需的计算资源，以满足其AI应用的需求。

发表于 11-14 09:30 •296次阅读

GPU算力开发平台是什么

随着AI威廉希尔官方网站的广泛应用，算力需求呈现出爆发式增长。AI算力租赁作为一种新兴的服务模式，正逐渐成为

发表于 10-31 10:31 •149次阅读

【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--全书概览

、GPU、NPU,给我们剖析了算力芯片的微架构。书中有对芯片方案商处理器的讲解，理论联系实际，使读者能更好理解

发表于 10-15 22:08

名单公布！【书籍评测活动NO.43】算力芯片 | 高性能 CPU/GPU/NPU 微架构分析

力，在全球范围内，对于推动科技进步、经济发展及社会整体的运作具有至关重要的作用。随着信息威廉希尔官方网站的高速发展，高性能计算（HPC）和人工智能（AI）等威廉希尔官方网站在多个领域的应用变得日益广泛，芯片算

发表于 09-02 10:09

大模型时代的算力需求

现在AI已进入大模型时代，各企业都争相部署大模型，但如何保证大模型的算力，以及相关的稳定性和性能，是一个极为重要的问题，带着这个极为重要的问题，我需要在此书中找到答案。

发表于 08-20 09:04

曙光携手“算力互联公共服务平台”提高全国算力匹配效率

近日，由中国信息通信研究院开发的“算力互联公共服务平台”在重庆上线。作为该平台合作方之一，曙光智算参与了平台发布仪式。曙光将依托在算力

发表于 07-16 15:45 •669次阅读

算力系列基础篇——算力与计算机性能：解锁超能力的神秘力量！

的？要想提高算力，都有哪些方法？一、算力的关键因素从算

发表于 07-11 08:04 •104次阅读

算力基础设施的风险与挑战

编者按算力网络有一个美好的愿景，就是希望算力和算网，能

发表于 06-13 08:27 •534次阅读

揭秘芯片算力：为何它如此关键？

在数字化时代，芯片作为电子设备的核心组件，其性能直接关系到设备的运行速度和处理能力。而芯片的算力，即其计算能力，更是衡量芯片性能的重要指标。

发表于 05-09 08:27 •964次阅读

算力系列基础篇——算力101：从零开始了解算力

相信大家已经感受到，我们正处在一个人工智能时代。如果要问在人工智能时代最重要的是什么？那必须是：算力！算力！算

发表于 04-24 08:05 •1002次阅读

DPU威廉希尔官方网站赋能下一代AI算力基础设施

4月19日，在以“重构世界奔赴未来”为主题的2024中国生成式AI大会上，中科驭数作为DPU新型算力基础设施代表，受邀出席了中国智算中心创新论坛，发表了题为《以网络为中心的

发表于 04-20 11:31 •823次阅读

高算力芯片：未来科技的加速器？

在数字化时代，芯片作为电子设备的核心组件，其性能直接关系到设备的运行速度和处理能力。而芯片的算力，即其计算能力，更是衡量芯片性能的重要指标。

发表于 02-27 09:42 •908次阅读

智能算力规模超通用算力，大模型对智能算力提出高要求

电子发烧友网报道（文/李弯弯）算力是设备通过处理数据，实现特定结果输出的计算能力，常用FLOPS作为计量单位。FLOPS是Floating-point Operations Per Second

发表于 02-06 00:08 •6235次阅读

大茉莉X16-P，5800M大算力称王称霸

算力

Rykj365
发布于 :2024年01月25日 14:54:52

弘信电子与AI算力服务器合资，助力国产算力芯片落地

此外，弘信电子近期在AI算力业务上取得了突破性进展，这并非源自本土化的积累，而是依赖于团队敏锐的战略眼光和强烈的创新动力。此次投资是弘信电子在AI算

发表于 12-25 09:30 •907次阅读

搜索历史

算力不足和能效过低，有什么方法提高AI芯片的算力呢？

评论

企业AI算力租赁是什么

GPU算力开发平台是什么

【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--全书概览

名单公布！【书籍评测活动NO.43】算力芯片 | 高性能 CPU/GPU/NPU 微架构分析

大模型时代的算力需求

曙光携手“算力互联公共服务平台”提高全国算力匹配效率

算力系列基础篇——算力与计算机性能：解锁超能力的神秘力量！

算力基础设施的风险与挑战

揭秘芯片算力：为何它如此关键？

算力系列基础篇——算力101：从零开始了解算力

DPU威廉希尔官方网站赋能下一代AI算力基础设施

高算力芯片：未来科技的加速器？

智能算力规模超通用算力，大模型对智能算力提出高要求

大茉莉X16-P，5800M大算力称王称霸

弘信电子与AI算力服务器合资，助力国产算力芯片落地