人工智能学会战略性遗忘：三种方法-电子发烧友网

人的遗忘是策略式的，而机器的遗忘是计算式的。

人工智能越来越频繁地出现在人们的生活中，而其威廉希尔官方网站上的重大进步仍然不曾明朗。本文作者Natalie Fratto在“Machine Un-Learning: Why Forgetting Might Be the Key to AI”一文中讲述了实现人工智能战略性遗忘的三个方法。

让我们先直面那些事情一团糟的情况。你不记得自己把钥匙放在了哪里，你不记得刚刚在杂货店遇到的同事的名字因而只能磕磕绊绊地说着话，这都令你异常沮丧。然而，遗忘是人类得以生存的核心。事实上，我们必须对自己有能力做到这一点感到幸运。

对于人类来说，遗忘不仅仅意味着记忆的遗失，也意味着这也是一个帮助大脑吸收新知识并有效做出决策的积极过程。

现在，数据科学家正在应用神经科学原理改进机器学习威廉希尔官方网站，他们相信人类的大脑是完全揭开人工智能面纱的关键。

根据最近发表在《神经元》（Neuron）杂志上的一篇论文所言，人们的大脑充当着信息过滤器的角色。它能输入一大堆乱七八糟的数据，再过滤出有用的数据，然后清除所有无关的细节，从而使人们能够成功讲述一个故事或者是做出决定。这种删除未使用信息，以便为接受新信息腾出空间的行为，就如同清理计算机上的磁盘空间。用神经生物学术语表示，当神经元之间的连接随着时间的推移变得减弱甚至是消失时，遗忘就会发生，而随着新神经元的出现，它们会重新连接海马体的回路并覆盖现有记忆。

对于人类来说，遗忘的发生带来两个好处：

它通过减少过时信息对人们产生的影响来提高决策灵活性。

它能够预防人们过度沉浸于某些过去的特定事件，提高适应能力。

人们为了有效适应发展，必须具备战略性遗忘的能力。

但是电脑又能如何呢？

这即是人工智能所面临的最大挑战之一，计算机的遗忘逻辑与人类的情况不同。深度神经网络是一系列机器学习任务中完成度最高的威廉希尔官方网站，但是它不会像人们那样去遗忘。

举个简单的例子，如果你要教一个会说英语的孩子学习西班牙语，那么他会将学习英语过程中的相关经验应用到学习西班牙语的过程中，这有可能是名词、动词时态和句子结构等，同时忽略掉那些不相关的部分，比如口音、晦涩词语和语调等。孩子们可以基于战略性遗忘策略不断地学习与重建。

神经网络的逻辑与此不同，如果一个神经网络被训练学习英语，那么其会通过调用参数解决英语问题。如果你想教它学习西班牙语，那么神经网络对于西班牙语的认知就会覆盖掉之前为英语学习所储备的知识，有效清空所有内容并从零开始。我们将其称为“灾难性遗忘”，“这是神经网络所面临的基本局限之一。”

攻克这一局限是一个全新领域，但是科学家已经在关于如何克服这种局限性所涉及的潜在理论的探索上取得了长足的进步。

人工智能学会战略性遗忘：三种方法

一. 长短期记忆网络（LSTM，Long Short Term Memory Networks）

长短期记忆网络是一种递归式神经网络，它通过特定的学习机制决定在什么时候记住哪些信息，更新哪些信息，注意哪些信息。

用电影类比来解释长短期记忆网络工作的逻辑十分简单易懂。想象这么一种场景，一台电脑通过分析之前的场景来预测电影接下来会发生什么。在某个场景中，一个女人拿着一把刀，电脑会猜她是厨师还是杀人犯？在另一个场景中，这个女人在一个金色拱门下面同一个男人一起吃着寿司，他们是在日本还是在麦当劳？或者是能确定他们在圣路易斯？

这的确非常难以预测。

长短期记忆网络则在这一过程中帮助神经网络实现1）遗忘/记忆，2）保存，3）聚焦。

1. 遗忘/记忆：“例如，在一个场景结束后，模型应该忘记当前的位置信息、时间信息，并重置任何有关场景的特定信息。但是，如果某个角色在某个场景中死去了，那么它需要记住这个人已经不再会出现。因此，我们希望模型能够学习一种单独的遗忘/记忆机制：当新的信息出现时，它需要知道哪些信息需要保留而哪些信息需要丢弃。”

2. 保存：当模型看到一个新图像时，它需要了解这个图像的信息是否值得使用和保存。如果某个场景中一个女人走过了一个广告牌，是记住这个广告牌，还是仅仅将其视为冗余？

3. 聚集：模型需要记住电影中的这位女性是一个母亲，因为之后的场景会出现她孩子的画面。但是如果在某个场景中女人并没有出现，那么这一信息就显得不甚重要，所以在这个场景中模型不需要关注这一信息。同样，并非所有存储在神经网络长期记忆中的东西每一次都会发挥直接相关的作用。因此，长短期记忆网络需要帮助确定模型在某个特定时间需要关注哪些部分，同时将所有信息妥善保管。

二弹性权重固化（EWC，Elastic Weight Consolidation）

弹性权重固化是谷歌旗下DeepMind的研究人员于2017年3月创建的一种算法，该算法interwetten与威廉的赔率体系了一种叫做“突触整合”的神经科学过程。在突触整合过程中，人们的大脑会进行任务评估，计算众多用于执行任务的神经元的重要性，并确认一些神经元所扮演的重要角色使其对正确执行任务发挥更加重要的作用。这些关键性神经元被标记上重要程度并使其在后续任务中被覆盖的几率减小。在神经网络中也有多个如神经元的连接用于执行任务。弹性权重固化将某些连接编码标注上关键性，从而保护其不被过度写入遗忘/记忆程序。

三. 瓶颈理论（Bottleneck Theory）

2017年秋天，在人工智能社区的一次演讲中，来自耶路撒冷希伯来大学的计算机科学家与神经学家纳夫塔利·提斯比讲述了其称之为“瓶颈理论”的观点。“其思想是，一个网络会排除掉那些无关重要的嘈杂的输入数据，这就如同通过瓶颈向其中压缩信息，只保留与一般概念最相关的特性。”

正如提斯比所解释的那样，神经网络在学习过程中需要经历两个阶段，拟合与压缩。在拟合过程中，网络对其训练数据进行标记。而在更为复杂的压缩过程中，其“将基于标记的数据信息只追踪那些具备巨大特征的信息。”而这一过程对于之后的概化过程极为重要。在此过程中，压缩是一种策略上的遗忘方式，人工智能研究人员可以在未来用其构建更强大的神经网络和框架。

正如提斯比所言，“学习过程中最重要的环节是遗忘。”

人类的大脑可能蕴藏着创造强大人工智能的图解，而如今科学家们仍然停留在如何解读这些可能的层面。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人工智能

人工智能

+关注

关注
1791

文章
47274

浏览量
238450
机器学习

机器学习

+关注

关注
66

文章
8418

浏览量
132624

原文标题：“反机器学习”：人工智能突破的关键是“遗忘”

文章出处：【微信号：gh_211d74f707ff，微信公众号：重庆人工智能】欢迎添加关注！文章转载请注明出处。

嵌入式和人工智能究竟是什么关系?

嵌入式和人工智能究竟是什么关系? 嵌入式系统是一种特殊的系统，它通常被嵌入到其他设备或机器中，以实现特定功能。嵌入式系统具有非常强的适应性和灵活性，能够根据用户需求进行定制化设计。它广泛应用于各种

发表于 11-14 16:39

《AI for Science：人工智能驱动科学创新》第6章人AI与能源科学读后感

和国际合作等多个层面。这些内容让我更加认识到，在推动人工智能与能源科学融合的过程中，需要不断探索和创新，以应对各种挑战和机遇。最后，通过阅读这一章，我深刻感受到人工智能对于能源科学的重要性。

发表于 10-14 09:27

AI for Science：人工智能驱动科学创新》第4章-AI与生命科学读后感

很幸运社区给我一个阅读此书的机会，感谢平台。《AI for Science：人工智能驱动科学创新》第4章关于AI与生命科学的部分，为我们揭示了人工智能威廉希尔官方网站在生命科学领域中的广泛应用和深远影响。在

发表于 10-14 09:21

《AI for Science：人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

，无疑为读者铺设了一条探索人工智能（AI）如何深刻影响并推动科学创新的道路。在阅读这一章后，我深刻感受到了人工智能威廉希尔官方网站在科学领域的广泛应用潜力以及其带来的革命性变化，以下是我个人的学习心得： 1.

发表于 10-14 09:12

risc-v在人工智能图像处理应用前景分析

RISC-V在人工智能图像处理领域的应用前景十分广阔，这主要得益于其开源性、灵活性和低功耗等特点。以下是对RISC-V在人工智能图像处理应用前景的详细分析：一、RISC-V的基本特点 RISC-V

发表于 09-28 11:00

人工智能ai4s试读申请

目前人工智能在绘画对话等大模型领域应用广阔，ai4s也是方兴未艾。但是如何有效利用ai4s工具助力科研是个需要研究的课题，本书对ai4s基本原理和原则，方法进行描诉，有利于总结经验，拟按照要求准备相关体会材料。看能否有助于入门和提高ss

发表于 09-09 15:36

名单公布！【书籍评测活动NO.44】AI for Science：人工智能驱动科学创新

大力发展AI for Science的原因。第2章从科学研究底层的理论模式与主要困境，以及人工智能三要素（数据、算法、算力）出发，对AI for Science的威廉希尔官方网站支撑进行解读。第3章介绍了在

发表于 09-09 13:54

MCUXpresso IDE下在线联合调试双核MCU工程的三种方法

大家好，我是痞子衡，是正经搞威廉希尔官方网站的痞子。今天痞子衡给大家分享的是MCUXpresso IDE下在线联合调试i.MXRT1170双核工程的三种方法。

发表于 08-08 15:18 •559次阅读

FPGA在人工智能中的应用有哪些？

FPGA（现场可编程门阵列）在人工智能领域的应用非常广泛，主要体现在以下几个方面：一、深度学习加速训练和推理过程加速：FPGA可以用来加速深度学习的训练和推理过程。由于其高并行性和低延迟特性

发表于 07-29 17:05

5G智能物联网课程之Aidlux下人工智能开发（SC171开发套件V1）

课程类别课程名称视频课程时长视频课程链接课件链接 人工智能 参赛基础知识指引 14分50秒 https://t.elecfans.com/v/25508.html *附件：参赛基础知识指引

发表于 04-01 10:40

嵌入式人工智能的就业方向有哪些?

嵌入式人工智能的就业方向有哪些? 在新一轮科技革命与产业变革的时代背景下，嵌入式人工智能成为国家新型基础建设与传统产业升级的核心驱动力。同时在此背景驱动下，众多名企也纷纷在嵌入式人工智能领域布局

发表于 02-26 10:17

三菱M70 PLC增加注解的三种方法简析

三菱M70 PLC增加注解的三种方法

发表于 02-26 09:59 •1089次阅读

传统激光功率衰减的三种方法

传统激光功率衰减通常使用以下三种方法，分别为中性密度衰减片衰减法、偏振衰减法、镀膜光学镜片衰减法。

发表于 01-20 10:42 •1755次阅读

无人机测深的三种方法总结

无论是陆地测绘还是海洋测绘，测绘行业都是朝着航空方向发展。下面结合搜索到的论文和相关网页，总结下无人机测深的方法，总共有三种：1）机载激光雷达；2）机载探地雷达（GPR）；3）机载高精度测深仪。

发表于 01-05 11:24 •1846次阅读

鼎阳科技获评“2023年粤港澳大湾区战略性新兴产业领航企业”

近日，为响应国家、省、市大力发展战略性新兴产业的号召，促进战略性新兴产业加快释放新质生产力，推动战略性新兴产业高质量发展， 2023年粤港澳大湾区战略性新兴产业领航企业暨第

发表于 01-02 18:07 •484次阅读