0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

FAIR何恺明团队近日发表神经结构搜索NAS方面的最新力作

DPVg_AI_era 来源:lp 2019-04-19 14:34 次阅读

FAIR何恺明团队近日发表神经结构搜索NAS方面的最新力作,通过随机连接的神经网络,探索了更多样化的连接模式,所提出的RandWire网络ImageNet基准测试中获得了有竞争力的准确度。

用于图像识别的神经网络经过大量的人工设计,已经从简单的链状模型发展到具有多个连接路径的结构。ResNets和DenseNets的成功在很大程度上归功于它们创新的连接规划。

目前,神经结构搜索(NAS)的研究正在探索连接(wiring)与操作类型(operation types)的联合优化,然而,由于可能的连接空间受到限制,尽管采用了神经结构搜索,优化仍然是由人工设计驱动的。

近日,FAIR何恺明等人发表最新论文,探讨了在图像识别中NAS方法的优化。研究人员通过随机连接的神经网络,探索了更多样化的连接模式。

论文地址:

https://arxiv.org/pdf/1904.01569.pdf

作者首先定义了一个随机网络生成器(network generator)的概念,该生成器封装了整个网络生成过程,从而提供了NAS和随机连接网络的统一视图。

然后,研究人员采用三种经典的随机图模型来生成网络的随机连接图。

实验结果令人惊讶:这些随机生成器生成的网络实例在ImageNet基准测试中获得了有竞争力的准确度。

研究人员表示,这些结果表明,专注于设计更好的网络生成器的研究可以通过探索更少约束的搜索空间,为新设计提供更多空间,从而带来新的突破。

不过,该研究被指其思想早已在2013年PCA-Net论文中提出过,在算法设计思想方面没有本质的创新。

何恺明等人的这一新研究到底意义如何?本文对这篇论文进行了译介:

研究概述:网络生成器的设计很重要

今天我们所称的深度学习是从连接主义方法发展起来的,这一范式反映了这样一种假设,即计算网络的连接方式对构建智能机器至关重要。

与这一观点相呼应的是,计算机视觉领域的最新进展是由使用链状连接的模型向更精细的连接模式(如ResNet和DenseNet)的转变所驱动的,这些连接模式之所以有效,在很大程度上是因为它们的连接方式。

在这一趋势的推进中,神经结构搜索(neural architecture search, NAS)已经成为联合搜索连接模式和执行操作方式的一个有前景的方向。NAS方法专注于搜索,同时隐式地依赖于一个重要但常常被忽视的组件——网络生成器(network generator)。

NAS网络生成器定义了一系列可能的连接模式,并根据可学习的概率分布对网络进行采样。然而,就像ResNet和DenseNet中的连接模式一样,NAS网络生成器是手工设计的,允许的连接模式的空间被限制在所有可能的图的一个小的子集中。从这个角度来看,我们会问:如果我们放开这种约束,并设计新的网络生成器,会发生什么?

我们通过随机网络生成器采样的随机连接神经网络来探讨这个问题,其中人工设计的随机过程定义了生成。

图1:随机连接网络的计算图

我们使用了三个经典的随机图模型:Erdos-R˝enyi (ER),Barabasi-Albert (BA),以及Watts-Strogatz (WS)模型。

如图1所示,随机连接网络的三个实例在ImageNet基准测试中分别达到79.1%、79.1%和79.0%的精度,超过了ResNet-50的77.1%。

为了定义完整的网络,我们将一个随机图转换成一个有向无环图(DAG),并应用从节点到其函数角色(例如,到相同类型的卷积)的一个简单映射。

结果令人惊讶:这些随机生成器的几个变体在ImageNet上产生了准确率上具有竞争力的网络。

使用WS模型的最佳生成器生成的多个网络性能优于或可与完全手工设计的同类网络和通过各种神经结构搜索方法找到的网络相媲美。

我们还观察到,对于同一生成器生成的不同随机网络,精度的方差较低,但不同生成器之间存在明显的精度差距。这些观察结果表明,网络生成器的设计很重要。

最后,我们的工作表明,从设计单个网络到设计网络生成器的新过渡是可能的,类似于如何从设计特征过渡到设计学习特征的网络。

我们建议设计新的网络生成器来生成用于搜索的新模型家族,而不是主要关注使用固定生成器进行搜索。设计的网络生成器的重要性还意味着机器学习尚未实现自动化——底层的人工设计只是从网络工程转变到网络生成器工程(network generator engineering)。

研究方法

接下来介绍网络生成器的概念,这是随机连接神经网络的基础。

网络生成器(network generator)

我们定义一个网络生成器为从参数空间Θ到神经网络结构空间N的一个映射g,表示为g:Θ→N。对于一个给定的θ∈Θ,g(θ)返回一个神经网络实例n∈N。N通常是一组相关网络,例如VGG nets、ResNets或DenseNets。

生成器g决定了计算图的连接方式。

随机连接神经网络(Randomly Wired Neural Networks)

对NAS的分析表明,网络生成器是人工设计的,并且是人类知识的先验编码。网络生成器的设计很可能起了相当大的作用,如果是这样的话,目前的方法还没有实现“AutoML”,仍然需要大量的人工。

为了研究生成器设计的重要性,仅比较相同NAS生成器的不同优化器是不够的;有必要研究新的网络生成器,它们与NAS生成器有本质的不同。

这就引出了我们对随机连接神经网络的探索。也就是说,我们将定义网络生成器,这些生成器生成具有随机图的网络,受不同的人类特定先验影响。

我们在研究中使用了三个经典的随机图模型(如上文所述)。生成随机连接网络的方法涉及以下概念:

生成通用的图(general graphs)。

网络生成器首先生成一个general graph,包含一组节点和连接节点的边,而不受限于图和神经网络的对应关系。这允许我们自由地使用图理论中的任意通用图生成器(ER/BA/WS)。一旦生成一个图,它就被映射到一个可计算的神经网络。

边操作(Edge operations)。

假设生成的图是有方向的,我们定义边是数据流,即有向边将数据(张量)从一个节点发送到另一个节点。

节点操作(Node operations)。

有向图中的节点可以具有一些输入边和一些输出边。如图2所示。

图2:节点操作

输入和输出节点。

到目前为止,即使给定边/节点操作,通用图也不是一个有效的神经网络,因为它可能有多个输入节点和多个输出节点。对于典型的神经网络,如图像分类,最好有一个单一的输入和输出。我们应用了一个简单的后处理步骤。

阶段(Stages)。

由于具有唯一的输入和输出节点,一个图就足以表示一个有效的神经网络。然而,特别是在图像分类中,始终保持完整输入分辨率的网络是不可取的。通常的方法是将网络划分为逐步向下采样特征映射的阶段。

表1:RandWire架构

表1总结了我们实验中使用的随机连接神经网络,称为RandWire。网络以一个分类器输出结束(表1,最后一行)。

图1显示了三个随机连接网络样本的完整计算图。

实验和结果

我们对ImageNet 1000类分类任务进行了实验。训练在~1.28M图像的训练集上进行,并在50K验证图像上进行测试。

实验结果如下:

随机生成器

图3

图3比较了小型计算环境中不同生成器的结果:每个RandWire网络有~580M FLOPs。

图4

图4显示了每个生成器的一个示例图。图生成器由随机图模型(ER/BA/WS)及其参数集指定,如ER(0.2)。我们观察到:

所有随机生成器在所有5个随机网络实例上都提供良好的准确度,而且它们没有一个不收敛。

此外,随机网络实例之间的差异很小。图3中的几乎所有随机生成器的标准偏差(std)都为0.2 ~ 0.4%。

Graph damage.

我们通过随机移除一个节点或边来探索Graph damage。

图5

当删除边时,我们评估了精度损失与该边的目标节点的输入程度(图5,底部)。

节点操作

图6

图6显示了图3中列出的每个生成器的平均精度。

结果比较

小型计算设置

表2

表2比较了在较小计算条件下的结果,这是现有NAS论文中研究的一种常见设置

表3

表3比较了RandWire与ResNet和ResNeXt在与ResNet-50/101类似的FLOPs的情况下的性能。RandWire的平均准确率分别比ResNet50和ResNet-101高1.9%和1.3%,比ResNeXt高0.6%。

更大的计算条件

表4

表4比较了在更大计算条件下的结果

COCO对象检测

最后,我们报告了通过微调网络进行COCO对象检测的结果。我们使用Faster R-CNN和FPN作为目标探测器

表5

表5比较了对象检测结果。观察到的趋势与表3中的ImageNet实验相似。这些结果表明,我们的随机连接网络学习到的特征也可以迁移。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4771

    浏览量

    100743
  • NAS
    NAS
    +关注

    关注

    11

    文章

    287

    浏览量

    112459
  • 深度学习
    +关注

    关注

    73

    文章

    5503

    浏览量

    121136

原文标题:何恺明团队神经结构搜索最新力作:设计随机连接网络,效果超ResNet

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    LSTM神经网络的结构与工作机制

    网络的结构与工作机制的介绍: 一、LSTM神经网络的结构 LSTM神经网络的结构主要包括以下几个部分: 记忆单元(Memory Cell)
    的头像 发表于 11-13 10:05 347次阅读

    Meta开发新搜索引擎,减少对谷歌和必应的依赖

    将基于Meta AI聊天机器人进行生成。 据一位曾与Meta搜索引擎团队交流过的人士透露,Meta希望通过这款搜索引擎降低对谷歌搜索和微软必应的依赖。目前,这两家
    的头像 发表于 10-29 11:49 382次阅读

    人工智能神经元的基本结构

    人工智能神经元的基本结构是一个复杂而深入的话题,涉及到计算机科学、数学、神经科学等多个领域的知识。 引言 人工智能(Artificial Intelligence,简称AI)是计算机科学的一个分支
    的头像 发表于 07-11 11:19 1345次阅读

    递归神经网络和循环神经网络的模型结构

    递归神经网络是一种旨在处理分层结构神经网络,使其特别适合涉及树状或嵌套数据的任务。这些网络明确地模拟了层次结构中的关系和依赖关系,例如语言中的句法
    的头像 发表于 07-10 17:21 649次阅读
    递归<b class='flag-5'>神经</b>网络和循环<b class='flag-5'>神经</b>网络的模型<b class='flag-5'>结构</b>

    华为将正式揭开5.5G威廉希尔官方网站 领域的最新力作

    场科技盛宴上,华为将正式揭开其5.5G威廉希尔官方网站 领域的最新力作——Apollo Version的神秘面纱,标志着5G威廉希尔官方网站 迈向了全新的发展阶段,即5G-Advanced(简称5G-A或5.5G)时代。
    的头像 发表于 07-04 14:56 553次阅读

    人工智能神经网络的结构是什么

    人工智能神经网络是一种模拟人脑神经网络的计算模型,其结构和功能非常复杂。 引言 人工智能神经网络是一种模拟人脑神经网络的计算模型,其
    的头像 发表于 07-04 09:37 569次阅读

    卷积神经网络与循环神经网络的区别

    的网络结构,分别适用于不同的应用场景。本文将从基本概念、结构组成、工作原理及应用领域等方面对这两种神经网络进行深入解读。
    的头像 发表于 07-03 16:12 3245次阅读

    神经元的结构及功能是什么

    神经元是神经系统的基本结构和功能单位,它们通过电信号和化学信号进行信息传递和处理。神经元的结构和功能非常复杂,涉及到许多不同的
    的头像 发表于 07-03 11:33 1233次阅读

    神经网络算法的结构有哪些类型

    神经网络算法是深度学习的基础,它们在许多领域都有广泛的应用,如图像识别、自然语言处理、语音识别等。神经网络的结构有很多种类型,每种类型都有其独特的特点和应用场景。以下是对神经网络算法
    的头像 发表于 07-03 09:50 440次阅读

    卷积神经网络的基本结构及其功能

    卷积神经网络(Convolutional Neural Network,简称CNN)是一种深度学习模型,广泛应用于图像识别、视频分析、自然语言处理等领域。本文将详细介绍卷积神经网络的基本结构及其功能
    的头像 发表于 07-02 14:45 1590次阅读

    绿联NAS产品荣获TÜV南德网络安全认证

    近日,深圳市绿联科技股份有限公司传来喜讯,其网络存储服务器产品(简称“NAS”)DXP2800等9款型号成功获得了TÜV南德意志集团首个NAS产品的ETSI EN 303 645认证标志。这一荣誉不仅彰显了绿联科技在网络安全与隐
    的头像 发表于 05-28 10:20 502次阅读

    洪亮团队在生信期刊JCIM发布最新成果,蛋白质工程迈入通用人工智能时代

    Networks)。在此项研究中,该团队设计了一种微环境感知图神经网络ProtLGN。ProtLGN能够从蛋白质三维结构中学习有益的氨基酸突变位点,建立自然选择下的氨基酸序列分
    的头像 发表于 04-19 17:42 567次阅读
    洪亮<b class='flag-5'>团队</b>在生信期刊JCIM发布最新成果,蛋白质工程迈入通用人工智能时代

    fpga在通信方面的应用

    FPGA在通信方面的应用非常广泛,以下是一些主要的应用场景。
    的头像 发表于 03-27 14:10 1075次阅读

    谷歌搜索引擎优化的各个方面和步骤

    或SEMrush等专业工具,来帮助你找到相关的关键字。注意关键字的搜索量和竞争度,选择适合你网站的关键字。 网站结构和链接优化 谷歌搜索引擎优化的一个重要方面是网站
    的头像 发表于 01-25 10:29 881次阅读

    NAS设备及硬盘的选购与安装使用

    面对海量的存储需求难题,众多企业与工作室往往会首选NAS存储解决方案。但市面上NAS设备与硬盘产品繁多,如何组建适合自己的一套NAS系统也常常令人头疼。
    的头像 发表于 01-07 15:39 1166次阅读
    <b class='flag-5'>NAS</b>设备及硬盘的选购与安装使用