0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

SSL方法是否适用于“现实世界”的环境?

mK5P_AItists 来源:未知 作者:李倩 2018-04-27 10:03 次阅读

半监督学习(Semi-supervised learning,SSL)提供了一个强大的框架,可以在标记有限或昂贵的情况下利用无标记数据。近期,基于深度神经网络的SSL算法已被证明在标准基准任务上是成功的。然而,我们认为,这些基准无法解决这些算法在实际应用程序中遇到的许多问题。在对各种广泛使用的SSL威廉希尔官方网站 进行了统一重新实现(unified reimplemention)之后,我们在一组旨在解决这些问题的实验中对它们进行了测试。我们发现:不使用无标记数据的简单基线的性能经常被低估;SSL方法对标记数据和无标记数据数量的敏感性不同;当无标记数据集包含类外的样本时,其性能会大幅降低。为了帮助指导SSL研究在现实世界的实际应用,我们开源了我们的统一重新实现和评估平台。

深度神经网络已经一再被表明,可以通过利用大量标记数据,在某些监督学习问题上达到人类水平或超越人类水平的性能。然而,这些成功有着不同的代价;也就是说,创建这些大型数据集通常需要大量的人力(以手工对样本增添标记)、痛苦或风险(对于涉及侵入性测试的医疗数据集)或财务费用(用于雇佣标记标注者或构建在特定领域收集数据所需的基础设施)。对于许多实际问题和应用程序来说,没有足够的资源来创建足够大的标记数据集,这限制了深度学习威廉希尔官方网站 的广泛采用。

有一个具有吸引力的方法可以缓解这个问题,就是半监督学习(semi-supervised learning,SSL)框架。与需要所有样本都有标记的监督学习(supervised learning)算法相反,SSL算法可以通过使用无标记样本来提高其性能。SSL算法通常提供一种从无标记样本中学习数据结构的方法,这可以减轻对标记的需求。最近的一些研究结果表明,在某些情况下,SSL能够接近纯粹监督学习的性能,即使在给定的数据集中有很大一部分的标记被丢弃。

每种SSL威廉希尔官方网站 在CIFAR-10(六类动物)上的测试误差,其中,在标记数据与无标记数据之间,存在不同程度的重叠。例如,“25%”是指来自不同类的4种无标记数据之一,而非来自标记数据的6类。“监督”是指不使用无标记数据。阴影区域表示5次试验的标准偏差。

这些最近的成功引出了一个自然的问题:SSL方法是否适用于“现实世界”的环境?在本文中,我们认为,当前评估SSL威廉希尔官方网站 的实际方法并不能以令人满意的方式解决这个问题。具体而言,采用大型标记数据集并丢弃许多标记的标准评估程序没有考虑到SSL应用程序的各种常见特征。我们的目标是通过提出一种新的实验方法来更直接地解决这个问题,我们认为该方法能够更好地测量对现实世界问题的适应性。我们的一些发现包括:

•当给予调优超参数(hyperparameter)相同预算时,使用SSL和使用标记数据之间的性能差距比通常记录的差距要小。

•此外,使用无标记数据的大型、高度正则化的分类器的强大性能证明了在同一个基础模型上评估不同SSL算法的重要性。

•在不同的标记数据集上对分类器进行预先训练,然后仅在利益相关数据集中的标记数据上进行再训练,这可以胜过所有我们研究过的SSL算法。

•当无标记数据包含与标记数据不同的类分布时,SSL威廉希尔官方网站 的性能可能会急剧下降。

•不同的方法对标记数据和无标记数据数量的敏感度有很大不同。

•实际的小型验证集(validation set)会妨碍对不同方法、模型和超参数设置进行可靠的比较。

在SVHN和CIFAR-10中,每种SSL威廉希尔官方网站 的测试误差都随标记数据量的变化而变化。阴影区域表示5次实验的标准偏差。X轴采用对数形式表示

此外,与机器学习中的许多领域一样,对超参数、模型结构及训练的微小调整,都会对方法的直接比较构成混淆,并对结果产生重大影响。为了改善这一问题,我们提出了关于各种SSL方法的统一的、模块化的重新实现,这些方法也使得我们的评估威廉希尔官方网站 成为现实。

结论与建议

我们的实验提供了有力的证据,证明SSL的标准评估实践是不现实的。为了更好地反应在现实世界中的应用,我们应该对评估进行哪些改进呢?我们对SSL算法的评估有以下建议:

•在比较不同的SSL方法时,使用完全相同的基础模型。因为模型结构或实现细节的差异会对结果产生很大影响。

•报告需认真评估对完全监督精确度和迁移学习性能的要求,以将其作为基准。SSL的目标应该定为,显著优于完全监督环境下的综合表现。

•对类分布失协情况的系统性变化的结果进行报告。 我们表明,当采用是不同类的无标记数据,而非标记数据时,我们对SSL威廉希尔官方网站 的研究受到了影响。据我们了解,这一现实问题被严重忽略了。

•在评估性能时,应调整标记数据和无标记数据的数量。理想的SSL算法即使在标记数据很少的情况下也是非常有效的,并且它还可以从额外的无标记数据中受益。具体而言,我们建议将SVHN和SVHN-extract相结合,来测试大型无标记数据机制的性能。

•注意,不要在非真实的大型验证集上过度调节超参数。如果验证集非常小,那么为了获得理想的性能而在每个模型或每个任务基础上,对超参数进行重大调整的SSL方法将不可用。

我们的研究还表明,面对以下情况时,SSL或许是研究人员最正确的选择:

•当没有来自类似域的高质量标记数据集用于微调时。

•当标记数据是通过独立同分布(i.i.d)采样,从无标记数据集中采集得到,而不是从不同分布中收集得来时。

•当标记的数据集足够大,能够准确计算验证精确度时(这是进行模型选择和超参数调优所必须的条件)。

近来,SSL收获了巨大的成功。我们希望我们的研究成果,以及公开可用的统一实现,能够让成功之花在现实世界中遍地绽放。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4771

    浏览量

    100725
  • SSL
    SSL
    +关注

    关注

    0

    文章

    125

    浏览量

    25739
  • 深度学习
    +关注

    关注

    73

    文章

    5500

    浏览量

    121118

原文标题:该如何对「半监督学习算法」实际性应用进行评估?Google给出了新答案

文章出处:【微信号:AItists,微信公众号:人工智能学家】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    是否适用于CYBT-343026-01的SPICE型号?

    是否适用于 CYBT-343026-01 的 SPICE 型号? 该模块将在本质安全应用中使用,并且需要知道内部电容/电感。
    发表于 03-01 07:56

    LMP91051是否适用于Pyreos的双通道?

    LMP91051是否适用于Pyreos的双通道(两颗sensor集成在同一封装中,共用电源和地)热释电红外传感器
    发表于 08-19 07:17

    适用于高性能运算的处理器

    三星八核64位高性能处理器适用于对运算要求较高的设备.如机器人,虚拟现实,增加现实
    发表于 03-14 15:39

    FMC是否适用于ML507?

    适用于ML507。我可以在此链接中使用任何ADC用于ML507吗?我试图运行的系统应该在200-400MHz左右。谢谢。
    发表于 06-12 16:35

    适用于所有atmega328p项目的通用板

    描述适用于所有 atmega328p 项目的通用板这个项目在我们的现实世界中有很多用途,它用于水位控制器,基于gsm的项目,7段接口,远程控制,可连接Nrf24l01模块和许多其他传感
    发表于 08-29 07:43

    STM32L073RZ是否适用于近地轨道运行环境

    我正在考虑将 STM32L073RZ 用于近地轨道应用。此 MCU 是否适用于以下操作环境?海拔 590 – 630 公里。温度环境范围为-
    发表于 02-07 07:12

    是否适用于LPC4078的SVD文件?

    是否适用于 LPC4078 的 SVD 文件?我似乎无法在任何地方找到它。是否有一个集中放置所有 .SVD 文件的地方?
    发表于 03-29 08:21

    是否适用于LPC4357的替代屏幕?

    看起来是一个显而易见的选择。 我看到它使用 K43WQA 屏幕,但这些屏幕并不广泛,我想选择屏幕尺寸,以及更容易获得的屏幕尺寸。 是否适用于 LPC4357 的替代屏幕?我不知道界面是什么。如果它是标准界面,那么我想我可以选择不同的屏幕尺寸来使用?
    发表于 06-02 07:57

    是否适用于LS1046ARDB上的Secure JTAG的任何应用说明?

    我想知道是否适用于 LS1046ARDB 上的 Secure JTAG 的任何应用说明,就像适用于 i.MXRT10XX 系列的应用说明一样,例如适用于 i.MXRT10xx.pdf
    发表于 06-08 09:05

    泰科电子推出适用于LED印刷电路板上全新的IDC SSL连接

    泰科电子推出适用于LED印刷电路板上全新的IDC SSL连接器   日前,泰科电子宣布推出全新IDC SSL连接器,用于实现LED印刷电路板(PCB)上散线的快速、免工具刺破式连接。
    发表于 04-20 10:16 650次阅读

    基于一种适用于SSL产品的LED控制电路设计

    方法适用于基于LED的控制电路和散热器的SSL产品,适用于灯具形式(包含光源装置)以及集成的LED灯,即这些设备只需要AC或DC电源即可运行;不
    发表于 11-27 16:36 1173次阅读
    基于一种<b class='flag-5'>适用于</b><b class='flag-5'>SSL</b>产品的LED控制电路设计

    适用于恶劣环境的产品

    适用于恶劣环境的产品
    发表于 05-27 20:30 9次下载
    <b class='flag-5'>适用于</b>恶劣<b class='flag-5'>环境</b>的产品

    工业加固三防平板适用于哪些环境

    本期上海研强给大家分享的是工业加固三防平板适用于哪些环境,希望看完本篇文章您能三防加固平板有一个全新的认识!
    发表于 07-12 16:17 833次阅读

    UltraFAST设计方法指南(适用于Vivado Design Suite)

    电子发烧友网站提供《UltraFAST设计方法指南(适用于Vivado Design Suite).pdf》资料免费下载
    发表于 09-13 10:18 0次下载
    UltraFAST设计<b class='flag-5'>方法</b>指南(<b class='flag-5'>适用于</b>Vivado Design Suite)

    UltraFAST设计方法指南(适用于Vivado Design Suite)

    电子发烧友网站提供《UltraFAST设计方法指南(适用于Vivado Design Suite).pdf》资料免费下载
    发表于 09-15 09:56 1次下载
    UltraFAST设计<b class='flag-5'>方法</b>指南(<b class='flag-5'>适用于</b>Vivado Design Suite)