0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于多标签学习的新趋势

智能感知与物联网威廉希尔官方网站 研究所 来源:通信信号处理研究所 作者:通信信号处理研究 2021-01-05 14:35 次阅读

这里大家带来一篇武大刘威威老师、南理工沈肖波老师和 UTS Ivor W. Tsang 老师合作的 2020 年多标签最新的 Survey,我也有幸参与其中,负责了一部分工作。

上半年在知乎上看到有朋友咨询多标签学习是否有新的 Survey,我搜索了一下,发现现有的多标签 Survey 基本在 2014 年之前,主要有以下几篇:

Tsoumakas 的《Multi-label classification: An overview》(2007)

周志华老师的《A review on multi-label learning algorithms》(2013)

一篇比较小众的,Gibaja 《Multi‐label learning: a review of the state of the art and ongoing research》2014

时过境迁,从 2012 年起,AI 领域已经发生了翻天覆地的变化,Deep Learning 已经占据绝对的主导地位,我们面对的问题越来越复杂,CV 和 NLP 朝着各自的方向前行。模型越来越强,我们面对的任务的也越来越复杂,其中,我们越来越多地需要考虑高度结构化的输出空间。多标签学习,作为一个传统的机器学习任务,近年来也拥抱变化,有了新的研究趋势。因此,我们整理了近年多标签学习在各大会议的工作,希望能够为研究者们提供更具前瞻性的思考。

关于单标签学习和多标签学习的区别,这里简单给个例子:传统的图片单标签分类考虑识别一张图片里的一个物体,例如 ImageNet、CIFAR10 等都是如此,但其实图片里往往不会只有一个物体,大家随手往自己的桌面拍一张照片,就会有多个物体,比如手机电脑、笔、书籍等等。在这样的情况下,单标签学习的方法并不适用,因为输出的标签可能是结构化的、具有相关性的(比如键盘和鼠标经常同时出现),所以我们需要探索更强的多标签学习算法来提升学习性能。

本文的主要内容有六大部分:

Extreme Multi-Label Classification

Multi-Label with Limited Supervision

Deep Multi-Label Classification

Online Multi-Label Classification

Statistical Multi-Label Learning

New Applications

接下去我们对这些部分进行简单的介绍,更多细节大家也可以进一步阅读 Survey 原文。另外,由于现在的论文迭代很快,我们无法完全 Cover 到每篇工作。我们的主旨是尽量保证收集的工作来自近年已发表和录用的、高质量的期刊或会议,保证对当前工作的整体趋势进行把握。如果读者有任何想法和意见的话,也欢迎私信进行交流。 1. Extreme Multi-Label Learning (XML) 在文本分类,推荐系统,Wikipedia,Amazon 关键词匹配 [1] 等等应用中,我们通常需要从非常巨大的标签空间中召回标签。比如,很多人会 po 自己的自拍到 FB、Ins 上,我们可能希望由此训练一个分类器,自动识别谁出现在了某张图片中。

对 XML 来说,首要的问题就是标签空间、特征空间都可能非常巨大,例如 Manik Varma 大佬的主页中给出的一些数据集[2],标签空间的维度甚至远高于特征维度。其次,由于如此巨大的标签空间,可能存在较多的 Missing Label(下文会进一步阐述)。最后,标签存在长尾分布[3],绝大部分标签仅仅有少量样本关联。现有的 XML 方法大致可以分为三类,分别为:Embedding Methods、Tree-Based Methods、One-vs-All Methods。近年来,也有很多文献使用了深度学习威廉希尔官方网站 解决 XML 问题,不过我们将会在 Section 4 再进行阐述。XML 的研究热潮大概从 2014 年开始,Varma 大佬搭建了 XML 的 Repository 后,已经有越来越多的研究者开始关注,多年来 XML 相关的文章理论和实验结果并重,值得更多的关注。

2. Multi-Label with Limited Supervision 相比于传统学习问题,对多标签数据的标注十分困难,更大的标签空间带来的是更高的标注成本。随着我们面对的问题越来越复杂,样本维度、数据量、标签维度都会影响标注的成本。因此,近年多标签的另一个趋势是开始关注如何在有限的监督下构建更好的学习模型。本文将这些相关的领域主要分为三类: MLC with Missing Labels(MLML):多标签问题中,标签很可能是缺失的。例如,对 XML 问题来说,标注者根本不可能遍历所有的标签,因此标注者通常只会给出一个子集,而不是给出所有的监督信息。文献中解决该问题的威廉希尔官方网站 主要有基于图的方法、基于标签空间(或 Latent 标签空间)Low-Rank 的方法、基于概率图模型的方法。

Semi-Supervised MLC:MLML 考虑的是标签维度的难度,但是我们知道从深度学习需要更多的数据,在样本量上,多标签学习有着和传统 AI 相同的困难。半监督 MLC 的研究开展较早,主要威廉希尔官方网站 和 MLML 也相对接近,在这一节,我们首先简要回顾了近年半监督 MLC 的一些最新工作。但是,近年来,半监督 MLC 开始有了新的挑战,不少文章开始结合半监督 MLC 和 MLML 问题。毕竟对于多标签数据量来说,即使标注少量的 Full Supervised 数据,也是不可接受的。因此,许多文章开始研究一类弱监督多标签问题[4](Weakly-Supervised MLC,狭义),也就是数据集中可能混杂 Full labeled/missing labels/unlabeled data。我们也在文中重点介绍了现有的一些 WS-MLC 的工作。

Partial Multi-Label Learning(PML):PML 是近年来多标签最新的方向,它考虑的是一类 “难以标注的问题”。比如,在我们标注下方的图片(Zhang et. al. 2020[5])的时候,诸如 Tree、Lavender 这些标签相对是比较简单的。但是有些标签到底有没有,是比较难以确定的,对于某些标注者,可能出现:“这张图片看起来是在法国拍的,好像也可能是意大利?”。这种情况称之为 Ambiguous。究其原因,一是有些物体确实难以辨识,第二可能是标注者不够专业(这种多标签的情况,标注者不太熟悉一些事物也很正常)。但是,很多情况下,标注者是大概能够猜到正确标签的范围,比如这张风景图所在国家,很可能就是 France 或者 Italy 中的一个。我们在不确定的情况下,可以选择不标注、或者随机标注。但是不标注意味着我们丢失了所有信息,随机标注意味着可能带来噪声,对学习的影响更大。所以 PML 选择的是让标注者提供所有可能的标签,当然加了一个较强的假设:所有的标签都应该被包含在候选标签集中。在 Survey 中,我们将现有的 PML 方法划分为 Two-Stage Disambiguation 和 End-to-End 方法(我们 IJCAI 2019 的论文 DRAMA[6] 中,就使用了前者)。关于 PML 的更多探讨,我在之前的知乎回答里面也已经叙述过,大家也可以在我们的 Survey 中了解更多。

Other Settings:前文说过,多标签学习的标签空间纷繁复杂,因此很多研究者提出了各种各样不同的学习问题,我们也简单摘要了一些较为前沿的方向:

MLC with Noisy Labels (Noisy-MLC)。

MLC with Unseen Labels. (Streaming Labels/Zero-Shot/Few-Shot Labels)

Multi-Label Active Learning (MLAL)。

MLC with Multiple Instances (MIML)。

3. Deep Learning for MLC 相信这一部分是大家比较关心的内容,随着深度学习在越来越多的任务上展现了自己的统治力,多标签学习当然也不能放过这块香饽饽。不过,总体来说,多标签深度学习的模型还没有十分统一的框架,当前对 Deep MLC 的探索主要分为以下一些类别: Deep Embedding Methods:早期的 Embedding 方法通常使用线性投影,将 PCA、Compressed Sensing 等方法引入多标签学习问题。一个很自然的问题是,线性投影真的能够很好地挖掘标签之间的相关关系吗?同时,在 SLEEC[3]的工作中也发现某些数据集并不符合 Low-Rank 假设。因此,在 2017 年的工作 C2AE[7]中,Yeh 等将 Auto-Encoder 引入了多标签学习中。由于其简单易懂的架构,很快有许多工作 Follow 了该方法,如 DBPC[8]等。

4a376d00-4458-11eb-8b86-12bb97331649.png

Deep Learning for Challenging MLC:深度神经网络强大的拟合能力使我们能够有效地处理更多更困难的工作。因此我们发现近年的趋势是在 CV、NLP 和 ML 几大 Community,基本都会有不同的关注点,引入 DNN 解决 MLC 的问题,并根据各自的问题发展出自己的一条线。 1. XML 的应用:对这个方面的关注主要来自与数据挖掘和 NLP 领域,其中比较值得一提的是 Attention(如 AttentionXML[9])机制、Transformer-Based Models(如 X-Transformer[10])成为了最前沿的工作。

2. 弱监督 MLC 的应用:这一部分和我们弱监督学习的部分相对交叉,特别的,CVPR 2019 的工作 [11] 探索了多种策略,在 Missing Labels 下训练卷积神经网络。 DL for MLC with unseen labels:这一领域的发展令人兴奋,今年 ICML 的工作 DSLL[12]探索了流标签学习,也有许多工作 [13] 将 Zero-Shot Learning 的架构引入 MLC。 3. Advanced Deep Learning for MLC:有几个方向的工作同样值得一提。首先是 CNN-RNN[14]架构的工作,近年有一个趋势是探索 Orderfree 的解码器 [15]。除此之外,爆火的图神经网络 GNN 同样被引入 MLC,ML-GCN[16] 也是备受关注。特别的,SSGRL[17]是我比较喜欢的一篇工作,结合了 Attention 机制和 GNN,motivation 比较强,效果也很不错。 总结一下,现在的 Deep MLC 呈现不同领域关注点和解决的问题不同的趋势:

从架构上看,基于Embedding、CNN-RNN、CNN-GNN的三种架构受到较多的关注。

从任务上,在XML、弱监督、零样本的问题上,DNN 大展拳脚。

从威廉希尔官方网站 上,Attention、Transformer、GNN在 MLC 上的应用可能会越来越多。

4. Online Multi-Label Learning 面对当前这么复杂而众多的学习问题,传统的全数据学习的方式已经很难满足我们现实应用的需求了。因此,我们认为 Online Multi-Label Learning 可能是一个十分重要,也更艰巨的问题。当前 Off-line 的 MLC 模型一般假设所有数据都能够提前获得,然而在很多应用中,或者对大规模的数据,很难直接进行全量数据的使用。一个朴素的想法自然是使用 Online 模型,也就是训练数据序列地到达,并且仅出现一次。然而,面对这样的数据,如何有效地挖掘多标签相关性呢?本篇 Survey 介绍了一些已有的在线多标签学习的方法,如 OUC[18]、CS-DPP[19]等。在弱监督学习的部分,我们也回顾了近年一些在线弱监督多标签的文章[20](在线弱监督学习一直是一个很困难的问题)。

Online MLC 的工作不多,但是已经受到了越来越多的关注,想要设计高效的学习算法并不简单,希望未来能够有更多研究者对这个问题进行探索。 5. Statistical Multi-Label Learning 近年,尽管深度学习更强势,但传统的机器学习理论也在稳步发展,然而,多标签学习的许多统计性质并没有得到很好的理解。近年 NIPS、ICML 的许多文章都有探索多标签的相关性质。一些值得一提的工作例如,缺失标签下的低秩分类器的泛化误差分析 [21]、多标签代理损失的相合性质[22]、稀疏多标签学习的 Oracle 性质[23] 等等。相信在未来,会有更多工作探索多标签学习的理论性质。

6. New Applications 讲了这么多方法论,但追溯其本源,这么多纷繁复杂的问题依然是由任务驱动的,正是有许许多多现实世界的应用,要求我们设计不同的模型来解决尺度更大、监督更弱、效果更强、速度更快、理论性质更强的 MLC 模型。因此,在文章的最后一部分,我们介绍了近年多标签领域一些最新的应用,如 Video Annotation、Green Computing and 5G Applications、User Profiling 等。在 CV 方向,一个趋势是大家开始探索多标签领域在视频中的应用 [24]。在 DM 领域,用户画像受到更多关注,在我们今年的工作 CMLP[25] 中(下图),就探索了对刷单用户进行多种刷单行为的分析。不过,在 NLP 领域,似乎大家还是主要以文本分类为主,XML-Repo[2]中的应用还有较多探索的空间,所以我们没有花额外的笔墨。

4a74a828-4458-11eb-8b86-12bb97331649.png

总结 写这篇文章的过程中,我跟着几位老师阅读了很多文章,各个领域和方向的工作都整理了不少,尽管无法 cover 到所有工作,但是我们尽可能地把握了一些较为重要的探索的方向,也在文中较为谨慎地给出了一些我们的思考和建议,希望能够给想要了解多标签学习领域的研究者一点引领和思考。

原文标题:多标签学习的新趋势(2020 Survey)

文章出处:【微信公众号:通信信号处理研究所】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4771

    浏览量

    100744
  • AI
    AI
    +关注

    关注

    87

    文章

    30824

    浏览量

    268977
  • 深度学习
    +关注

    关注

    73

    文章

    5503

    浏览量

    121136

原文标题:多标签学习的新趋势(2020 Survey)

文章出处:【微信号:tyutcsplab,微信公众号:智能感知与物联网威廉希尔官方网站 研究所】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    智慧路灯综合杆:赋能低空经济, 解锁无人机场,化身低空雷达,护航“空中卫士”引领智慧城市新趋势

    【案例分享】智慧路灯综合杆:赋能低空经济, 解锁无人机场,化身低空雷达,护航“空中卫士”引领智慧城市新趋势
    的头像 发表于 12-10 13:56 147次阅读
    智慧路灯综合杆:赋能低空经济, 解锁无人机场,化身低空雷达,护航“空中卫士”引领智慧城市<b class='flag-5'>新趋势</b>

    2024世界物联网大会:IOT研发的新趋势和PLM系统使用

    盘点世界物联网大会上的IOT新趋势,云PLM为IOT设备的研发提供了更多可能
    的头像 发表于 12-09 17:48 196次阅读

    测径仪控制软件 趋势图报表一个不能少

    :允许用户自定义趋势图的样式,包括颜色、线条类型、轴标签等,以满足不同用户的视觉偏好和分析需求。 通道显示:如果测径仪支持通道测量,软件应能同时显示多个通道的
    发表于 10-21 14:35

    通道开关滤波器的创新者,引领电磁兼容威廉希尔官方网站 新趋势

    维爱普|通道开关滤波器的创新者,引领电磁兼容威廉希尔官方网站 新趋势
    的头像 发表于 10-16 14:25 233次阅读

    多家企业将汇聚深圳,共商电机新趋势

    从高效能电机本体、智能控制器、关键零部件到先进的测试与检测设备,如何把握电机产业最新产品动向和威廉希尔官方网站 新趋势? 如何高效、直接把握当下电机产业链上下游的最新产品与电机威廉希尔官方网站 方案? 为构建一个电机行业新产品
    的头像 发表于 10-15 14:02 312次阅读
    多家企业将汇聚深圳,共商电机<b class='flag-5'>新趋势</b>!

    光伏电站无人机智慧巡检新趋势

    光伏电站无人机智慧巡检新趋势 随着全球能源结构向清洁化、低碳化转型,光伏发电作为重要的清洁能源之一,其应用日益广泛。光伏电站的建设和运维也面临着新的挑战,尤其是在电站规模不断扩大后,如何高效、精准
    的头像 发表于 09-05 16:51 258次阅读
    光伏电站无人机智慧巡检<b class='flag-5'>新趋势</b>

    无线液位监测威廉希尔官方网站 在智能化时代的应用新趋势

    复杂多变的工业场景中灵活应用。随着物联网、无线通信威廉希尔官方网站 的飞速发展,无线液位监测威廉希尔官方网站 的出现,以其优势正逐步改写液体管理的新趋势。 一、无线液位监测威廉希尔官方网站 的核心优势 1. 安装便捷,降低成本: 相比有线传感器,无线液位
    的头像 发表于 08-26 15:19 290次阅读

    揭秘未来办公新趋势:楼宇自控系统的智能进化

    在科技浪潮的推动下,办公空间正悄然发生着翻天覆地的变化。楼宇自控系统,作为智能建筑的灵魂,正引领我们迈向一个前所未有的智慧办公新时代。这一系统的智能进化,不仅深刻影响着我们的工作环境,更在无形中塑造着未来办公的新趋势
    的头像 发表于 08-10 10:21 393次阅读

    马拉松赛事新趋势:超高频标签的应用与影响 #物联网 #赛事标签 #超高频标签 #rfid标签

    RFID
    深圳市融智兴科技有限公司
    发布于 :2024年07月12日 16:29:12

    一屏万象,场景无限: 蓝牙墨水屏标签多功能场景应用带您领略未来

    研发的智能蓝牙墨水屏显示标签规格,应用场景,超低功耗,设备联动,提供二次开发定制,API对接,SDK云云对接等特色,满足不同行业客户不断拓展的多元化需求。
    的头像 发表于 05-27 11:11 445次阅读
    一屏万象,场景无限: 蓝牙墨水屏<b class='flag-5'>标签</b>多功能<b class='flag-5'>多</b>场景应用带您领略未来

    梯云物联|电梯行业三大发展新趋势:智慧转型、维保机遇与威廉希尔官方网站 创新

    在城市化进程不断加速的今天,电梯行业作为现代城市建设的重要一环,正迎来三大发展新趋势:智慧转型、维保后市场机遇以及自主研发威廉希尔官方网站 的更新换代。这些趋势不仅为电梯行业带来了新的发展机遇,也为行业的可持续发展注入了新的活力。
    的头像 发表于 05-14 10:40 994次阅读
    梯云物联|电梯行业三大发展<b class='flag-5'>新趋势</b>:智慧转型、维保机遇与威廉希尔官方网站
创新

    如何看待半导体行业未来的新趋势

    如何看待半导体行业未来的新趋势
    的头像 发表于 04-25 11:38 739次阅读
    如何看待半导体行业未来的<b class='flag-5'>新趋势</b>

    黑芝麻智能展望智能汽车计算芯片新趋势

    近日,中国电动汽车百人会论坛(2024)在北京盛大召开,吸引了众多行业内外人士的目光。在这场科技盛宴中,黑芝麻智能首席市场营销官杨宇欣发表了主题演讲,深入探讨了智能汽车计算芯片发展的新趋势,并分享了黑芝麻智能如何以“芯”力量推动智能汽车产业的持续发展。
    的头像 发表于 03-18 10:07 799次阅读

    关于人工智能的60条趋势预测

    2023年是威廉希尔官方网站 发展的分水岭,生成式人工智能成为主流。2024年伊始,生成式AI的格局预计将迅速发展,带来一系列有望改变威廉希尔官方网站 及其应用的趋势。这些趋势,从模式人工智能模型的进步到小语言模型的兴起
    的头像 发表于 02-21 08:26 708次阅读
    <b class='flag-5'>关于</b>人工智能的60条<b class='flag-5'>趋势</b>预测

    新趋势下,国产数据库或“春山可望”

    数据库发展出现新趋势
    的头像 发表于 01-30 12:12 306次阅读