0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于k近邻与高斯噪声的虚拟困难样本增强方法

深度学习自然语言处理 来源:YeungNLP 作者:荷风微摆 2022-05-12 11:31 次阅读

在本文中,我们将介绍亚马逊团队在ACL2022中的一篇论文VaSCL,该论文在SimCSE的基础上,提出了一种基于k近邻与高斯噪声的虚拟困难样本增强方法。作者在无监督训练中,进行困难样本增强,从而提高了模型的性能,并且超过了SimCSE。

6338e638-d19e-11ec-bce3-dac502259ad0.png

论文标题:

Virtual Augmentation Supported Contrastive Learning of Sentence Representations

论文链接:

https://arxiv.org/abs/2110.08552

01

引言

在ACL2021中,陈丹琦团队提出了使用Dropout进行正样本增强的对比学习方法SimCSE,该方法操作简单却十分有效,在无监督对比学习中取得了非常好的效果。在有监督SimCSE中,作者对困难负样本的作用进行了探究实验,实验结果证明,引入困难负样本后,有监督SimCSE的指标从84.9提升至86.2。这说明,在对比学习中,引入困难样本是能够提升模型效果的。

然而在无监督SimCSE中,作者仅使用dropout的方式进行了正样本增强,没有额外引入困难样本,这在一定程度上限制了模型的能力。基于这个动机,亚马逊提出了一种基于k近邻与高斯噪声的虚拟困难样本增强的无监督对比学习方法VaSCL。

02

论文解读

基于Dropout的对比损失

在介绍VaSCL模型之前,我们先简单回顾一下无监督SimCSE。假设训练时的batch size为N,将一个batch的数据记作,将同一个样本分别输入模型中两次,使用不同的dropout mask编码得到两个向量和。则在规模为N的batch中,与的InfoNCE损失为:

基于k近邻的虚拟增强对比损失

在无监督SimCSE的损失函数的基础上,作者还设计了一种基于k近邻的虚拟困难样本增强的损失函数。

将通过模型编码之后得到向量序列。

作者通过以下方式获得第i个句向量的虚拟困难样本:

正样本增强:对添加高斯噪声,得到,其中就是经过高斯增强后的正样本。

获得k近邻:获得在中距离最近的k个负样本,在本文中我们称之为k近邻,记作。

对于来说,是正样本,是负样本集合。则对于,k近邻虚拟增强的对比损失如下。分子表示拉近与的距离,分母表示拉远与负样本之间的距离。

在CV中,我们会为输入的图片添加高斯噪声以增加模型的泛化性。添加了高斯噪声的图片,肉眼能看出微小的区别,但不会影响整张图片的语义信息。所以为句向量添加合适的高斯噪声,理论上也不会对句向量的语义信息产生很大的改变。

在的k近邻中,存放的是距离最近的k个负样本,也就是与最相似的k个负样本。只要batch size足够大,我们可以近似认为,就是的困难负样本集合,同样也是的困难负样本集合。

如何获得上述的高斯噪声呢?最容易想到的做法便是随机生成一个高斯噪声,直接添加到句向量中。但是为了提高模型的训练难度,生成更高质量的高斯噪声,作者生成若干个候选高斯噪声,然后选出一个使得最大化的高斯噪声。

从上述操作可以看出,对于最优的高斯噪声,作者希望它增强后的正样本与的距离尽可能远,与负样本的距离尽可能近,作者希望这个高斯噪声能够对模型产生尽可能大的迷惑性。通过这个高斯噪声,我们就可以得到困难正样本,并且从某种意义来说,也使得与的距离尽可能拉近,达到了增强负样本难度的目的,做法确实挺巧妙。

VaSCL对比损失

63676d46-d19e-11ec-bce3-dac502259ad0.png

将上述两种对比损失进行组合,得到最终的VaSCL损失函数:

这个损失函数的含义如下:

对于每个句子,拉近同一个句子经过dropout之后的两个句向量之间的距离,拉远它们与其他句子的距离。

对于每个句子,拉近原句向量与高斯噪声增强之后的句向量的距离,拉远它们与k近邻负样本之间的距离。

03

实验结果

作者分别在STS任务、短文本聚类、意图识别等任务中进行了实验,实验结果如下表所示。可以看到,在三种任务中,绝大部分数据集上,VaSCL的表现都要优于SimCSE,这表明了基于k近邻与高斯噪声的困难样本增强的有效性。

6385a8ce-d19e-11ec-bce3-dac502259ad0.png

63c1165c-d19e-11ec-bce3-dac502259ad0.png

63d37914-d19e-11ec-bce3-dac502259ad0.png

04

总结

SimCSE通过dropout mask这种简单的方法,避免了人工进行正样本增强所带来的语义改变的问题,并且在无监督训练中取得了不错的效果。而VaSCL论文延续了SimCSE这种思想,引入了高斯噪声进行正样本增强,有着异曲同工之妙。

VaSCL在SimCSE的基础上,也进行了困难样本的增强。在进行高斯噪声增强时,使得增强的样本与原始样本尽可能不相似,与负样本尽可能相似,已达到【混淆视听】的效果。通过这种方式,VaSCL在绝大多数据集上的表现,也超过了SimCSE。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 噪声
    +关注

    关注

    13

    文章

    1122

    浏览量

    47402
  • 函数
    +关注

    关注

    3

    文章

    4329

    浏览量

    62579
  • 模型
    +关注

    关注

    1

    文章

    3230

    浏览量

    48813

原文标题:ACL'22 | VaSCL:基于k近邻与高斯噪声的困难样本增强的对比学习方法,超越SimCSE

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    图像高斯滤波的原理及FPGA实现思路

    (Gaussian Blur),是一种高斯低通滤波。通常这个算法也可以用来模糊图像,提供模糊滤镜。也可以用来过滤自然界的高斯噪声高斯分布(正态分布)是一个常见的连续概率分布,正态
    的头像 发表于 12-07 09:12 249次阅读
    图像<b class='flag-5'>高斯</b>滤波的原理及FPGA实现思路

    高斯滤波和均值滤波的区别

    高斯滤波和均值滤波在图像处理中都是常用的平滑滤波方法,但它们之间存在一些关键的区别。以下是两者之间的主要区别: 1. 滤波原理 高斯滤波 : 是一种线性平滑滤波,它使用高斯函数来计算卷
    的头像 发表于 09-29 09:40 632次阅读

    高斯滤波和双边滤波的区别

    高斯滤波和双边滤波在图像处理中都是常用的平滑滤波威廉希尔官方网站 ,但它们之间存在一些显著的区别。以下是两者之间的主要区别: 一、基本原理 高斯滤波 : 是一种线性平滑滤波,适用于消除高斯噪声。 其
    的头像 发表于 09-29 09:37 401次阅读

    高斯滤波的特点有哪些

    、背景)则相对保留。这种平滑处理有助于去除图像中的噪声,改善图像质量。 边缘保留 : 与其他平滑滤波方法相比,高斯滤波在平滑图像的同时能够较好地保留图像的边缘信息。这是因为高斯滤波的权
    的头像 发表于 09-29 09:36 307次阅读

    高斯卷积核函数在图像采样中的意义

    。这种平滑处理通过减小图像中像素之间的差异来模糊图像,有助于去除图像中的高频噪声和细节纹理,使图像看起来更加平滑。 去噪效果 :在图像的采集或传输过程中,往往会受到各种噪声的干扰。高斯卷积核函数能够通过平滑处理有效地抑
    的头像 发表于 09-29 09:33 398次阅读

    高斯滤波的基本原理有哪些

    高斯滤波的基本原理可以从以下几个方面进行阐述: 一、定义与性质 定义 :高斯滤波(Gaussian Filter)是一种常见的图像处理威廉希尔官方网站 ,实质上是一种信号的滤波器,用于平滑和降噪图像。它采用高斯
    的头像 发表于 09-29 09:27 502次阅读

    增强现实和虚拟现实的联系和区别

    增强现实(AR)和虚拟现实(VR)是两种不同的威廉希尔官方网站 ,它们在许多方面都有联系和区别。 一、增强现实(AR)和虚拟现实(VR)的定义 增强现实(
    的头像 发表于 07-08 11:00 2266次阅读

    增强现实威廉希尔官方网站 (AR)和虚拟现实威廉希尔官方网站 (VR)的区别?

    增强现实威廉希尔官方网站 (AR)和虚拟现实威廉希尔官方网站 (VR)是两种不同的威廉希尔官方网站 ,它们在许多方面都有明显的区别。以下是对这两种威廉希尔官方网站 的介绍和比较。 定义 增强现实威廉希尔官方网站 (AR)是一种将虚拟信息叠加到现实世界中的
    的头像 发表于 07-04 11:40 1161次阅读

    labview能不能对采集的声音信号进行高斯噪声信号分析

    请问对采集到的声音信号进行高斯加噪分析,能不能对声音信号直接加上高斯噪声信号?
    发表于 05-27 15:18

    什么是高斯光束

    图1:高斯光束和平顶光束在相同的光功率下,显示高斯光束的峰值强度是平顶光束的两倍 大多数激光束都是高斯光束,尽管在某些情况下,具有非高斯辐照度分布是有益的。随着离激光束横截面中心的距离
    的头像 发表于 04-11 06:32 1068次阅读
    什么是<b class='flag-5'>高斯</b>光束

    噪声的测量方法

    有效的方法,本期介绍噪声的测量方法。 常见观测噪声的设备为示波器,而示波器在正确操作使用下测量精度为3%,且本身存在底噪。搭配不同的探头使用,观测到的
    的头像 发表于 04-10 15:16 1098次阅读
    <b class='flag-5'>噪声</b>的测量<b class='flag-5'>方法</b>

    基于FIR滤波器的带限白噪声的设计方案实现

    高斯噪声:是一种随机噪声,其时域内的信号幅度的统计规律服从高斯分布。
    的头像 发表于 04-09 09:08 1145次阅读
    基于FIR滤波器的带限白<b class='flag-5'>噪声</b>的设计方案实现

    什么是相位噪声 产生相位噪声的原因 相位噪声的表示方法及影响

    什么是相位噪声 产生相位噪声的原因 相位噪声的表示方法 相位噪声的影响 测量相位噪声的常用
    的头像 发表于 01-31 09:28 3256次阅读

    同轴线测电源噪声的测试方法

    在电子设备测试中,电源噪声测试是一项非常重要的工作。而同轴线测电源噪声测试方法是一种常用且有效的测试手段。本文将对同轴线测电源噪声测试方法
    的头像 发表于 01-11 10:53 798次阅读
    同轴线测电源<b class='flag-5'>噪声</b>的测试<b class='flag-5'>方法</b>

    虚拟现实与增强现实含义是什么

    虚拟现实(Virtual Reality,简称VR)和增强现实(Augmented Reality,简称AR)是近年来科技领域的热门话题,它们为人们带来了全新的交互体验和生活方式。本文将对虚拟
    的头像 发表于 12-30 10:37 8997次阅读