0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

适配器微调在推荐任务中的几个关键因素

智能感知与物联网威廉希尔官方网站 研究所 来源:智能感知与物联网威廉希尔官方网站 研 2024-03-04 09:50 次阅读

本文对基于适配器的可迁移推荐系统进行了实验探索和深入研究。发现在文本推荐方面,基于适配器的可迁移推荐取得了有竞争力的结果;在图像推荐方面,基于适配器的可迁移推荐略落后于全量微调。后续本文对四种著名的适配器微调方法进行了基准测试,并深入研究了可能影响适配器微调在推荐任务中的几个关键因素。

e993c106-d969-11ee-a297-92fbcf53809c.png

论文题目:

Exploring Adapter-based Transfer Learning for Recommender Systems: Empirical Studies and Practical Insights

论文链接:

https://arxiv.org/abs/2305.15036

代码链接:

https://github.com/westlake-repl/Adapter4Rec/

研究动机

可迁移的推荐系统 (TransRec) 通常包含一个用户编码器和一个或多个基于模态的物品编码器,其中基于模态的物品编码器通常是经过预训练的 ViT, BERT, RoBERTA, 与 GPT 等模型,他们往往包含很大的参数量。常见使用 TransRec 的范式是先经过一个源域数据集的预训练之后再迁移到目标域,迁移的过程往往都需要再进行微调。

e9aa3a76-d969-11ee-a297-92fbcf53809c.png

传统的全参数微调 (Fine-tune All, FTA) 是很有效的方式,但它存在如下几个问题:

1. 如上图所示,推荐系统往往都包含一个主频道和多个垂直频道,如果想利用主频道预训练过的模型迁移至每个垂直频道,则每个垂直通道的模型更新、维护和存储都需要很多额外成本;

2. 全参数微调往往存在过拟合问题;

3. 昂贵的训练成本,往往微调越大的模型所需要的 GPU 显存越高。

这促使研究者们在 TransRec 中探索基于适配器 (Adapter) 的高效微调范式 (Adapter tuning, AdaT) 。AdaT 与传统 FTA 的比较如下图所示,AdaT 仅仅微调新插入的适配器和对应的 layer-normalization 层:

e9b80246-d969-11ee-a297-92fbcf53809c.png

适配器是一种在 NLP 和 CV 中广泛采用的参数高效方法用于解决高效迁移大规模基础模型,然而在当前 TransRec 范式的推荐系统领域并没有被系统的探究过该方法的有效性。针对于该有效性的探究,论文提出如下几个关键研究问题:

RQ1: 基于适配器的 TransRec 性能上能否与典型的基于微调的 TransRec 相当?该结论适用于不同模态的场景吗?

RQ2: 如果 RQ1 为正确或部分正确,那么这些 NLP 和 CV 社区当中流行的适配器性能又如何呢?

RQ3: 是否有因素影响这些基于适配器的 TransRec 模型的性能?

针对于 RQ1, 论文在两种物品模态(即文本和图像)上对基于适配器和基于全参数微调的 TransRec 进行了严格的比较研究。其中包括采用两种流行的推荐架构(即 SASRec 和 CPC)以及四种强大的模态编码(即 BERT、RoBERTa、ViT 和 MAE)。

针对于 RQ2, 论文对 NLP 和 CV 中广泛采用的四种适配器进行了基准测试。还加入了 LoRA、Prompt-tuning 和 layer-normalization tuning 的结果,以进行综合比较。

针对于 RQ3, 该文章进行了不同策略的性能比较,这些策略包括插入适配器的方式和位置,以及是否调整相应的 layer-normalization 等。除此之外,论文还研究了 TransRec 在源域和目标域中的数据缩放效应,以考察在使用较大数据集预训练 TransRec 时 AdaT 的有效性。

网络架构

TransRec 架构包含两个子模块,即物品编码器和用户编码器,这两个模块都基于 Transformer 模块。论文采用插入适配器到物品和用户编码器当中。基于适配器的 TransRec 架构如下图所示。论文采用 SASRec 和 CPC 框架对 TransRec 进行二元交叉熵 (BCE) 损失训练。

e9db93be-d969-11ee-a297-92fbcf53809c.png

实验设置

数据集:论文用两种模式对基于适配器的 TransRec 进行了评估。对于具有文本模态的物品,使用 MIND 英语新闻推荐数据集作为源域,并使用 Adressa 挪威语新闻推荐数据集作为目标域。对于视觉模态,使用亚马逊用于服装和鞋类的评论数据集作为目标域,并使用 H&M 个性化时尚推荐数据集作为源域。

e9e889ac-d969-11ee-a297-92fbcf53809c.png

预训练模型的使用:文本模态采用 bert-base-uncased 和 roberta-base 模型;图片模态采用 vit-base-patch16-224 和 vit-mae-base 模型。

评价标准:论文采用 "leave-one-out"的策略来分割数据集:交互序列中的最后一项用于评估,最后一项之前的一项用于验证,其余的用于训练。评估指标采用 HR@10(命中率)和 NDCG@10(归一化累计收益)。所有实验结果均为测试集的结果。

主要发现

RQ1: 在文本内容中,使用 AdaT 的 TransRec 可获得与 FTA 相当的性能,但在视觉场景中性能有所下降。

对比 FTA 和 AdaT 在文本和图片场景下的实验结果如下表所示:

e9f77048-d969-11ee-a297-92fbcf53809c.png

RQ2: 与其他流行的参数高效微调的方法相比,经典的Houlsby 适配器在 TransRec 中取得了最佳效果。

对比常用不同的参数高效微调方法的基准测试:

ea61ddac-d969-11ee-a297-92fbcf53809c.png

RQ3: 该文章认为,TransRec 应为用户和物品编码器放置适配器,以获得最佳效果。插入位置同样也很重要,Transformer当中的FFN (Feed-Forward Network) 和 MHA (Multi-Head Attentions) 的后面一层都需要单独的适配器模块。其次插入方式 (串行或并行) 和 LayerNorm 优化等其他因素对于推荐任务的性能上并不重要。

插入适配器的位置到物品 (Ei) 或用户编码器 (Eu) 的性能对比:

ea76aaf2-d969-11ee-a297-92fbcf53809c.png

插入适配器到 MHA 和 FFN 之后的位置的性能对比:

ea824b8c-d969-11ee-a297-92fbcf53809c.png

采用序列和并行插入的性能对比:

ea862086-d969-11ee-a297-92fbcf53809c.png

除此之外,该文章还进行了充分的数据缩放实验,发现 TransRec 的迁移学习中如果有更多预训练的源领域数据,目标域性能会有更大的提升:

ea90360c-d969-11ee-a297-92fbcf53809c.png

总结

文章发现了两个事实:1)在文本推荐方面,与微调所有参数 (FTA) 相比,AdaT 取得了有竞争力的结果;2)在图像推荐方面,AdaT 性能良好,但略落后于 FTA。

论文对四种著名的 AdaT 方法进行了基准测试,发现经典的 Houlsby 适配器性能最佳。随后,该文章深入研究了可能影响 AdaT 在推荐任务中的结果的几个关键因素。最后,论文发现 TransRec 的 AdaT 和 FTA 符合理想的数据缩放效应——TransRec 在增大源领域数据时能提升性能。

该工作为模态推荐模型的参数高效迁移学习提供了重要指导。它对推荐系统社区的基础模型也有重要的实际意义,是实现推荐系统社区“one model for all”的目标上重要的一环。该方向未来的工作包括探究图片推荐当中如何提升 AdaT 的性能以及引入更多不同的模态等。

审核编辑:黄飞

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编码器
    +关注

    关注

    45

    文章

    3643

    浏览量

    134521
  • 适配器
    +关注

    关注

    8

    文章

    1952

    浏览量

    68029
  • 推荐系统
    +关注

    关注

    1

    文章

    43

    浏览量

    10078
  • 数据集
    +关注

    关注

    4

    文章

    1208

    浏览量

    24701

原文标题:WSDM 2024 | 系统探究适配器微调对于可迁移推荐的影响

文章出处:【微信号:tyutcsplab,微信公众号:智能感知与物联网威廉希尔官方网站 研究所】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    提高电源适配器效率,满足六级能效的几个小秘诀 (附案例)

    提高电源适配器效率,满足六级能效的几个小秘诀 (附案例)
    的头像 发表于 08-08 11:32 2385次阅读
    提高电源<b class='flag-5'>适配器</b>效率,满足六级能效的<b class='flag-5'>几个</b>小秘诀 (附案例)

    电源适配器如何进行盐雾测试?

    1.电源适配器为什么要做盐雾测试?电源适配器在储存、运输和使用过程,经常受到周围环境有害因素的影响,电源适配器工作性能、使用可靠性和寿命会
    发表于 06-26 09:28

    透射适配器

    透射适配器 透射适配器(TMA)也叫透扫描适配器、光罩或是透扫描精灵,主要用于平板式
    发表于 12-29 11:26 612次阅读

    网络适配器,什么是网络适配器

    网络适配器,什么是网络适配器 网卡,又称网络适配器或网络接口卡(NIC),英文名为Network Interface Card。在网络,如果有一台计算
    发表于 04-03 14:11 1974次阅读

    USB充电用高效AC适配器USB充电用高效AC适配器

    USB充电用高效AC适配器USB充电用高效AC适配器
    发表于 09-15 14:29 23次下载
    USB充电用高效AC<b class='flag-5'>适配器</b>USB充电用高效AC<b class='flag-5'>适配器</b>

    光纤适配器是什么_光纤适配器的作用介绍

    本文开始介绍了什么是光纤适配器和光纤适配器的特点,其次分析了光纤适配器性能指标、分类以及常见的几种光纤连接器,最后阐述了光纤适配器的作用与应用范围。
    发表于 02-26 16:22 4.1w次阅读

    分享几个电源适配器的EMI整改过程

    分享几个电源适配器的EMI整改过程。
    发表于 05-30 10:59 14次下载

    杂乱的适配器

    杂乱的适配器
    发表于 11-07 08:07 1次下载
    杂乱的<b class='flag-5'>适配器</b>!

    热设计软件在电源适配器设计的应用有哪些?

    热设计软件在电源适配器设计的应用有哪些? 热设计软件在电源适配器设计的应用有很多,下面将详细介绍电源适配器设计
    的头像 发表于 11-23 15:34 830次阅读

    如何储存和运输电源适配器?如何选择具有节能功能的电源适配器

    如何储存和运输电源适配器?如何选择具有节能功能的电源适配器? 标题:电源适配器的储存与运输及选择节能功能的方法 引言: 电源适配器是我们日常生活
    的头像 发表于 11-24 14:08 1202次阅读

    移动电源适配器是什么 移动设备的电源适配器有何特点?

    。移动电源适配器通常配备一个或多个充电口,可以连接到移动设备的充电接口,从而为其提供电力。 移动设备的电源适配器具有以下几个主要特点: 1. 小巧轻便:移动电源适配器通常设计得非常小巧
    的头像 发表于 11-24 14:08 1247次阅读

    如何为多设备选择合适的电源适配器

    多设备选择合适的电源适配器。 首先,我们需要了解不同设备的功率需求。每个设备都有不同的功率需求,这是选择电源适配器关键因素。设备的功率要求通常在其说明书上或产品规格中有明确说明。功率通常以瓦特(W)或安培(
    的头像 发表于 11-24 14:15 1055次阅读

    什么是电源适配器的浪涌电流?浪涌电流对电源适配器有何影响?

    什么是电源适配器的浪涌电流?浪涌电流对电源适配器有何影响? 电源适配器的浪涌电流是指在电源启动或断开时,由于电源电压的突变引起的瞬态电流。这种瞬态电流瞬间达到峰值,然后逐渐衰减到稳定状态。 浪涌电流
    的头像 发表于 01-30 16:38 1633次阅读

    什么是蓝牙适配器?它有哪些性能特点?

    或其他接口与设备连接,然后通过蓝牙协议和其他设备进行数据传输和通信。 蓝牙适配器有以下几个性能特点: 1. 高度兼容性:蓝牙适配器可以兼容不同版本的蓝牙协议,从蓝牙1.0到最新的蓝牙5.0和蓝牙LE(低功耗)威廉希尔官方网站 。这意味着它可
    的头像 发表于 02-02 14:56 3048次阅读

    适配器的电流大于原适配器可以吗

    适配器的电流大于原适配器是否可行,这是一个涉及到电子设备电源适配器使用和安全性的问题。 一、适配器的基本原理 适配器,也称为电源
    的头像 发表于 08-02 09:38 1585次阅读