0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

这篇究极讽刺的文章一出,NLP无了

深度学习自然语言处理 来源:深度学习自然语言处理 2023-09-25 17:08 次阅读

在测试集上预训练?这听起来似乎有点不合常规,但别急,继续往下看!

文章以一项大胆的实验为开端,作者创造了一个高质量的数据集,然而,这个数据集并非来自于人为合成,而是源自huggingface上的众多评估基准数据。

借助这一数据集完成了一个基于 Transformer 的语言模型的预训练,这个模型被命名为 phi-CTNL(发音为“fictional”)。

令人惊讶的是,phi-CTNL 在各类学术基准测试中表现得相当完美,胜过了所有已知的模型。

该研究还发现,phi-CTNL 在预训练计算方面超越了神秘的幂律扩展法则。随着训练轮次的增加,它的性能快速趋近于零。

e5acc378-5b81-11ee-939d-92fbcf53809c.png

此外,phi-CTNL 似乎具备某种超自然的理解能力。在学习过程中,它能够快速而准确地预测下游评估的指标。

e5c67ffc-5b81-11ee-939d-92fbcf53809c.png

是的,这篇文章可不是在搞笑,而是要讽刺那些以前不知道眼前有坑的学术研究。

作者认为,尽管评估和基准测试对于语言模型的发展至关重要,但这个领域经常受到夸夸其谈的宣传,却忽视了数据污染的潜在风险。

作者甚至含蓄地点名了一些模型,例如 phi-1、TinyStories 和 phi-1.5。告诫我们,不要相信任何一个没有隔离数据污染的LLM模型。

这些模型做错了什么呢?

一个在推上测试Phi-1.5的例子引发了众多讨论。例如,如果你截断下图这个问题并输入给Phi-1.5,它会自动完成为计算第三个月的下载数量,并且回答是正确的。

e5d9fffa-5b81-11ee-939d-92fbcf53809c.png

稍微改变一下数字,它也会正确回答。

e5ef3906-5b81-11ee-939d-92fbcf53809c.png

但是一旦你变换格式,它就会完全出错。(这里的格式变化是保留了提示中的所有 ' '。)

e60936b2-5b81-11ee-939d-92fbcf53809c.jpg

另一个例子是一个关于苹果的数学计算问题,phi模型最初可以正确回答问题。

e62942fe-5b81-11ee-939d-92fbcf53809c.jpg

然而,一旦我们改变其中的一个数字,例如从8.5改成7.5,模型会开始出现幻觉现象。

e63ba0ac-5b81-11ee-939d-92fbcf53809c.jpg

为了检查2这个数字有没有被记忆,我们可以把pizza的价格改成10.5.但是phd依然继续输出2(应该为1)。

e65ad116-5b81-11ee-939d-92fbcf53809c.jpg

基于这些发现,研究人员认为Phi-1.5模型的数据污染问题很严重。

通过以不合常规的方式预训练模型,这篇文章提醒我们强调了数据污染的危险性。告诫我们,不要相信任何一个没有隔离数据污染的LLM模型。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3241

    浏览量

    48834
  • 数据集
    +关注

    关注

    4

    文章

    1208

    浏览量

    24699
  • nlp
    nlp
    +关注

    关注

    1

    文章

    488

    浏览量

    22034

原文标题:这篇究极讽刺的文章一出,NLP无了

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    “黑科技”一出谁与争锋 盘点15个颠覆想象的机器人

    来自RoboBusiness2016展的这15个竞赛项目代表机器人产业创新的最新趋势和想法,对创业公司、对人工智能未来发展方向都极具参考意义。 黑科技一出谁与争锋 盘点15个颠覆想象的机器人 RoboBusiness2016展会最近在圣何塞会议中心举行,在展会上还举办了
    发表于 11-09 11:25 490次阅读

    基于卷积神经网络的组合模型处理NLP任务讽刺检测

    数据为均衡和失衡的讽刺推文数据集,取自Ptacek等2014年的工作和The Sarcasm Detector。移除了用户名、URL、#标记,使用了NLTK Twitter Tokenizer。
    的头像 发表于 07-02 08:37 6218次阅读
    基于卷积神经网络的组合模型处理<b class='flag-5'>NLP</b>任务<b class='flag-5'>讽刺</b>检测

    NLP的面试题目

    NLP面试题目6-10
    发表于 05-21 15:02

    NLP的tfidf作词向量

    NLP之tfidf作词向量
    发表于 06-01 17:28

    HDMI2.0 二进一出KVM转换器电路设计资料AG7231参考电路

    `AG7231主要是用在HDMI2.0 二进一出KVM转换器或者HDMI2.0 二切KVM切换器方案设计当中。AG7231设计结构框图如下AG7231详细的参考电路如附件中所示`
    发表于 06-29 17:09

    智能音响的形态:音响行业再添悍将 大屏与安卓系统深度结合

    酷狗智能音响在智能方面做得还是非常到位的。不管是超大的显示屏,还是深度定制的系统,都完全符合我心中对智能音响的定义。或许,大屏+安卓系统就是智能音响的形态。
    发表于 07-25 16:21 1344次阅读

    NLP的介绍和如何利用机器学习进行NLP以及三种NLP威廉希尔官方网站 的详细介绍

    本文用简洁易懂的语言,讲述自然语言处理(NLP)的前世今生。从什么是NLP到为什么要学习NLP,再到如何利用机器学习进行NLP,值得
    的头像 发表于 06-10 10:26 7.7w次阅读
    <b class='flag-5'>NLP</b>的介绍和如何利用机器学习进行<b class='flag-5'>NLP</b>以及三种<b class='flag-5'>NLP</b>威廉希尔官方网站
的详细介绍

    智能制造是中国制造业的唯一出

    李书福出身制造业,坚守制造业,对制造业充满感情。 他认为,中国制造已经到了十分重要的关键转型时刻,智能制造是唯一出路和美好未来。 他呼吁,万众心,尽快形成中国汽车工业的核心竞争力,推动中国制造从全球价值链中低端迈向中高端。
    发表于 10-17 08:35 3567次阅读

    NLP-Progress库NLP的最新数据集、论文和代码

    方向是自然语言处理的同学们有福啦,为了跟踪自然语言处理(NLP)的进展,有大量仁人志士在 Github 上维护个名为 NLP-Progress 的库。它记录了几乎所有
    的头像 发表于 11-17 09:21 2558次阅读

    NLP 2019 Highlights 给NLP从业者的个参考

    自然语言处理专家elvis在medium博客上发表关于NLP在2019年的亮点总结。对于自然语言处理(NLP)领域而言,2019年是令人印象深刻的年。在这篇博客文章中,我想重点介绍
    的头像 发表于 09-25 16:56 1728次阅读

    针对社交媒体的评论讽刺检测模型

    讽刺是日常交际中种常见的语用现象,能够丰富说话者的观点并间接地表达说话者的深层含义。讽刺检测任务的研究目标是挖掘目标语句的讽刺倾向。针对讽刺
    发表于 03-12 11:49 5次下载
    针对社交媒体的评论<b class='flag-5'>讽刺</b>检测模型

    【威廉希尔官方网站 分享】屏闪闹的是哪一出

    在各种应用场景中屏闪的出现并不稀奇,电子工程师时不时能见到屏闪那幕,那屏闪究竟是闹的哪一出呢,出现屏闪该如何解决?    案例 客户在电源模块应用过程中曾经出现过这样的应用场景,如下图1所示
    的头像 发表于 08-14 11:45 543次阅读
    【威廉希尔官方网站
分享】屏闪闹的是哪<b class='flag-5'>一出</b>?

    一进一出正负双向信号隔离变送器

    捷晟达科技的DIN35 1x1 MI一进一出高精度模拟量正负双向信号隔离变送器,是将输入与输出之间电气绝缘的模拟信号进行变换、放大、隔离的信号调理变换器小型设备,该设备接收现场仪表的各种模拟量信号
    发表于 09-16 01:20 0次下载

    一进一出高电压大电流信号隔离变送器

    捷晟达科技(JSD科技)的JSD TAH-1001系列一进一出高电压(大电流)信号隔离变送器,该产品最高测量电压高达3000VDC及30ADC,产品是将输入与输出之间电气绝缘的模拟信号进行变换、放大
    发表于 09-16 02:34 0次下载

    BL150A11直流型一出隔离器说明书

    电子发烧友网站提供《BL150A11直流型一出隔离器说明书.pdf》资料免费下载
    发表于 03-08 15:00 0次下载