这篇究极讽刺的文章一出，NLP无了-电子发烧友网

在测试集上预训练？这听起来似乎有点不合常规，但别急，继续往下看！

文章以一项大胆的实验为开端，作者创造了一个高质量的数据集，然而，这个数据集并非来自于人为合成，而是源自huggingface上的众多评估基准数据。

借助这一数据集完成了一个基于 Transformer 的语言模型的预训练，这个模型被命名为 phi-CTNL（发音为“fic tional”）。

令人惊讶的是，phi-CTNL 在各类学术基准测试中表现得相当完美，胜过了所有已知的模型。

该研究还发现，phi-CTNL 在预训练计算方面超越了神秘的幂律扩展法则。随着训练轮次的增加，它的性能快速趋近于零。

此外，phi-CTNL 似乎具备某种超自然的理解能力。在学习过程中，它能够快速而准确地预测下游评估的指标。

是的，这篇文章可不是在搞笑，而是要讽刺那些以前不知道眼前有坑的学术研究。

作者认为，尽管评估和基准测试对于语言模型的发展至关重要，但这个领域经常受到夸夸其谈的宣传，却忽视了数据污染的潜在风险。

作者甚至含蓄地点名了一些模型，例如 phi-1、TinyStories 和 phi-1.5。告诫我们，不要相信任何一个没有隔离数据污染的LLM模型。

这些模型做错了什么呢？

一个在推上测试Phi-1.5的例子引发了众多讨论。例如，如果你截断下图这个问题并输入给Phi-1.5，它会自动完成为计算第三个月的下载数量，并且回答是正确的。

稍微改变一下数字，它也会正确回答。

但是一旦你变换格式，它就会完全出错。（这里的格式变化是保留了提示中的所有 ' '。）

另一个例子是一个关于苹果的数学计算问题，phi模型最初可以正确回答问题。

然而，一旦我们改变其中的一个数字，例如从8.5改成7.5，模型会开始出现幻觉现象。

为了检查2这个数字有没有被记忆，我们可以把pizza的价格改成10.5.但是phd依然继续输出2（应该为1）。

基于这些发现，研究人员认为Phi-1.5模型的数据污染问题很严重。

通过以不合常规的方式预训练模型，这篇文章提醒我们强调了数据污染的危险性。告诫我们，不要相信任何一个没有隔离数据污染的LLM模型。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

模型

模型

+关注

关注
1

文章
3241

浏览量
48834
数据集

数据集

+关注

关注
4

文章
1208

浏览量
24699
nlp

nlp

+关注

关注
1

文章
488

浏览量
22034

原文标题：这篇究极讽刺的文章一出，NLP无了

文章出处：【微信号：zenRRan，微信公众号：深度学习自然语言处理】欢迎添加关注！文章转载请注明出处。

“黑科技”一出谁与争锋盘点15个颠覆想象的机器人

来自RoboBusiness2016展的这15个竞赛项目代表了机器人产业创新的最新趋势和想法，对创业公司、对人工智能未来发展方向都极具参考意义。黑科技一出谁与争锋盘点15个颠覆想象的机器人 RoboBusiness2016展会最近在圣何塞会议中心举行，在展会上还举办了

发表于 11-09 11:25 •490次阅读

基于卷积神经网络的组合模型处理NLP任务讽刺检测

数据为均衡和失衡的讽刺推文数据集，取自Ptacek等2014年的工作和The Sarcasm Detector。移除了用户名、URL、#标记，使用了NLTK Twitter Tokenizer。

发表于 07-02 08:37 •6218次阅读

基于卷积神经网络的组合模型处理<b class='flag-5'>NLP</b>任务<b class='flag-5'>讽刺</b>检测

HDMI2.0 二进一出KVM转换器电路设计资料AG7231参考电路

`AG7231主要是用在HDMI2.0 二进一出KVM转换器或者HDMI2.0 二切一KVM切换器方案设计当中。AG7231设计结构框图如下AG7231详细的参考电路如附件中所示`

发表于 06-29 17:09

智能音响的究极形态：音响行业再添悍将大屏与安卓系统深度结合

酷狗智能音响在智能方面做得还是非常到位的。不管是超大的显示屏，还是深度定制的系统，都完全符合我心中对智能音响的定义。或许，大屏+安卓系统就是智能音响的究极形态。

发表于 07-25 16:21 •1344次阅读

NLP的介绍和如何利用机器学习进行NLP以及三种NLP威廉希尔官方网站的详细介绍

本文用简洁易懂的语言，讲述了自然语言处理（NLP）的前世今生。从什么是NLP到为什么要学习NLP，再到如何利用机器学习进行NLP，值得

发表于 06-10 10:26 •7.7w次阅读

<b class='flag-5'>NLP</b>的介绍和如何利用机器学习进行<b class='flag-5'>NLP</b>以及三种<b class='flag-5'>NLP</b>威廉希尔官方网站
的详细介绍

智能制造是中国制造业的唯一出路

李书福出身制造业，坚守制造业，对制造业充满感情。他认为，中国制造已经到了十分重要的关键转型时刻，智能制造是唯一出路和美好未来。他呼吁，万众一心，尽快形成中国汽车工业的核心竞争力，推动中国制造从全球价值链中低端迈向中高端。

发表于 10-17 08:35 •3567次阅读

NLP-Progress库NLP的最新数据集、论文和代码

方向是自然语言处理的同学们有福啦，为了跟踪自然语言处理(NLP)的进展，有大量仁人志士在 Github 上维护了一个名为 NLP-Progress 的库。它记录了几乎所有

发表于 11-17 09:21 •2558次阅读

NLP 2019 Highlights 给NLP从业者的一个参考

自然语言处理专家elvis在medium博客上发表了关于NLP在2019年的亮点总结。对于自然语言处理（NLP）领域而言，2019年是令人印象深刻的一年。在这篇博客文章中，我想重点介绍

发表于 09-25 16:56 •1728次阅读

针对社交媒体的评论讽刺检测模型

讽刺是日常交际中一种常见的语用现象，能够丰富说话者的观点并间接地表达说话者的深层含义。讽刺检测任务的研究目标是挖掘目标语句的讽刺倾向。针对讽刺

发表于 03-12 11:49 •5次下载

【威廉希尔官方网站分享】屏闪闹的是哪一出？

在各种应用场景中屏闪的出现并不稀奇，电子工程师时不时能见到屏闪那一幕，那屏闪究竟是闹的哪一出呢，出现屏闪该如何解决？案例一客户在电源模块应用过程中曾经出现过这样的应用场景，如下图1所示

发表于 08-14 11:45 •543次阅读

一进一出正负双向信号隔离变送器

捷晟达科技的DIN35 1x1 MI一进一出高精度模拟量正负双向信号隔离变送器,是将输入与输出之间电气绝缘的模拟信号进行变换、放大、隔离的信号调理变换器小型设备,该设备接收现场仪表的各种模拟量信号

发表于 09-16 01:20 •0次下载

一进一出高电压大电流信号隔离变送器

捷晟达科技(JSD科技)的JSD TAH-1001系列一进一出高电压(大电流)信号隔离变送器,该产品最高测量电压高达3000VDC及30ADC,产品是将输入与输出之间电气绝缘的模拟信号进行变换、放大

发表于 09-16 02:34 •0次下载

BL150A11直流型一入一出隔离器说明书

电子发烧友网站提供《BL150A11直流型一入一出隔离器说明书.pdf》资料免费下载

发表于 03-08 15:00 •0次下载

搜索历史

这篇究极讽刺的文章一出，NLP无了

评论

“黑科技”一出谁与争锋盘点15个颠覆想象的机器人

基于卷积神经网络的组合模型处理NLP任务讽刺检测

NLP的面试题目

NLP的tfidf作词向量

HDMI2.0 二进一出KVM转换器电路设计资料AG7231参考电路

智能音响的究极形态：音响行业再添悍将大屏与安卓系统深度结合

NLP的介绍和如何利用机器学习进行NLP以及三种NLP威廉希尔官方网站的详细介绍

智能制造是中国制造业的唯一出路

NLP-Progress库NLP的最新数据集、论文和代码

NLP 2019 Highlights 给NLP从业者的一个参考

针对社交媒体的评论讽刺检测模型

【威廉希尔官方网站分享】屏闪闹的是哪一出？

一进一出正负双向信号隔离变送器

一进一出高电压大电流信号隔离变送器

BL150A11直流型一入一出隔离器说明书