Google DeepMind 和 Meta 的研究人员发表论文《Language Modeling Is Compression》,他们发现 DeepMind 的大语言模型 Chinchilla 70B 在图像和音频的无损压缩上超过了 PNG 和 FLAC。
论文提到,Chinchilla 70B 能将 ImageNet 图像数据库中的图像无损压缩到原始大小 43.4%,超过了 PNG 算法的 58.5%。
Chinchilla 能将 LibriSpeech 音频数据集中的样本无损压缩到原始大小 16.4%,超过 FLAC 算法的 30.3%。
据介绍,Chinchilla 70B 主要是训练用于处理文本,但它在压缩其它类型的数据集上的效果也表现优异,甚至优于专门的算法。
下面的例子比较了 gzip 和 Chinchilla 在示例文本上的压缩效果。可以看到,gzip 的输出没有可读性。
编辑:黄飞
-
无损压缩
+关注
关注
0文章
12浏览量
8442 -
FLAC
+关注
关注
0文章
4浏览量
8497 -
png
+关注
关注
0文章
14浏览量
4418 -
大模型
+关注
关注
2文章
2391浏览量
2604
原文标题:大模型在无损压缩方面超越PNG和FLAC
文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
【BearPi-Pico H3863星闪开发板体验连载】LZO压缩算法移植
音频信号的无损压缩编码是什么
【《大语言模型应用指南》阅读体验】+ 基础知识学习
【《大语言模型应用指南》阅读体验】+ 俯瞰全书
【大语言模型:原理与工程实践】大语言模型的应用
【大语言模型:原理与工程实践】大语言模型的评测
【大语言模型:原理与工程实践】大语言模型的基础威廉希尔官方网站
【RTC程序设计:实时音视频权威指南】音视频的编解码压缩威廉希尔官方网站
基于门控线性网络(GLN)的高压缩比无损医学图像压缩算法

全球最强大模型易主,GPT-4被超越
高性能无损数据解压缩FPGA IP,LZO无损数据解压缩IP

OpenAI视频模型Sora的架构及应用场景

高性能无损数据压缩FPGA IP,LZO无损数据压缩IP

评论