0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌发布ASPIRE训练框架,提升AI选择性预测能力

微云疏影 来源:综合整理 作者:综合整理 2024-01-23 11:19 次阅读

近期,谷歌公布新版ASPIRE训练架构,该架构主要用于改进大型语言模型的选择性预测情况。谷歌表示,尽管大语言模型在自然语言理解与生成领域发展迅速,应用广泛,然而在涉及到高风险决策时,其预测能力仍待加强。为此,谷歌推出ASPIRE训练框架,通过向模型引入“可信度”机制,提升预测准确率。

该框架分为三步骤:“特定任务调整”、“答案采样”以及“自我评估学习”。首先,“特定任务调整”阶段针对基本训练的大型语言模型进一步深化训练,重点提高预测能力。其次,“答案采样”阶段模型会根据调整的参数,生成多个答案,同时建立自我评估学习数据集,产生较高信度的选项。最后,“自我评估学习”阶段则设定参数以提升机模自我评估能力,使之能检测答案准确性,以便在回答问题时附加可信度评分。

据悉该架构取得显著成效。在CoQA、TriviaQA和SQuAD三个问答数据集测试中,经由ASPIRE调整的OPT-2.7B小模型表现全面优于更大规模的OPT-30B模型。此成果证实,经适配调整,小型语言模型亦有潜力超越大型语言模型。

研究人员总结指出,ASPIRE训练框架有效改善了大型语言模型的输出精度,使小型模型经微调后可以实现“恰当且自信”的预测。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6171

    浏览量

    105475
  • AI
    AI
    +关注

    关注

    87

    文章

    30996

    浏览量

    269297
  • 语言模型
    +关注

    关注

    0

    文章

    527

    浏览量

    10285
收藏 人收藏

    评论

    相关推荐

    选择性沉积威廉希尔官方网站 介绍

    选择性沉积威廉希尔官方网站 可以分为按需沉积与按需材料工艺两种形式。 随着芯片制造威廉希尔官方网站 的不断进步,制造更小、更快且能效更高的芯片具很大的挑战,尤其是全环绕栅极(Gate-All-Around, GAA)晶体管和更
    的头像 发表于 12-07 09:45 288次阅读
    <b class='flag-5'>选择性</b>沉积威廉希尔官方网站
介绍

    训练AI大模型需要什么样的gpu

    训练AI大模型需要选择具有强大计算能力、足够显存、高效带宽、良好散热和能效比以及良好兼容和扩展性的GPU。在
    的头像 发表于 12-03 10:10 136次阅读

    过电流保护的选择性是靠什么来实现的

    过电流保护的选择性是指在电力系统中,当发生短路或过载时,保护装置能够按照预定的顺序和时间,优先切断故障部分,而不影响其他正常运行的部分。选择性是电力系统保护设计的重要原则之一,它能够确保系统的稳定性
    的头像 发表于 09-26 14:38 609次阅读

    选择性唤醒如何实现局部联网

    电子发烧友网站提供《选择性唤醒如何实现局部联网.pdf》资料免费下载
    发表于 09-12 10:29 0次下载
    <b class='flag-5'>选择性</b>唤醒如何实现局部联网

    谷歌发布革命AI游戏引擎GameNGen

    谷歌近期震撼推出全球首款完全由人工智能驱动的游戏引擎——GameNGen,这一创新威廉希尔官方网站 标志着游戏开发领域的新纪元。GameNGen凭借其强大的计算能力,能够在单个TPU上实现每秒20帧的实时游戏生成,每一帧画面均源自精密的扩散模型预测
    的头像 发表于 08-29 18:07 893次阅读

    苹果AI模型训练新动向:携手谷歌,未选英伟达

    近日,苹果公司发布的最新研究报告揭示了其在人工智能领域的又一重要战略选择——采用谷歌设计的芯片来训练AI模型,而非行业巨头英伟达的产品。这
    的头像 发表于 08-01 18:11 930次阅读

    苹果承认使用谷歌芯片来训练AI

    苹果公司最近在一篇威廉希尔官方网站 论文中披露,其先进的人工智能系统Apple Intelligence背后的两个关键AI模型,是在谷歌设计的云端芯片上完成预训练的。这一消息标志着在尖端AI
    的头像 发表于 07-30 17:03 739次阅读

    谷歌发布革命AI天气预测模型NeuralGCM

    在科技与自然科学的交汇点上,谷歌公司于7月23日宣布了一项重大突破——全新的人工智能天气预测模型NeuralGCM。这一创新成果不仅融合了机器学习的前沿威廉希尔官方网站 ,还巧妙结合了传统气象学的精髓,其研究成果已在国际权威科学期刊《Nature》上
    的头像 发表于 07-23 14:24 507次阅读

    如何利用AI进行提升自我呢?

    利用AI进行学习是一个高效且富有创新的过程。以下是一些建议,帮助你充分利用AI进行学习: 选择适合的AI学习工具 : 深度学习
    的头像 发表于 07-19 10:46 561次阅读

    AI大模型与AI框架的关系

    在探讨AI大模型与AI框架的关系时,我们首先需要明确两者的基本概念及其在人工智能领域中的角色。AI大模型通常指的是具有极大规模、高度复杂
    的头像 发表于 07-15 11:42 1110次阅读

    谷歌借助Gemini AI系统深化对机器人的训练

    7月12日,国际科技界传来新动态,谷歌正借助其先进的Gemini AI系统,深化对旗下机器人的训练,旨在显著提升它们的导航能力和任务执行
    的头像 发表于 07-12 16:29 642次阅读

    交流二元继电器如何具有相位选择性和频率选择性

    在这篇文章中,我们将详细探讨交流二元继电器的相位选择性和频率选择性。我们将从继电器的基本原理开始,然后探讨这两种选择性的原理和实现方法。 1. 继电器的基本原理 继电器是一种电子开关,它可以根据输入
    的头像 发表于 06-29 09:42 872次阅读

    谷歌模型框架是什么软件?谷歌模型框架怎么用?

    谷歌模型框架通常指的是谷歌开发的用于机器学习和人工智能的软件框架,其中最著名的是TensorFlow。TensorFlow是一个开源的机器学习框架
    的头像 发表于 03-01 16:25 898次阅读

    谷歌模型训练软件有哪些功能和作用

    谷歌模型训练软件主要是指ELECTRA,这是一种新的预训练方法,源自谷歌AI。ELECTRA不仅拥有BERT的优势,而且在效率上更胜一筹。
    的头像 发表于 02-29 17:37 799次阅读

    蚂蚁集团AI研发部门开源AI Infra威廉希尔官方网站 ,助力大模型训练效率提升

    蚂蚁集团AI创新研发部门NextEvo近日宣布,他们将全面开源AI Infra威廉希尔官方网站 ,以推动AI研发效率的提升。该威廉希尔官方网站 框架名为DLRover,
    的头像 发表于 02-04 10:01 1093次阅读