0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

清华权威报告公布,文心一言多项指标“遥遥领先”

百度 来源:百度 2024-04-23 09:22 次阅读

最近,由清华大学基础模型研究中心联合中关村实验室研制的SuperBench大模型综合能力评测框架,正式对外发布2024年3月版《SuperBench大模型综合能力评测报告》。评测共包含了14个海内外具有代表性的模型,结果显示:文心4.0表现亮眼,与国际一流模型水平接近,且差距已经逐渐缩小,名副其实为国内头部模型。

5e763e18-00bb-11ef-a297-92fbcf53809c.png5e8711d4-00bb-11ef-a297-92fbcf53809c.png

例如在人类对齐能力评测中,文心4.0表现优异,位居国内第一,其中在中文推理、中文语言等评测上,文心遥遥领先,和其他模型拉开明显差距,中文理解上,文心4.0领先优势明显,领先第二名GLM-4 0.41分,GPT-4系列模型表现较差,排在中下游,并且和第一名文心4.0分差超过1分。

在语义理解中的数学能力上,文心4.0与Claude-3并列全球第一;GPT-4系列模型位列第四五,其他模型得分在55分附近较为集中,明显落后第一梯队;而在语义理解中的阅读理解能力上,文心4.0超过GPT-4 Turbo、Claude-3以及GLM-4拿下榜首。

而在企业选择大模型最看重的安全性评测上,国内模型文心4.0表现亮眼,力压国际一流模型GPT-4系列模型和Claude-3拿下最高分(89.1分),Claude-3仅列第四。

5e9503a2-00bb-11ef-a297-92fbcf53809c.png

值得注意的是,文心一言不仅在威廉希尔官方网站 能力上过硬,在应用落地上也是一路领先。自去年3月16日文心一言首发至今,用户数已突破2亿,每天API调用量也突破了2亿。

审核编辑:刘清
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 百度
    +关注

    关注

    9

    文章

    2268

    浏览量

    90363
  • 文心一言
    +关注

    关注

    0

    文章

    124

    浏览量

    1275
  • 大模型
    +关注

    关注

    2

    文章

    2425

    浏览量

    2646

原文标题:文心一言多项指标“遥遥领先” 清华权威报告公布

文章出处:【微信号:baidu_2000,微信公众号:百度】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    一言登顶中国生成式AI使用率榜首

    人工智能产品的用户规模已达到2.3亿人,占整体人口的16.4%。这数据表明,生成式人工智能产品在网民中已经形成了相当规模的用户群体,并且未来仍有显著的增长空间。 在激烈的市场竞争中,百度
    的头像 发表于 12-04 14:03 331次阅读

    百度一言APP升级为

    百度宣布其文一言APP正式升级为,标志着百度在智能搜索领域迈出了重要步。
    的头像 发表于 09-04 16:06 487次阅读

    【附实操视频】聆思CSK6大模型开发板接入国内主流大模型(星火大模型、一言、豆包、kimi、智谱glm、通义千问)

    接入一言、通义千问、豆包、智谱glm、kimi等国内的大模型,但由于各家接口和数据格式不样,调试验证会浪费很多时间。因此本篇以聆思CSK6大模型开发板接入为例,分享具体的接入步骤
    发表于 08-22 10:12

    智能硬件接入主流大模型做语音交互(附文一言、豆包、kimi、智谱glm、通义千问示例)

    接入一言、通义千问、豆包、智谱glm、kimi等国内的大模型,这个是必须可以的。但由于各家接口和数据格式不样,有些朋友直接参考chatgpt的方式没有走通,因此本篇以聆思CSK6
    发表于 08-21 19:13

    新火种AI|李彦宏发声:一言4.0在国内可以取代ChatGPT!事实真的如此吗?

    一言 VS ChatGPT,谁更胜筹?
    的头像 发表于 04-19 10:14 758次阅读
    新火种AI|李彦宏发声:<b class='flag-5'>文</b><b class='flag-5'>心</b><b class='flag-5'>一言</b>4.0在国内可以取代ChatGPT!事实真的如此吗?

    百度一言用户破2亿,AI原生应用开发数量达19万

    此外,李彦宏还提到,百度在去年 8 月宣布开放一言后,不仅在C端借助大模型改造用户产品,将AI功能融入旗下多款产品;同时在B端,通过云业务推出企业级站式大模型平台——千帆大模型平
    的头像 发表于 04-16 15:05 607次阅读

    百度一言新增定制声音功能,数秒即可生成个人语音

    通过IT之家所述,用户只需启动一言App并点击底部“+”按钮,进入创建智能体界面;在声音设置处找到专为个人量身打造的“创建我的声音”功能。
    的头像 发表于 04-07 16:20 847次阅读

    极越01 OTA V1.4.0升级,融合一言等威廉希尔官方网站 ,实现人车家深度融合

    平指出,目前极越 01已成功整合百度地图、一言、Apollo以及小度等多项威廉希尔官方网站 。此外,百度 Apollo 自动驾驶视觉大模型 VTA
    的头像 发表于 03-26 11:20 687次阅读

    一言将在2024年贡献数十亿元的增量收入

    百度一言在2024年有望为百度带来数十亿元人民币的增量收入,这预测由百度创始人、董事长兼首席执行官李彦宏亲自公布。这
    的头像 发表于 03-04 11:32 1192次阅读

    百度起诉“一言”公司涉嫌商标侵权,不正当竞争纠纷即将开庭

    近日,北京百度网讯科技有限公司与家名为“一言(天津)智能科技有限公司”的公司之间的则不正当竞争纠纷案件引发了业界的广泛关注。据悉,该
    发表于 02-06 11:44 1649次阅读

    一言APP上线数字分身功能

    一言APP近日上线了项令人兴奋的新功能——数字分身。这功能允许用户轻松创建自己的个性化虚拟形象,为用户带来全新的互动体验。
    的头像 发表于 02-04 10:32 1180次阅读

    百度一言支持键生成专属数字分身

    百度一言APP正式上线了项令人瞩目的新功能:用户只需张照片、录制三句话,就能轻松拥有
    的头像 发表于 02-03 09:33 791次阅读

    百度一言用户规模突破1亿

    在近日,百度公布个令人振奋的消息:一言大模型的用户规模已经突破了1亿。
    的头像 发表于 01-02 16:10 653次阅读

    规模突破1亿!一言披露最新用户规模

    一言用户规模突破1亿。”12月28日,百度首席威廉希尔官方网站 官、深度学习威廉希尔官方网站 及应用国家工程研究中心主任王海峰在第十届WAVE SUMMIT深度学习开发者大会上宣布。会上,王海峰以《
    的头像 发表于 12-29 15:58 587次阅读

    一言用户规模破1亿 应用已突破4000款

    一言用户规模破1亿 应用已突破4000款 在第十届WAVE SUMMIT深度学习开发者大会上百度首席威廉希尔官方网站 官王海峰透露了组数据,自8月31日获准开放对公众提供服务以来,
    的头像 发表于 12-28 18:18 1065次阅读