电子发烧友网报道(文/李弯弯)3月16日下午,百度在北京总部举行新闻发布会,正式发布新一代大语言模型、生成式 AI 产品文心一言。百度创始人、董事长兼首席执行官李彦宏,百度首席威廉希尔官方网站
官王海峰出席,并展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。
文心一言在五大使用场景中的能力展示
在文学创作方面,李彦宏以《三体》为例,针对“《三体》的作者是哪里人?电视剧《三体》演员都有谁?于和伟和张鲁一有哪些共同点?于和伟和张鲁一谁更高?”等事实性问题,文心一言都给出了准确的回答。
针对“可以总结一下《三体》的核心内容吗?如果要续写的话,可以从哪些角度出发?如何从哲学的角度续写?”等问题,文心一言也从多个角度给出了建议,体现出强大的总结分析能力和推理能力。
在商业文案创作方面,文心一言顺利完成了给公司起名字、写Slogan、写新闻稿的任务。可以看到文心一言可以准确理解人类意图,能够清晰地表达。这是基于庞大数据规模的训练,文心一言大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等。
在数理逻辑推算方面,文心一言体现出了很强的推理能力。比如,面对“鸡兔同笼”的问题,文心一眼就能够很快识别出问题不对。当修改问题之后,文心一言能够很快理解题意,给出解题思路,设立方程式,一步步得出正确答案。
在中文理解方面,文心一言表现出了对中国文化的强大理解力。比如,正确解释“洛阳纸贵”的含义,以及“洛阳纸贵”在现代经济学原理里对应的理论。文心一言还用“洛阳纸贵”创作了一首藏头诗,“洛阳城里春光好,阳艳无双不负赏。纸贵漫天诗词赋,贵比黄金乐未央。”
在多模态生成方面,文心一言展示出了文本、图片、音频和视频的生成能力。在音频生成方面,文心一言可以生成多个地方的方言,比如广东话、闽南语,在发布会现场演示的是四川话。视频生成能力方面,因为成本较高,现阶段还未对所有用户开放,未来会逐步接入。
李彦宏表示,多模态是生成式AI一个明确的发展趋势。未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力会不断提升。
从上述演示来看,文心一言某种程度已经具备了对人类意图的理解能力,能够较为准确的、有逻辑的、流畅的表达。不过李彦宏表示,这类大语言模型还在不断完善的过程中,它有时会带来惊喜,有时也会出错,不过它的发展非常迅速。
大型语言模型带来的产业机会
无论是哪家公司都不可能靠几个月突击,就做出这样一个大型语言模型,深度学习、自然语言处理等都需要多年的坚持和积累。可以说,文心一言是百度过去多年努力的延续。
人工智能时代,IT威廉希尔官方网站 栈发生了根本性改变,从原来的三层变成了现在的四层,包括芯片层、框架层、模型层、应用层。百度是全球范围内为数不多在四层都有领先产品的公司。
百度AI全栈布局的优势在于,可以在威廉希尔官方网站 栈的四层架构中实现端到端优化,大幅提升效率。相比于之前判别式AI,生成式AI非常消耗算力,费用相当昂贵,四层之间的协同作用很关键,尤其是框架层和模型层的协同,能够大大提升效率。
百度自2月宣布文心一言以来,已有超过650家企业宣布加入文心一言生态。生成式AI代表了一个新的计算范式,它会带来市场需求的爆发式增长,将释放出前所未有的、指数级的商业价值。文心一言不仅影响搜索、互联网公司,它可以让每一家公司都离自己的客户更近。
大型语言模型会带来哪些产业机会?李彦宏谈到了三点:一是新型云计算,文心一言将根本性地改变云计算行业的游戏规则,之前企业选择云厂商更多看算力、存储等基础云服务。未来,更多会看框架、模型,以及芯片、框架、模型和应用四层之间的协同。
二是行业模型精调,这是这是通用大模型和行业企业之间的中间层,他们可以基于对行业的洞察,调用通用大模型能力,为行业客户提供解决方案。这方面,百度文心大模型已经在工业、金融、交通、媒体等领域,发布了10多个行业大模型。
三是应用开发,即基于大模型底座进行应用开发的公司,对于大部分创业企业来说,真正的机会并不是从头开始做ChatGPT和文心一言这样的基础大模型,而是基于通用大语言模型抢先开发重要的应用服务。目前基于文本、图片、音视频生成、数字人、3D生成等场景,已经涌现出很多创业明星公司。
从威廉希尔官方网站 层面来看,文心一言是新一代知识增强大语言模型,具备对话交互、内容创作、知识推理、多模态生成等能力。
据王海峰介绍,它的关键威廉希尔官方网站 包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是这类大语言模型都会采用的威廉希尔官方网站 ,ERNIE和PLATO中已经有应用和积累,在文心一言中又有了进一步强化和打磨;后三项则是百度已有威廉希尔官方网站 优势的再创新,也是文心一言未来越来越强大的基础。
在知识增强方面,文心一言主要是通过知识内化和知识外用两种方式。知识内化,是从大规模知识和无标注数据中,基于语义单元学习,利用知识构造训练数据,将知识学习到模型参数中;知识外用,是引入外部多源异构知识,做知识推理、提示构建等。
在检索增强方面,文心一言是来自以语义理解与语义匹配为核心威廉希尔官方网站 的新一代搜索架构。通过引入搜索结果,可以为大模型提供时效性强、准确率高的参考信息,更好地满足用户需求。
在对话增强方面,基于对话威廉希尔官方网站 和应用积累,文心一言具备记忆机制、上下文理解和对话规划能力,实现更好的对话连贯性、合理性和逻辑性。
飞桨深度学习平台支撑文心一言效果更好、效率更高、性能更强。王海峰强调,对于开发训练,飞桨动静统一的开发范式,以及自适应分布式架构,可以实现大模型的灵活开发和高效训练。在推理部署方面,飞桨提供高并发弹性服务化部署,深度计算融合优化,软硬协同稀疏量化加速、模型自适应蒸馏剪裁等,支持大模型高效推理。
小结
文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五大使用场景中展示出了比较强的理解能力和推理能力。
不过整体而言,文心一言目前来说还并不完善,未来随着用户的接入使用,及百度在威廉希尔官方网站 上的不断调优,文心一言将会不断迭代,并展现出更强大的能力。在李彦宏看来,人工智能会彻底改变今天的每一个行业,文心一言是创新驱动发展的最佳证明。
文心一言在五大使用场景中的能力展示
在文学创作方面,李彦宏以《三体》为例,针对“《三体》的作者是哪里人?电视剧《三体》演员都有谁?于和伟和张鲁一有哪些共同点?于和伟和张鲁一谁更高?”等事实性问题,文心一言都给出了准确的回答。
针对“可以总结一下《三体》的核心内容吗?如果要续写的话,可以从哪些角度出发?如何从哲学的角度续写?”等问题,文心一言也从多个角度给出了建议,体现出强大的总结分析能力和推理能力。
在商业文案创作方面,文心一言顺利完成了给公司起名字、写Slogan、写新闻稿的任务。可以看到文心一言可以准确理解人类意图,能够清晰地表达。这是基于庞大数据规模的训练,文心一言大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等。
在数理逻辑推算方面,文心一言体现出了很强的推理能力。比如,面对“鸡兔同笼”的问题,文心一眼就能够很快识别出问题不对。当修改问题之后,文心一言能够很快理解题意,给出解题思路,设立方程式,一步步得出正确答案。
在中文理解方面,文心一言表现出了对中国文化的强大理解力。比如,正确解释“洛阳纸贵”的含义,以及“洛阳纸贵”在现代经济学原理里对应的理论。文心一言还用“洛阳纸贵”创作了一首藏头诗,“洛阳城里春光好,阳艳无双不负赏。纸贵漫天诗词赋,贵比黄金乐未央。”
在多模态生成方面,文心一言展示出了文本、图片、音频和视频的生成能力。在音频生成方面,文心一言可以生成多个地方的方言,比如广东话、闽南语,在发布会现场演示的是四川话。视频生成能力方面,因为成本较高,现阶段还未对所有用户开放,未来会逐步接入。
李彦宏表示,多模态是生成式AI一个明确的发展趋势。未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力会不断提升。
从上述演示来看,文心一言某种程度已经具备了对人类意图的理解能力,能够较为准确的、有逻辑的、流畅的表达。不过李彦宏表示,这类大语言模型还在不断完善的过程中,它有时会带来惊喜,有时也会出错,不过它的发展非常迅速。
大型语言模型带来的产业机会
无论是哪家公司都不可能靠几个月突击,就做出这样一个大型语言模型,深度学习、自然语言处理等都需要多年的坚持和积累。可以说,文心一言是百度过去多年努力的延续。
人工智能时代,IT威廉希尔官方网站 栈发生了根本性改变,从原来的三层变成了现在的四层,包括芯片层、框架层、模型层、应用层。百度是全球范围内为数不多在四层都有领先产品的公司。
百度AI全栈布局的优势在于,可以在威廉希尔官方网站 栈的四层架构中实现端到端优化,大幅提升效率。相比于之前判别式AI,生成式AI非常消耗算力,费用相当昂贵,四层之间的协同作用很关键,尤其是框架层和模型层的协同,能够大大提升效率。
百度自2月宣布文心一言以来,已有超过650家企业宣布加入文心一言生态。生成式AI代表了一个新的计算范式,它会带来市场需求的爆发式增长,将释放出前所未有的、指数级的商业价值。文心一言不仅影响搜索、互联网公司,它可以让每一家公司都离自己的客户更近。
大型语言模型会带来哪些产业机会?李彦宏谈到了三点:一是新型云计算,文心一言将根本性地改变云计算行业的游戏规则,之前企业选择云厂商更多看算力、存储等基础云服务。未来,更多会看框架、模型,以及芯片、框架、模型和应用四层之间的协同。
二是行业模型精调,这是这是通用大模型和行业企业之间的中间层,他们可以基于对行业的洞察,调用通用大模型能力,为行业客户提供解决方案。这方面,百度文心大模型已经在工业、金融、交通、媒体等领域,发布了10多个行业大模型。
三是应用开发,即基于大模型底座进行应用开发的公司,对于大部分创业企业来说,真正的机会并不是从头开始做ChatGPT和文心一言这样的基础大模型,而是基于通用大语言模型抢先开发重要的应用服务。目前基于文本、图片、音视频生成、数字人、3D生成等场景,已经涌现出很多创业明星公司。
从威廉希尔官方网站 层面来看,文心一言是新一代知识增强大语言模型,具备对话交互、内容创作、知识推理、多模态生成等能力。
据王海峰介绍,它的关键威廉希尔官方网站 包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是这类大语言模型都会采用的威廉希尔官方网站 ,ERNIE和PLATO中已经有应用和积累,在文心一言中又有了进一步强化和打磨;后三项则是百度已有威廉希尔官方网站 优势的再创新,也是文心一言未来越来越强大的基础。
在知识增强方面,文心一言主要是通过知识内化和知识外用两种方式。知识内化,是从大规模知识和无标注数据中,基于语义单元学习,利用知识构造训练数据,将知识学习到模型参数中;知识外用,是引入外部多源异构知识,做知识推理、提示构建等。
在检索增强方面,文心一言是来自以语义理解与语义匹配为核心威廉希尔官方网站 的新一代搜索架构。通过引入搜索结果,可以为大模型提供时效性强、准确率高的参考信息,更好地满足用户需求。
在对话增强方面,基于对话威廉希尔官方网站 和应用积累,文心一言具备记忆机制、上下文理解和对话规划能力,实现更好的对话连贯性、合理性和逻辑性。
飞桨深度学习平台支撑文心一言效果更好、效率更高、性能更强。王海峰强调,对于开发训练,飞桨动静统一的开发范式,以及自适应分布式架构,可以实现大模型的灵活开发和高效训练。在推理部署方面,飞桨提供高并发弹性服务化部署,深度计算融合优化,软硬协同稀疏量化加速、模型自适应蒸馏剪裁等,支持大模型高效推理。
小结
文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五大使用场景中展示出了比较强的理解能力和推理能力。
不过整体而言,文心一言目前来说还并不完善,未来随着用户的接入使用,及百度在威廉希尔官方网站 上的不断调优,文心一言将会不断迭代,并展现出更强大的能力。在李彦宏看来,人工智能会彻底改变今天的每一个行业,文心一言是创新驱动发展的最佳证明。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
文心一言
+关注
关注
0文章
124浏览量
1275 -
大模型
+关注
关注
2文章
2427浏览量
2647
发布评论请先 登录
相关推荐
百度文心大模型4.0 Turbo,正式发布 用户规模已达3亿
的最新数据,并正式发布文心大模型4.0 Turbo、飞桨框架3.0等最新威廉希尔官方网站
,披露飞桨文心生态最
李彦宏高度评价百度文心一言模型及AI威廉希尔官方网站 ,强调商业化将持续推进
据了解,目前已有近10万家企业使用了文心一言的能力,其中10%的大搜流量由该模型产生,每日有250万用户受益于文库的AI功能。未来,百度计划
百度起诉“文心一言”公司涉嫌商标侵权,不正当竞争纠纷即将开庭
公告中指责对方涉嫌商标侵权,引发了一场涉及人工智能领域的法律大战。 据了解,百度公司推出的“文心一言”是
发表于 02-06 11:44
•1649次阅读
评论