0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

开源大模型在多个业务场景的应用案例

开放原子 来源:开放原子 2024-12-30 10:16 次阅读

人工智能发展浪潮中,大模型的开源与闭源之争一直是业内的热点话题。随着威廉希尔官方网站 的不断进步和应用场景的日益丰富,如何降低大模型的使用门槛,让更多人能够便捷地应用于实际业务场景,成为了推动行业发展的关键所在。而开源大模型,无疑是这一进程中具有里程碑意义的重要一步。

近日,2024开放原子开发者大会暨首届开源威廉希尔官方网站 学术大会——开源大模型落地实践分论坛上,武汉人工智能研究院院长、中国科学院自动化研究所副总工程师王金桥,武汉大学教授叶茫,腾讯机器学习平台专家、混元大模型预训练负责人孙兴武,北京智源人工智能研究院数据研究组负责人刘广,小米AI威廉希尔官方网站 专家张俊博,阿里云智能集团威廉希尔官方网站 专家马腾,中国科学院自动化研究所副研究员、武汉人工智能研究院算法架构师易东,Monkey大模型一作、华中科技大学硕士生杨彪等多位深耕开源大模型的威廉希尔官方网站 专家,深入探讨了开源大模型的前沿威廉希尔官方网站 进展、应用创新及行业落地实践。本论坛由开放原子开源基金会、中国通信学会主办,CSDN、武汉人工智能研究院协办。

王金桥在致辞中强调了开源对大模型生态发展的推动作用,以及它在降低威廉希尔官方网站 门槛、促进威廉希尔官方网站 创新方面的价值。他提到,尽管开源大型模型已取得显著成就,但还需面对数据质量、隐私保护、模型解释性以及安全可靠性等挑战。他期望通过不懈努力,进一步促进开源社区的繁荣发展,推动威廉希尔官方网站 共享的进程。

在主题内容分享环节,叶茫分享了团队在多模态大模型微调、持续学习和轻量化等方面的研究,特别是跨模态目标检索系统的开发,以及无人机场景下的工业检索和夜间场景下可见光与红外图像的跨模态匹配等工作。

孙兴武介绍了腾讯混元大模型在威廉希尔官方网站 和应用上的最新成果,包括自研星脉高性能计算网络及其Angel训练框架,以及广告推荐、代码生成、AI客服等多个业务场景的应用案例。

刘广聚焦于高质量数据集的构建及其对模型性能的重要性,介绍了BGE向量模型及Aquila语言模型,并强调了中文互联网最大规模的数据集CCL3.0的价值。他指出,通过定义高质量数据的标准并结合小模型验证效果的方法,可以有效提高模型的表现力。

张俊博介绍了XIAOMI DASHENG声音预训练模型。该模型具有优秀的场景区分能力和环境音识别能力,只需简单几行代码就能达到SOTA级别的性能,不仅适用于音频表征任务,还可以作为多模态大模型的一部分,提供稳定的音频编码服务。

马腾分享的Mooncake项目,是一个用于优化大模型推理服务的开源项目。采用P/D分离架构和KVCache缓存池提升吞吐量,减少算力开销,支持多种通讯协议和存储方式,适配多种推理框架,增强了分布式部署能力。

易东讲解了“紫东太初”多模态大模型的研发历程和发展方向,展示了在医疗、教育、政务等多个领域的应用实例,并公布了FAST SAM、FLAP等多个开源项目,这些项目进一步丰富了多模态大模型的应用生态。

最后,杨彪介绍了Monkey多模态大模型及其在文档智能中的应用,通过切块处理提高图片分辨率和更详细的标注数据进行微调,提出了TEXTMonkey,针对文档领域进行优化,实现了更高的精度和更好的可解释性。

如今,各行各业都已进入智能化升级关键阶段,开源大模型的创新已无处不在。通过服装模特AI生成威廉希尔官方网站 ,企业可以降低拍摄海报的人力成本;通过跨领域合作,实现了文本指令区域编辑和动图生成,为智能电视提供了更丰富的用户体验;通过多模态情感语义理解基础模型,不仅有助于提升情感意图识别的准确性,还为精神疾病诊断提供了新的思路,类似的案例不胜枚举。

总体而言,在开源生态中,大模型在众多应用场景中均展现出良好的性能表现。众多企业不仅在大模型的微调、持续学习和轻量化等领域进行了深入研究,而且正积极推动这些威廉希尔官方网站 在具体业务场景中的广泛应用和落地实施。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1791

    文章

    47336

    浏览量

    238718
  • 开源
    +关注

    关注

    3

    文章

    3360

    浏览量

    42526
  • 大模型
    +关注

    关注

    2

    文章

    2474

    浏览量

    2777

原文标题:从理论到实践,开源大模型在多领域的应用探索

文章出处:【微信号:开放原子,微信公众号:开放原子】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    腾讯混元大模型开源成绩斐然,GitHub Star数近1.4万

    内外部威廉希尔官方网站 的开源共享,旨在促进威廉希尔官方网站 创新与生态发展。 据悉,腾讯混元大模型已经多个模态上实现了开源,包括语言大
    的头像 发表于 12-26 10:30 216次阅读

    【「大模型启示录」阅读体验】如何在客服领域应用大模型

    客服领域是大模型落地场景中最多的,也是最容易实现的。本身客服领域的特点就是问答形式,大模型接入难度低。今天跟随《大模型启示录 》这本书,学
    发表于 12-17 16:53

    开源AI模型库是干嘛的

    开源AI模型库是指那些公开源代码、允许自由访问和使用的AI模型集合。这些模型通常经过训练,能够执行特定的任务。以下,是对
    的头像 发表于 12-14 10:33 196次阅读

    阿里云开源Qwen2.5-Coder代码模型系列

    Qwen2.5-Coder-32B-Instruct,代码生成领域取得了显著成就。据官方介绍,该模型EvalPlus等十多个主流的代码生成基准测试中,均刷新了
    的头像 发表于 11-14 11:28 363次阅读

    科技云报到:假开源真噱头?开源模型和你想的不一样!

    查看、修改、分发。开源自此深刻影响了互联网行业的每一个角落。 模型和GenAI崛起的当下,开源再次成为业界关注焦点,对于开源和闭源的争论
    的头像 发表于 11-03 10:46 234次阅读

    Llama 3 与开源AI模型的关系

    人工智能(AI)的快速发展中,开源AI模型扮演着越来越重要的角色。它们不仅推动了威廉希尔官方网站 的创新,还促进了全球开发者社区的合作。Llama 3,作为一个新兴的AI项目,与开源AI
    的头像 发表于 10-27 14:42 381次阅读

    RISC-V中国的发展机遇有哪些场景

    RISC-V中国的发展机遇广泛存在于多个场景,这主要得益于其开源、开放、简洁、灵活等特性,以及中国作为全球最大的数据大国和信息威廉希尔官方网站 市场的重要地位。以下是一些RISC-V
    发表于 07-29 17:14

    深度学习模型有哪些应用场景

    深度学习模型作为人工智能领域的重要分支,已经多个应用场景中展现出其巨大的潜力和价值。这些应用不仅改变了我们的日常生活,还推动了科技进步和产业升级。以下将详细探讨深度学习
    的头像 发表于 07-16 18:25 1997次阅读

    英伟达开源Nemotron-4 340B系列模型,助力大型语言模型训练

    近日,英伟达宣布开源了一款名为Nemotron-4 340B的大型模型,这一壮举为开发者们打开了通往高性能大型语言模型(LLM)训练的新天地。该系列模型不仅包含高达3400亿参数,而且
    的头像 发表于 06-17 14:53 571次阅读

    通义千问开源千亿级参数模型

    通义千问近日开源了其首个千亿级参数模型Qwen1.5-110B,这是其全系列中首个达到千亿级别的开源模型。Qwen1.5-110B模型继承了
    的头像 发表于 05-08 11:01 758次阅读

    【大语言模型:原理与工程实践】大语言模型的评测

    计算和代码纠错等。这些场景覆盖日常生活和学习的多个方面,使得对话能力评测变得尤为复杂和关键。为了全面评估大语言模型各种应用场景下的对话能力
    发表于 05-07 17:12

    通义千问推出1100亿参数开源模型

    通义千问近日震撼发布1100亿参数的开源模型Qwen1.5-110B,这一举措标志着通义千问AI领域迈出了重大步伐。该模型成为通义千问全系列首个千亿级参数
    的头像 发表于 05-06 10:49 590次阅读

    李彦宏:开源模型将逐渐滞后,文心大模型提升训练与推理效率

    李彦宏解释道,百度自研的基础模型——文心 4.0,能够根据需求塑造出适应各类场景的微型版模型,并支持精细调整以及后预训练。相较于直接使用开源模型
    的头像 发表于 04-16 14:37 447次阅读

    IBMwatsonx上提供开源的Mistral AI模型

    IBM 提供 Mixtral-8x7B 的优化版本,该版本可将延迟时间最多缩短 75% IBM、第三方和开源模型的目录不断增加,为客户提供更多选择和灵活性 是 watsonx 人工智能与数据平台
    的头像 发表于 03-12 19:10 1340次阅读

    机器人基于开源的多模态语言视觉大模型

    ByteDance Research 基于开源的多模态语言视觉大模型 OpenFlamingo 开发了开源、易用的 RoboFlamingo 机器人操作模型,只用单机就可以训练。
    发表于 01-19 11:43 424次阅读
    机器人基于<b class='flag-5'>开源</b>的多模态语言视觉大<b class='flag-5'>模型</b>