从M6到“通义千问”，阿里大模型的迭代之路-电子发烧友网

阿里AI大模型“通义千问”于 2023 阿里云峰会重磅发布。基础大模型的核心是能够支撑各行各业，阿里希望能够为客户与合作伙伴提供面向千行百业的专属大模型。从 M6 项目到“通义千问”的发展之路。阿里 AI 大模型“通义千问”前身系阿里达摩院 M6 项目，阿里达摩院于 2020 年 6 月发布 3 亿参数基础模型，21 年 1 月模型参数规模达百亿，同年 5 月达万亿参数，同年 10月达 10 万亿，成为全球首个 10 万亿参数多模态大模型，并落地应用于天猫虚拟主播等 40 多个细分场景。22年 9 月达摩院发布“通义”大模型系列，打造业界首个 AI 底座，且兼顾大小模型的层次化建构体系。

1 阿里大模型的迭代进阶之路

项目启动阶段：M6 项目于 2020 年启动，同年 6 月推出 3 亿参数的基础模型，2021年 1 月，模型参数规模达百亿，成为世界最大的中文多模态模型。

万亿模型阶段：2021 年 5 月，达摩院发布万亿参数模型 M6 并正式投入使用，追上谷歌发展脚步。M6 在多模态 GreenAI、文到图生成、商业化领域并肩世界一流水平，与英伟达、谷歌相比，M6 仅用 480 卡 V100 32G GPU 就实现了万亿模型，节省算力资源超 80%，训练效率提升近 11 倍。

十万亿模型阶段：2021 年 10 月，M6 进一步升级成为全球首个 10 万亿参数的多模态大模型，并应用于天猫虚拟主播等 40 多个创造相关场景中；在绿色低碳方面，相比 GPT-3，M6 实现了同等参数规模下，能耗仅为 1%。

大模型阶段：2022 年 9 月，达摩院发布“通义”大模型系列，打造业界首个 AI 统一底座，并构建了大小模型协同的层次化人工智能体系，其中，统一底座 M6-OFA 模型在不引入新增结构情况下，可同时处理 10 余项单模态和跨模态任务，通义大模型的出现将为 AI 从感知智能迈向知识驱动的认知智能提供先进基础设施。

2 阿里达摩院年度科技趋势：阿里对 AI 大模型高度重视达摩院每年都会发布对当年的十大科技趋势预测，在最近两年的科技趋势预测中，充分体现阿里对 AI 威廉希尔官方网站及大模型的重视：

2022 年，达摩院在十大科技趋势中提到多项 AI 相关内容，包括 AI for Science（将AI 应用于高威廉希尔官方网站领域科学研究）、大小模型协同进化、绿色能源 AI（基于 AI 算力对资源消耗严重的现实，从降本增效角度提出了绿色能源 AI 新概念）等。

2023 年，达摩院在十大科技趋势中，将多模态预训练大模型放在首位，足以显现其对大模型的重视。CLIP 和 BEiT-3 等多模态模型实现威廉希尔官方网站突破，多模态融合的通用人工智能成为未来发展趋势。多模态预训练的发展将重塑人工智能商业模式。多模态统一建模，目的增强模型的跨模态语义对齐能力，打通各模态之间的关系，促使模型逐步标准化。基于多领域知识，构建统一的、跨场景、多任务的多模态基础模型将成为未来人工智能的重点发展方向。

通用模型层主要包含通义-M6、通义-AliceMind、通义-视觉三种通用模型。1）通义-M6 是国际首个参数规模达到 10 万亿的全球最大预训练模型。2）通义-AliceMind作为开源深度语言模型体系，形成了从文本 PLUG 到多模态 mPLUG 再到模块化统一模型演化趋势。3）通义-视觉可在电商行业实现图像搜索和万物识别等场景应用，并在文生图以及交通和自动驾驶领域发挥作用。

3 统一威廉希尔官方网站底座-三位一体：M6-OFA 为通义大模型底座，实现架构、模态、任务三方面统一通义大模型在国内率先构建 AI 统一底座，在业界首次实现模态表示、任务表示、模型结构的统一，统一学习范式 OFA 是通义大模型背后的核心威廉希尔官方网站支撑。架构统一：M6-OFA 采用了 Transformer Encoder-Decoder + ResNet Blocks 架构，ResNet Blocks 用于提取图像特征，Transformer Encoder 负责多模态特征的交互，Transformer Decoder 采用自回归方式输出结果。无需增加任何任务特定的模型层，即可实现预训练与微调的相同学习模式。模态统一：M6-OFA 构建了一个涵盖不同模态的通用词表，以便模型使用该词表表示不同任务的输出结果。其中 BPE 编码的自然语言 token 用于表示文本类任务或图文类任务的数据；图片中连续的横纵坐标编码为离散化 token，用于表示视觉定位、物体检测的数据；图片中的像素点信息编码为离散化 token，用于表示图片生成、图片补全等任务的数据。任务统一：通过设计不同的 instruction，M6-OFA 将涉及多模态和单模态（即 NLP 和CV）的所有任务都统一建模成序列到序列（seq2seq）任务。M6-OFA 覆盖了 5 项多模态任务，视觉定位、定位字幕、图文匹配、图像字幕和视觉问答；2 项视觉任务，检测和图像填补和 1 项文本任务，即文本填补。

4 通用模型层-通义视觉大模型通义-视觉大模型自下往上分为了底层统一算法架构、中层通用算法和上层产业应用。在应用层面，通义-视觉大模型可以在电商行业实现图像搜索和万物识别等场景应用，并在文生图以及交通和自动驾驶领域发挥作用。

阿里大模型赋能天猫精灵有望承担智能家居生态入口角色。结合真格基金 7 项针对大模型的测试题与答复，阿里大模型天猫精灵压缩版的成绩为 4.5/2.5，表现优于文心一言（1/6）和 GPT3.5（4/3），逊于 GPT4.0（7/0）。可见在简单的逻辑推理和垂直能力领域，阿里大模型压缩版已初步具备与 ChatGPT 与文心一言一较高下的实力。

通义千问赋能天猫精灵有望成为智能居家生态入口的不二选择。阿里大模型通义千问有望赋能旗下智能音箱天猫精灵打造居家场景智能生态入口，与萤石网络等智能家居厂商优势互补，通过“人机自然交互、信息上传云端，联动控制反馈”的机制，开展智能家居生态共建。

阿里大模型“通义千问”有望基于其升级版天猫精灵（智能居家入口）、淘宝（智能电商入口）、钉钉（智能办公入口）、高德地图（智能汽车入口）等，协同合作厂商共建阿里系生态，借助多项生态入口打造覆盖“衣食住行工”的全域智能生态场景。目前，发布会已披露三大场景：智能居家：通义千问×智能家居（天猫精灵等），有望成为具备个性化故事生成、个性化歌单推荐、个性化菜谱生成等功能的智能生活助理。

审核编辑：李倩

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
30996

浏览量
269297
模型

模型

+关注

关注
1

文章
3254

浏览量
48878
阿里达摩院

阿里达摩院

+关注

关注
0

文章
29

浏览量
3353

原文标题：从M6到“通义千问”，阿里大模型的迭代之路

文章出处：【微信号：AI_Architect，微信公众号：智能计算芯世界】欢迎添加关注！文章转载请注明出处。

阿里通义千问代码模型全系列开源

近日，阿里云通义大模型团队宣布了一项重大决策：将通义千问代码

发表于 11-14 15:26 •359次阅读

通义千问三款主力模型再降价

阿里云百炼平台再次掀起降价风暴，三款通义千问主力模型——Qwen-Turbo、Qwen-Plus及Qwen-Max，继5月首次大幅度降价后，

发表于 09-20 16:46 •960次阅读

通义千问发布第二代视觉语言模型Qwen2-VL

阿里巴巴旗下的通义千问近日宣布，其第二代视觉语言模型Qwen2-VL正式问世，并宣布旗舰模型Qw

发表于 09-03 16:31 •583次阅读

【附实操视频】聆思CSK6大模型开发板接入国内主流大模型（星火大模型、文心一言、豆包、kimi、智谱glm、通义千问）

接入文心一言、通义千问、豆包、智谱glm、kimi等国内的大模型，但由于各家接口和数据格式不一样，调试验证会浪费很多时间。因此本篇以聆思CSK6

发表于 08-22 10:12

智能硬件接入主流大模型做语音交互（附文心一言、豆包、kimi、智谱glm、通义千问示例）

接入文心一言、通义千问、豆包、智谱glm、kimi等国内的大模型，这个是必须可以的。但由于各家接口和数据格式不一样，有些朋友直接参考chatgpt的方式没有走通，因此本篇以聆思CSK

发表于 08-21 19:13

阿里通义千问Qwen2大模型发布并同步开源

阿里巴巴集团旗下的通义千问团队宣布，全新的Qwen2大模型正式发布，并在全球知名的开源平台Hugging Face和ModelScope上同

发表于 06-11 15:33 •1079次阅读

阿里通义千问Qwen2大模型发布

阿里巴巴最近发布了其通义千问系列的新成员——Qwen2大模型，并在Hugging Face和ModelScope两大平台上实现了同步开源。这

发表于 06-07 15:59 •766次阅读

阿里云正式发布通义千问2.5，中文性能全面赶超GPT-4 Turbo

在通义大模型发布一周年之际，阿里云迈出了历史性的一步。近日，阿里云正式发布通义千

发表于 05-13 11:16 •993次阅读

阿里云发布通义千问2.5

阿里云近日正式发布了通义千问2.5，标志着其人工智能威廉希尔官方网站在中文语境下取得了重要突破。据阿里云智能集团首席威廉希尔官方网站官周靖人介绍，

发表于 05-10 09:57 •551次阅读

阿里云发布通义千问2.5大模型，多项能力超越GPT-4

阿里云隆重推出了通义千问 2.5 版，宣称其“威廉希尔官方网站进步，全面超越GPT-4”，尤其是在中文环境中的多种任务（如文本理解、文本生成、知识问答及生活建议、临时聊天及对话以及安全风险评估）方

发表于 05-09 14:17 •967次阅读

通义千问开源千亿级参数模型

通义千问近日开源了其首个千亿级参数模型Qwen1.5-110B，这是其全系列中首个达到千亿级别的开源模型。Qwen1.5-110B

发表于 05-08 11:01 •759次阅读

通义千问推出1100亿参数开源模型

通义千问近日震撼发布1100亿参数的开源模型Qwen1.5-110B，这一举措标志着通义千

发表于 05-06 10:49 •590次阅读

联发科天玑9300等旗舰芯片搭载通义千问大模型，成功实现

通义千问大模型可在离线环境下轻松应对多轮AI对话。此外，阿里云也承诺与联发科进行深度合作，为全球手机制造商提供端侧大

发表于 03-28 16:35 •821次阅读

联发科天玑9300搭载通义千问大模型，阿里云提供解决方案

通义千问大模型已开源多项版本，包括18亿、70亿、140亿及720亿参数等版本伴随视觉、音频多模态能力提升。阿里云于去年10月发布的

发表于 03-28 09:55 •617次阅读

阿里通义千问重磅升级，免费开放1000万字长文档处理功能

近日，阿里巴巴旗下的人工智能应用通义千问迎来重磅升级，宣布向所有人免费开放1000万字的长文档处理功能，这一创新举措使得通义

发表于 03-26 11:09 •802次阅读

搜索历史

从M6到“通义千问”，阿里大模型的迭代之路

评论

阿里通义千问代码模型全系列开源

通义千问三款主力模型再降价

通义千问发布第二代视觉语言模型Qwen2-VL

【附实操视频】聆思CSK6大模型开发板接入国内主流大模型（星火大模型、文心一言、豆包、kimi、智谱glm、通义千问）

智能硬件接入主流大模型做语音交互（附文心一言、豆包、kimi、智谱glm、通义千问示例）

阿里通义千问Qwen2大模型发布并同步开源

阿里通义千问Qwen2大模型发布

阿里云正式发布通义千问2.5，中文性能全面赶超GPT-4 Turbo

阿里云发布通义千问2.5

阿里云发布通义千问2.5大模型，多项能力超越GPT-4

通义千问开源千亿级参数模型

通义千问推出1100亿参数开源模型

联发科天玑9300等旗舰芯片搭载通义千问大模型，成功实现

联发科天玑9300搭载通义千问大模型，阿里云提供解决方案

阿里通义千问重磅升级，免费开放1000万字长文档处理功能