0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Sora阴影之下,焦虑的中国AI

科技云报到 来源:jf_60444065 作者:jf_60444065 2024-02-28 13:43 次阅读

科技云报道原创

“跟不上的可能就要被淘汰了。”看到Sora演示视频后,从业10多年的动画制作师黄斌得出了这样的判断。

随着影视业***呼声渐起,Sora的诞生也给中国AI行业带来了巨大的焦虑。

360集团创始人周鸿祎认为,Sora模型展现出了超越当前中国同类产品的性能和威廉希尔官方网站 水平,这不仅体现在Sora可能实现通用人工智能(AGI)的时间表上,还体现在其实际应用效果和创新能力上。

更有甚者,网上流传着“Sora的诞生是牛顿时刻”的说法,认为Sora代表了新一轮产业革命的兴起。

事实上,国内在经过“百模大战”之后,才刚刚在文本模型上取得显著成果,达到或超过GPT-3.5的水平,并正朝着GPT-4的方向努力追赶。

但Sora的诞生,展示了OpenAI在多模态模型而非单一文本领域的突破性进展,让国内AI厂商追上甚至超越OpenAI,几乎成了不可能完成的任务。

由此不少网友对中国AI发出质问:

为什么Sora没有诞生在中国?中国跟美国的AI差距越来越大,Sora这波国内慢了十年吧?永远都是在追赶路上,为啥没有原创?

在一句句灵魂版的拷问中,中国AI厂商集体陷入了沉默。

那么,在Sora这样的多模态大模型上,中美到底有多大差距?追赶的难点在哪儿?在种种限制之下,中国是否有自己的优势?

中美AI差距几何?

尽管OpenAI承认Sora仍处于开发的早期阶段,需要进一步完善,但业界已形成一个共识——Sora的推出标志着生成人工智能领域的一个重要里程碑。

这是因为Sora不仅仅是一个文生视频的工具,更是AGI的一个关键节点,它验证了一条通向AGI的可行威廉希尔官方网站 路线。

和之前的GPT-3一样,Sora再次验证了Scaling Law可以在这个威廉希尔官方网站 方向上继续发挥作用实现涌现。

而这背后,不仅是惊人的资本和算力支持的结果,更是通过无数工程实验试错和强大威廉希尔官方网站 力量支持的结果。

不少人推断,OpenAI手里应该已经有一个基本完整的多模态GPT-5,可以根据需要随时释放其中的某一部分打击对手,或者引导舆论。

360集团创始人周鸿祎更是直接断言,Sora的出现,意味着AGI(人工通用智能)的实现将从10年缩短到1年。

事实上,在Sora面前,无论是现有的顶级AI模型如Pika、Runway等,还是在多模态AI上有投入的国内厂商,基本上都被“吊打”了。

这也侧面反映出中美在AI威廉希尔官方网站 研发深度和资源投入上的差距。

首先,门槛来自算力。

虽然有学者认为Sora只是一个大约30亿参数的模型,训练成本并没有想象的高,但视频数据本身的处理、标注等成本,加上长视频在推理阶段注定的巨大token数量和算力消耗,显然对任何公司都是难以承受的挑战。

即便Sora真的只有30亿参数,视频分析对算力的消耗应该也是远远超过一个千亿模型的。在国内GPU被卡脖子之后,算力是一个巨大的挑战。

其次,是高质量的数据。

根据OpenAI发布的威廉希尔官方网站 报告,Sora强大能力归功于两点:其一是使用了基于Transformer的扩散模型(Diffusion Model);其二是将不同类型视觉数据转化为统一格式——像素块(patch),从而能利用数量庞大、质量过硬且算力性价比高的数据。

业内人士认为,数据质量和数量上的显著优势,很可能是Sora成功的最关键因素之一。

在算力方面,虽然OpenAI训练Sora模型使用的GPU卡数量并非无法企及,但其他公司在具备足够硬件资源的情况下,仍然难以复制OpenAI的成功,主要瓶颈还是在于如何获取和处理大规模高质量的视频数据。

2022年,OpenAI曾宣布以创新方法来训练AI模型,省去标注大量资料的训练过程。

据报道,OpenAI所公布的视频预训练模型(VPT),让AI学会了在《我的世界》里从头开始造石镐。

研究人员首先收集一波数据标注外包们玩游戏的数据,其中包含视频和键鼠操作的记录。

然后,利用这些数据制作逆动力学模型(IDM),从而推测出视频里每一步在进行的时候,键鼠都是怎么动的。这样只需比原来少很多的数据就可以实现目的。

这项研究发表于2022年6月,同时文中还注明这个工作已经进行了一年之久,也就是说,OpenAI至少从2021年起就开始进行这项研究。

Logenic AI联合创始人李博杰认为,OpenAI的先发优势决定了早期的数据壁垒,对于后进入市场的公司来说,增加了追赶的难度。

“即使是谷歌这样全球数据量最大的公司,在训练大模型时,训练数据也未必能比OpenAI更好”,李博杰表示。

相比之下,国内公司在数据上的积累和利用上也存在一定差距:一方面,由于政策变化和其他限制,后来者可能无法获取之前可用的一些关键数据;另一方面,随着AI生成内容越来越多地充斥互联网,原始的真实世界数据被“污染”,使得获取高质量、无偏见的训练数据更加困难。

最后,是创新的训练方法。

Sora实现了将Transformer和扩散模型结合的创新,首先将不同类型的视觉数据转换成统一的视觉数据表示(视觉patch),然后将原始视频压缩到一个低维潜在空间,并将视觉表示分解成时空patch(相当于Transformer token),让Sora在这个潜在空间里进行训练并生成视频。

接着做加噪去噪,输入噪声patch后,Sora通过预测原始“干净”patch来生成视频。

OpenAI发现,训练计算量越大,样本质量就会越高,特别是经过大规模训练后,Sora展现出interwetten与威廉的赔率体系 现实世界某些属性的“涌现”能力。

总的来说,Sora是好的架构+好的数据,然后把模型做大,达到量变到质变。

尽管Sora在方案设计上大部分是已有的威廉希尔官方网站 ,但能够做出惊艳效果的也只有Sora,这也说明在训练过程中有很多训练技巧的问题要解决。

中国AI厂商能否 追赶OpenAI?

Sora的威廉希尔官方网站 突破让AI焦虑在国内蔓延开来,但中国AI并非完全无招架之力。在Sora出现并占据大众视野之前,国内也曾有多家上市公司在多模态AI方面展开过布局。

2023年12月18日,东方证券在一份研报中提及,国内的海康威视、大华股份、萤石网络等视频分析行业领先厂商,纷纷投入到多模态大模型研究和william hill官网 落地进程。

与此同时,百度、阿里、腾讯、华为、字节跳动等大厂也都布局了多模态基础大模型。

据不完全统计,2023年12月至今三个月内,已有包括万兴科技、博汇科技、易点天下、数码视讯、汉王科技、当虹科技、东方国信等在内的十余家A股公司,在投资者互动平台披露过视频生成模型领域的业务情况。

尽管目前国内厂商呈现的“文生视频”效果远不如Sora,但Sora所用到的基础模型LLM、文生图模型DALL·E 3、大规模视频数据集、AI算力体系、大模型开发工具栈等核心基础设施,中国都已经具备。

比如原创的基础大语言模型文心一言、讯飞星火、BAICHUAN等,以及文生图模型文心一格、腾讯混元等,加上过去一年大模型基础设施的突飞猛进,有能力和条件支持中国AI修成正果,在视频生成赛道再现类似ChatGPT式的成功。

腾讯研究院资深专家王鹏认为,Sora的发布进一步明确了DiT(=VAE编码器+ViT+DDPM+VAE解码器)是多模态AI的可行方向,中国AI大厂仍然有可能以现有资源在一年左右接近Sora目前的水平。

中国AI的机会

事实上,不仅是威廉希尔官方网站 代际差异并没有想象中的那么大,视频生成模型走向行业的长跑才刚刚开始。大模型的价值需要商业化来证明,Sora也不例外。

首先,相比“人人皆可上手”的大语言模型,视频生成模型的应用门槛更高,受众群体更小。目前OpenAI仅开放给创作者使用,而非像ChatGPT那样开放给大众。

不难看到,视频生成模型从研发到落地,整个过程会更加缓慢,应用潜力与商业出口还有待探索。

其次,Sora虽然强大,但成本确实是一个现实问题。

有人估算,Sora生成一条视频的成本在几美元到几十美元不等,如果普及到大众使用,成本需要降到目前的1%才能接受。

降低成本的同时提高生成质量和逻辑连贯性,是亟待解决的关键挑战。

同时,考虑到无法解决“幻觉”的问题,要想生成真正可控可用的视频,短期内成本高昂。

这些局限性,都为中国AI产学各界留下了较长的追赶窗口期。

目前,Sora能够激活多大的商业价值尚不明确,但是利用大模型找应用场景却是中国市场的优势所在。

中国拥有丰富的行业和场景,如果中国AI厂商能为垂直的行业用户解决具体的场景问题,打磨好工具,做好视频生成模型的提示词工程,以便非专业背景的广大行业用户们上手使用,那么在特定领域超过GPT-4甚至是GPT-5的可能性是非常大的。

不仅如此,中国AI厂商也可以在Sora等大模型的基础上,做进一步的应用创新,例如在Sora之上能够提供更复杂的视频剪辑能力、革新医疗教学与模拟训练等,从而率先探索出商业化之路。

结语

Sora作为人工智能视频生成威廉希尔官方网站 的重大突破,显示了中美之间存在显著的威廉希尔官方网站 差距。这对于中国科技界而言,既是警醒也是鞭策。在承认现实差距的同时,中国AI也不必妄自菲薄,审视自我、调整战略、奋起直追,抓住机会窗口,才是弯道超车的必由之路。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30805

    浏览量

    268934
  • 人工智能
    +关注

    关注

    1791

    文章

    47229

    浏览量

    238329
  • Sora
    +关注

    关注

    0

    文章

    81

    浏览量

    195
收藏 人收藏

    评论

    相关推荐

    OpenAI推出AI视频生成模型Sora

    近日,备受期待的OpenAI再次推出了其创新之作——AI视频生成模型Sora。这一新品的发布,无疑为AI威廉希尔官方网站 注入了新的活力。 据悉,Sora与OpenAI旗下的
    的头像 发表于 12-12 09:40 182次阅读

    Sora还在PPT阶段,“中国Sora”已经开放使用了!

    电子发烧友网报道(文/梁浩斌)今年春节期间,OpenAI的AI文字生成视频模型Sora惊艳全世界,极高的视频生成效果、长达60秒的视频生成长度,让过去Pika Labs推出的Pika 1.0、去年
    的头像 发表于 06-17 09:07 3404次阅读

    Sora的最强竞争对手,来自中国

    今年2月发布的Sora,先是引得业界“哇声一片”,马斯克直接表态「人类愿赌服输」;周鸿祎说借助Sora人类实现AGI将缩减至一两年。大佬的彩虹屁不是白吹的。利用
    的头像 发表于 05-13 17:11 171次阅读
    <b class='flag-5'>Sora</b>的最强竞争对手,来自<b class='flag-5'>中国</b>

    智谱AI正研发对标Sora的国产文生视频模型

    智谱AI,这家国内估值超过200亿的AI大模型独角兽企业,正全力投入研发一款与OpenAI的Sora相媲美的国产文生视频模型。据公司内部人士透露,该模型预计最快将在今年内发布,将成为AI
    的头像 发表于 05-07 09:22 529次阅读

    新火种AI|围攻光明顶:Sora效应下的AI视频生成竞赛

    Sora的出现,让AI视频生成领域真正“活”了起来
    的头像 发表于 03-16 11:12 639次阅读

    汤姆猫加速布局AI应用,接入OpenAI Sora模型,探索生成视频素材之道

    汤姆猫称,Sora是人工智能不断演进的里程碑之作。类似Sora的各类AI工具能够助其以更高效率、更低成本创建丰富多样且用户体验佳的AI应用产品和服务。
    的头像 发表于 03-04 13:46 695次阅读

    面对Sora中国AI可以不急不躁不焦虑

    AISora
    脑极体
    发布于 :2024年02月23日 00:51:52

    sora模型是什么意思 sora模型引发行业变革

    约为290亿美元),且文生视频大模型将会大幅推动人工智能基础设施的需求,英伟达、OpenAI、软银等巨头公司都被曝正在进行AI芯片的制造布局,英伟达也因大模型训练需要GPU算力支持而股价大涨 。与此同时,受Sora发布的影响,美国图片供应商Shutterstock的股价大
    的头像 发表于 02-22 17:00 1841次阅读

    sora模型中国可以使用吗 sora模型是哪个公司

    Sora是一种扩散模型,具备从噪声中生成完整视频的能力,它生成的视频一开始看起来像静态噪音,通过多个步骤逐渐去除噪声后,视频也从最初的随机像素转化为清晰的图像场景 ,其能够一次生成多帧预测,确保画面主体在暂时离开视野时仍保持一致。 sora模型
    的头像 发表于 02-22 16:52 3271次阅读

    sora模型怎么使用 sora模型对现实的影响

    美国当地时间2024年2月15日 ,OpenAI正式发布文生视频模型Sora ,并发布了48个文生视频案例和威廉希尔官方网站 报告 ,正式入局视频生成领域 。Sora能够根据提示词生成60s的连贯视频,“碾压”了
    的头像 发表于 02-22 16:42 1170次阅读

    Sora来了,会砸掉谁的饭碗?反观第一拨靠Sora赚钱的人已经出现

    ? 龙年OpenAI再次用Sora讲出了新故事;Sora来了AI商业化进程有望加速推进但是也带来了更多问题。 Sora来了,会砸掉谁的饭碗? 文生视频大模型
    的头像 发表于 02-22 14:11 1061次阅读

    sora最新消息 sora是什么意思

    Sora,是美国人工智能研究公司OpenAI发布的人工智能文生视频大模型(但OpenAI并未单纯将其视为视频模型,而是作为“世界模拟器”,于2024年2月15日(美国当地时间)正式对外发布
    的头像 发表于 02-21 16:38 1907次阅读

    探索OpenAI Sora视频AI生成威廉希尔官方网站 及其应用如何使用指南

    OpenAI的Sora现已扩展其能力范围,进入视频生成领域,标志着人工智能威廉希尔官方网站 在多媒体内容创作上的一个重大突破。Sora的视频AI功能使得用户能够根据文本描述自动生成高质量的视频内容,这项威廉希尔官方网站
    的头像 发表于 02-20 12:01 1437次阅读

    openai sora如何使用?Sora 使用指南:快速上手

    OpenAI Sora 使用指南:快速上手 欢迎使用OpenAI Sora,一款强大的人工智能视频生成工具。无论您是视频制作新手还是专业人士,本指南将帮助您快速掌握Sora,轻松创作出高质量的视频
    的头像 发表于 02-20 11:19 4270次阅读

    Sora到底懂不懂物理世界? Sora开启更多可能

    OpenAI的视频生成模型Sora持续引发关注,而围绕Sora到底懂不懂物理世界?这个讨论越发火热,甚至是在讨论Sora 到底是不是物理引擎甚至世界模型? 当然Sora 目前看起来似乎
    的头像 发表于 02-20 11:08 685次阅读