Sora到底牛在哪 | AI爆发的大趋势下，普通人真正该学的是什么-电子发烧友网

Sora炸裂了的地方，在于它能理解自然语言，知道那个画面该是怎么样的，它学习很多视频内容（大力出奇迹，需要很多算力），而且一上来就是能制作60s的视频，刚好是短视频的需求，之前的AI视频生成的时间都很短（几秒钟).

就说Sora有多火吧，生成的视频上线一个，疯传一个。

明显能看出来Sora生成的视频中的各项细节都让人惊叹，一如去年的ChatGPT，Sora被认为是AGI（通用人工智能）的又一个里程碑时刻。

一.sora的出现可以如何看待:

对于许多行业来说，都应该关注Open AI和sora这些人工智能相关的产品。

尤其是对设计领域来说，比如以前做logo、做海报、宣传册、做操作视频剪辑、拍摄等等相关的行业。

其一是思考，面对这些新威廉希尔官方网站、新工具，对自己有哪些挑战，应对策略是什么。

其二是结合，基于自己当前的业务，哪些可以利用这些威廉希尔官方网站进行结合，从而提升自己的效率和业务场景。

比如美图秀秀、稿定设计、剪映等产品，就基于AI立马推出了相关的产品。

（PS：目前 openai 官方还未开放 sora 灰度，不过根据文生图模型 DALL·E 案例，一定是先给 ChatGPT Plus 付费用户使用，需要注册或者升级 GPT Plus 可以看这个教程:升级 ChatGPT Plus 的教程，一分钟完成升级)

二. 以终为始地看，AI爆发的大趋势下，普通人真正该学的是什么？

我觉得有三点：讲故事的能力、结构化思考力和内容专业力。

1. 讲故事的能力

以文生视频为例，先不说Sora，很多人连Pika、Runway都用不利索。

用文字描述一件事、一个观点、一个诉求并不难，但描述一段画面、一个场景、一则完整故事，对绝大多数人是极高的门槛。

Sora不会让影视行业失业，正相反，如果视频生成的AI威廉希尔官方网站持续普及，会让真正会写故事的人发挥才能，而不是受限于影视行业的潜规则而灰心放弃。

2. 结构化思考力

很多写Sora的文章，都在讲它在模型算法、算力涌现、物理interwetten与威廉的赔率体系上的创新。对我而言，会更惊讶它在训练视频数据时，以一种结构化提示词方法，解决了视频标注问题：

“We first train a highly descriptive captioner model and then use it to produce text captions for all videos in our training set”

本质上看，无论是B端训练数据，还是C端和大模型对话，都用到了结构化表达能力。包括那些所谓“Sora培训”，其实教你的也是怎么写好提示词。举个例子，对这样的场景：

该怎么描述呢？一个在沉思的老爷爷？一个戴眼镜的老爷爷？一个在咖啡厅发呆的老爷爷？可能大部分人想到这儿就结束了。但更加结构化的描述可以是：

主体人物：：一位 60 多岁留着胡须的白发老人

镜头景别：脸部特写

背景环境：巴黎的一家咖啡馆

人物状态：注视着窗外行走的人们，一动不动陷入沉思，后又抿嘴微微一笑

人物细节：穿着一件羊毛大衣和一件纽扣衬衫、头戴棕色贝雷帽，戴着眼镜，像是个教授

环境细节：金色的灯光和背景中的巴黎街道和城市

镜头威廉希尔官方网站：景深、35 毫米电影胶片，有电影感

具备写出上述提示词的能力，才能真正发挥多模态威廉希尔官方网站的价值。这背后蕴含着的，就是结构化总结和思考能力。

有句话很形象，写提示词就像客户讲brief，能把需求说清楚，就离正确答案不远了。

3. 内容专业力

这点又说回到创作者本身，我比较喜欢杨远骋老师（「躺岛」和「新世相」联合创始人）的一个观点：

最大的影响会是出现新的创作者，会出现完全不在人们视野里的新的内容偶像，他们有非常好的品位、思维方式和世界观，但受限于表达威廉希尔官方网站，在过去却连基本的视频制作能力都不具备。

Koji，公众号：十字路口CrossingSora 喧嚣过后，理性浮现 | 我问出了这 5 位顶级创作者的真实想法

是的，除了上文提到的讲故事能力。如果你具备对“好内容”的理解力，懂得怎样更合理地设计脚本、做分镜、上特效、画故事板、运镜、调度、选角、布景、调光、配音、后期等等，AI就是你发挥想象力最好的帮手。能用好 AI 的人，一定能做出更好作品、获得更多收入。

因此我坚定地认为，这波AI趋势，对高潜力的作家、画手、设计师、编剧等创作者，是绝对的利好。如果你也想从中获益，先把“创作一部好内容”作为目标学起来吧。

总的来讲，我认为围着Sora去追新闻没啥必要。能跳出对Sora本身铺天盖地的宣传，去思考这背后该真正掌握的技能是什么。用结构化思维去训练讲故事的能力，成为一名优秀创作者，才是值得为此付出时间的。

三、sora原理常见问题及解答:

Q：训练数据的一个 clip 中如果有场景/镜头的切换，那 casual 3D CNN 还是会和过往的帧都有关系吗？

A：训练数据中大概率是有：一个 clip 有镜头/场景的切换。如果有切换，那么使用 casual 3D CNN 可能会带来问题：在切换前后的内容是不同的，不仅会增加模型训练难度，也会带来瑕疵。这个可能就直接训练了，通过相应数据的训练就能解决。

Q：训练数据的来源？

A：大家猜测有 1）youtube 的视频。2）Shutterstock，之前有公告：Shutterstock 扩大与 OpenAI 的合作伙伴关系，签署新的六年协议以提供高质量的训练数据：渲染引擎的数据，这个网络上大家贴出了一些间接证据。渲染引擎的数据能够针对性地模拟出很多符合 3D 一致性、物理一致性的数据，对于模型的训练应该有很好的帮助。

Q：输出变长的长度、分辨率和长宽比是如何做到的？

A：1. diffusion 过程中，输入的 noise tokens 就添加 factorized positional embedding。比如最直接的实现方式，每个 token 对应有三个数字（t, h, w）分别表示时间、长和宽，然后添加相应的 position embedding 去区分。

训练的时候也采用了变长的长度、分辨率和长宽比。这些 examples 模型在训练的时候见过。

这样，可以做到威廉希尔官方网站报告中提到的：At inference time, we can control the size of generated videos by arranging randomly-initialized patches in an appropriately-sized grid。

审核编辑黄宇

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
30805

浏览量
268942
ChatGPT

ChatGPT

+关注

关注
29

文章
1560

浏览量
7617
Sora

Sora

+关注

关注
0

文章
81

浏览量
195

OpenAI推出AI视频生成模型Sora

近日，备受期待的OpenAI再次推出了其创新之作——AI视频生成模型Sora。这一新品的发布，无疑为AI威廉希尔官方网站注入了新的活力。据悉，Sora与OpenAI旗下的

发表于 12-12 09:40 •182次阅读

智慧灯杆到底“智慧”在哪里？条形智能为您专业解读 AI灯杆屏

发表于 11-14 13:51 •188次阅读

智慧灯杆<b class='flag-5'>到底</b>“智慧”<b class='flag-5'>在哪</b>里？条形智能为您专业解读 <b class='flag-5'>AI</b>灯杆屏

Sora还在PPT阶段，“中国版Sora”已经开放使用了！

电子发烧友网报道（文/梁浩斌）今年春节期间，OpenAI的AI文字生成视频模型Sora惊艳全世界，极高的视频生成效果、长达60秒的视频生成长度，让过去Pika Labs推出的Pika 1.0、去年

发表于 06-17 09:07 •3404次阅读

AI浪潮下的十大消费者新趋势

《2030年代十大热门消费趋势——AI赋能的未来》收集了来自全球13座城市6,500名早期采用者对2030年代AI场景的反馈，并将其总结为了十大趋势： 01

发表于 06-05 10:30 •365次阅读

智谱AI刘江：5-10年内AGI会达到普通人水平

在2024亚马逊云科技中国峰会上，智谱AI首席生态官刘江发表了引人注目的观点。他预测，在未来的5至10年内，AGI（通用人工智能）的发展将达到普通人的水平，这将是“我们这一代人遇到的最大的威廉希尔官方网站突破”。

发表于 05-31 10:33 •719次阅读

智谱AI正研发对标Sora的国产文生视频模型

智谱AI，这家国内估值超过200亿的AI大模型独角兽企业，正全力投入研发一款与OpenAI的Sora相媲美的国产文生视频模型。据公司内部人士透露，该模型预计最快将在今年内发布，将成为AI

发表于 05-07 09:22 •529次阅读

基站式无人机屏蔽器对普通人有威胁吗？

式无人机屏蔽器应运而生。那么，这种看似神秘的设备对普通人是否有威胁呢？今天，深圳市特信电子有限公司就来揭开它的神秘面纱。

发表于 04-08 09:10 •634次阅读

新火种AI|围攻光明顶：Sora效应下的AI视频生成竞赛

Sora的出现，让AI视频生成领域真正“活”了起来

发表于 03-16 11:12 •639次阅读

汤姆猫加速布局AI应用，接入OpenAI Sora模型，探索生成视频素材之道

汤姆猫称，Sora是人工智能不断演进的里程碑之作。类似Sora的各类AI工具能够助其以更高效率、更低成本创建丰富多样且用户体验佳的AI应用产品和服务。

发表于 03-04 13:46 •695次阅读

面对Sora，中国AI可以不急不躁不焦虑

AISora

脑极体
发布于 :2024年02月23日 00:51:52

探索OpenAI Sora视频AI生成威廉希尔官方网站及其应用如何使用指南

OpenAI的Sora现已扩展其能力范围，进入视频生成领域，标志着人工智能威廉希尔官方网站在多媒体内容创作上的一个重大突破。Sora的视频AI功能使得用户能够根据文本描述自动生成高质量的视频内容，这项威廉希尔官方网站

发表于 02-20 12:01 •1437次阅读

openai sora如何使用?Sora 使用指南：快速上手

OpenAI Sora 使用指南：快速上手欢迎使用OpenAI Sora，一款强大的人工智能视频生成工具。无论您是视频制作新手还是专业人士，本指南将帮助您快速掌握Sora，轻松创作出高质量的视频

发表于 02-20 11:19 •4271次阅读

Sora到底懂不懂物理世界? Sora开启更多可能

OpenAI的视频生成模型Sora持续引发关注，而围绕Sora到底懂不懂物理世界？这个讨论越发火热，甚至是在讨论Sora 到底是不是物理引擎

发表于 02-20 11:08 •685次阅读

新火种AI|OpenAI开年王炸！GPT商店本周上线，谁的AI第一桶金？

OpenAI的GPT商店终于来了，普通人翻身的转折点？

发表于 01-09 23:04 •282次阅读

2024人工智能四大趋势

2023年，世人见证了ChatGPT在全球范围的大火。以生成式人工智能为代表的新一代人工智能问世，改变了人工智能（AI）威廉希尔官方网站与应用的发展轨迹，加速了人与AI的互动进程，是人工智能发展史上的新里程碑。2024年，人工智能威廉希尔官方网站与应用的发展又会呈现出哪些

发表于 01-05 10:37 •1159次阅读

搜索历史

Sora到底牛在哪 | AI爆发的大趋势下，普通人真正该学的是什么

评论

OpenAI推出AI视频生成模型Sora

智慧灯杆到底“智慧”在哪里？条形智能为您专业解读 AI灯杆屏

Sora还在PPT阶段，“中国版Sora”已经开放使用了！

AI浪潮下的十大消费者新趋势

智谱AI刘江：5-10年内AGI会达到普通人水平

智谱AI正研发对标Sora的国产文生视频模型

基站式无人机屏蔽器对普通人有威胁吗？

新火种AI|围攻光明顶：Sora效应下的AI视频生成竞赛

汤姆猫加速布局AI应用，接入OpenAI Sora模型，探索生成视频素材之道

面对Sora，中国AI可以不急不躁不焦虑

探索OpenAI Sora视频AI生成威廉希尔官方网站及其应用如何使用指南

openai sora如何使用?Sora 使用指南：快速上手

Sora到底懂不懂物理世界? Sora开启更多可能

新火种AI|OpenAI开年王炸！GPT商店本周上线，谁的AI第一桶金？

2024人工智能四大趋势