
目前Sora并未开放,只向少数导演艺术家开放邀请码。

案例一
提示词:「几头巨大的长毛象踏着雪地走近,它们长长的长毛在风中轻轻地吹着,远处是白雪皑皑的树木和引人注目的雪山,午后的光线与稀疏的云层和远处的太阳形成了温暖的光芒,低相机的视野令人惊叹,用美丽的摄影和景深捕捉到了这只巨大的长毛哺乳动物。」

可以看到,在0秒的时候画面上有两只完整的大象在行走,并且有一只被遮挡的大象在行走,0~5秒的时候这只大象被遮挡且继续前进行走,在第5秒时,这只大象开始显示出来,慢慢走出来,身体很完整。
可以看出Sora在复杂的场景、多角色表情以及镜头连贯性上表现的很突出。
Runway和Pika对比接下来用相同提示词在Runway和Pika中看看效果吧。

案例二
提示词:「美丽的、白雪皑皑的东京城熙熙攘攘。镜头穿过熙熙攘攘的城市街道,跟随几个人享受美丽的雪天,在附近的摊位上购物。美丽的樱花花瓣随着雪花在风中飞舞。」

Runway、Pika、StableVideo对比
接下来,使用以上相同的关键词在Pika、Runway、StableVideo中进行了测试,可以看到以下效果。Sora在生成时长、画面连贯性和人物走路细节对视等方面也直接碾压。

二、Sore优势与局限1.Sora的优势
最重要的是,它不仅理解用户在prompt中要求的内容,还能自己理解这些事物在现实世界中的存在方式;
🔗更多技术:
2.Sora的劣势OpenAI研究人员也提到sora仍存着一些缺点,比如可能无法精确描述随着时间推移发生的事件。例如“五只灰狼幼崽在一条偏僻的碎石路上玩耍”,小狼的数量会发生变化,玩耍的狼会出现混淆或消失。

比如可能无法精确描述物理世界运动特征。例如“篮球穿过篮筐然后爆炸”,篮球没有正确被篮筐阻挡。

三、Sore提示词拆解

主体描述:涉及人物、动物或物体的详细描述,包括年龄、服装、动作、表情、和与场景的互动。
场景设定:描述地点,如东京的街头、海底世界;时间,如日落时分、蓝色时刻;环境:如城市、自然景观;特定的场景氛围:如温馨、神秘。
视觉细节:包括颜色、光影、天气条件、纹理和任何特别的视觉效果,比如大象长长的毛、飞舞的樱花花瓣。
情感氛围:描述场景所要传达的情绪、情感状态或氛围,利用视觉元素和场景设置加以强化,比如温暖的感觉、神奇浪漫的感觉。
摄影技术:特定的摄影或影片拍摄技术,如70mm胶片、无人机拍摄、倾斜移位。
1.举例子把提示词「几头巨大的长毛象踏着雪地走近,它们长长的长毛在风中轻轻地吹着,远处是白雪皑皑的树木和引人注目的雪山,午后的光线与稀疏的云层和远处的太阳形成了温暖的光芒,低相机的视野令人惊叹,用美丽的摄影和景深捕捉到了这只巨大的长毛哺乳动物。」进行拆解如下:

主体描述:几头巨大的长毛象,在雪地中踏步,长毛在风中轻轻吹动。
场景设定:雪地,远处有被雪覆盖的树木和雪山,午后,有稀疏的云和远处的太阳
视觉细节:长毛在风中的轻轻吹动,光线和云层形成温暖光芒。
情感氛围:自然之美和壮观
摄影技术:低相机视角,景深
2.案例拆解案例一
几头巨大的长毛象踏着雪地走近,它们长长的长毛在风中轻轻地吹着,远处是白雪皑皑的树木和引人注目的雪山,午后的光线与稀疏的云层和远处的太阳形成了温暖的光芒,低相机的视野令人惊叹,用美丽的摄影和景深捕捉到了这只巨大的长毛哺乳动物。

案例二
美丽的、白雪皑皑的东京城熙熙攘攘。镜头穿过熙熙攘攘的城市街道,跟随几个人享受美丽的雪天,在附近的摊位上购物。美丽的樱花花瓣随着雪花在风中飞舞。

案例三
一位时尚的女士走在东京的街道上,街道上充满了温暖的霓虹灯和生动的城市标志。她穿着黑色皮夹克、红色长裙和黑色靴子,手里拿着一个黑色钱包。她戴着太阳镜和红色口红。她走路自信而随意。街道潮湿且反光,形成了彩色灯光的镜面效果。许多行人走来走去。

案例四
一位24岁女性的眼睛在马拉喀什的魔法时刻进行极端特写镜头的眨眼,以70毫米的电影胶片拍摄,具有景深,鲜艳的颜色,电影般的效果。

3.Sora秘籍公式
按照主体描述、场景设定、视觉细节、情感氛围、摄影技术,这五大维度讲以上提示词进行分类可以得到如下提示词秘籍公式。

4.小技巧:利用AI工具快速得到上述表格
使用ChatGPT可以快速完成。首先把四个案例的提示词文件放到输入框,输入指令「按照以上以下五个维度把上面4个案例进行拆解,并使用表格的形式展示出来。」就可以得到如下表格啦。大家可以利用ChatGPT对日常工作进行提效。

四、提示词大全
根据提示词五大维度,汇总了一些关键词如下。后期我也会及时整理更多资料发布到AIGC知识库,欢迎加我微信了解更多,欢迎小伙伴加入一起学习。

主体描述(SubjectDescription)
职业(Occupation):教师(Teacher),艺术家(Artist);兴趣(Interests):阅读(Reading),旅行(Traveling);气质(Temperament):优雅(Elegant),粗犷(Rugged);服饰细节(ClothingDetails):复古(Vintage),现代(Modern)。
场景设定(SceneSetting)
建筑风格(ArchitecturalStyle):现代(Modern),古典(Classical);城市特色(CityCharacteristics):繁华(Bustling),古老(Ancient);自然景观(NaturalLandscape):湖泊(Lakes),山脉(Mountains);社会背景(SocialBackground):科技未来(Futuristic),史前时代(PrehistoricEra)。
视觉细节(VisualDetails)
明暗对比(LightandDarkContrast):强烈(Strong),微妙(Subtle);视角(Perspective):第一人称(FirstPerson),第三人称(ThirdPerson);光影变化(LightandShadowChanges):日出(Sunrise),夜晚(Night);空间感(SenseofSpace):开阔(Open),压抑(Oppressive)。
情感氛围(EmotionalAtmosphere)
情绪变化(EmotionalChange):从忧郁到喜悦(FromMelancholytoJoy);故事情节(Plot):冒险(Adventure),成长(Growth);人物关系(CharacterRelationships):友情(Friship),竞争(Competition);心理描写(PsychologicalDescription):坚定(Determined),犹豫(Hesitant)。
摄影技术(PhotographicTechniques)
技术手段(TechnicalMeans):蒙太奇(Montage),深焦点(DeepFocus);摄影风格(PhotographicStyle):纪实(Documentary),抽象(Abstract);画面处理(ImageProcessing):色彩饱和度(ColorSaturation),明暗调整(LightandDarkAdjustment);特殊效果(SpecialEffects):慢动作(SlowMotion),倒叙(ReverseChronology);
五、Sore模型原理OpenAI公布了sora详细的技术报告。
🔗技术报告链接:

英伟达AI科学家JimFan则认为:Sora应该是一个数据驱动的物理引擎。Sora是对现实或幻想世界的模拟,它通过一些去噪、梯度下降去学习复杂渲染、“直觉”物理、长镜头推理和语义基础等。
(1)视觉数据处理方式


(3)图像生成的能力

六、后记
在AI技术日益成熟的今天,我们需要了解更多画面构图知识,摄影知识,沉淀自己,来拥抱AI将为我们带来更多的机会。
本文由@yaoyao原创发布于人人都是产品经理,未经作者许可,禁止转载。
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。