无论是可以做多模态推理的满血版 o1(给少数人准备的 200 美元 / 月 ChatGPT 大会员),还是少量数据就可以通过极少量高质量示例就可以快速调整模型的强化微调功能,OpenAI 12 天活动的前两天都让网友们直呼不过瘾和些许失望。
此次发布的 Sora 版本,能够生成包含多个角色、特定类型动作以及主题和背景准确细节的复杂场景。该模型不仅理解用户在提示中所请求的内容,还理解这些事物在现实物理世界中的存在方式。
视频生成完成后,用户可以将鼠标悬停在库中的预览上,观看所有视频的播放,以比较结果。用户可以点击单个视频以便在更大的视图中查看、编辑和构建生成的视频,Sora 视频编辑器包括以下功能:
Re-cut,在新的 Storyboard 中修剪、延长视频。Remix ,描述更改并基于此生成新的视频。Blend,从一个视频和另一个视频中的过渡元素Loop,根据视频的任何部分创建无缝循环
系统都挤爆了
OpenAI 研究员 Will DePue 在 x 上表示,“我们付出了巨大的努力才实现这一目标,我认为该产品非常有趣且直观。”他表示自己最喜欢做的事情是生成虚假的历史镜头,
发布后,就有用户迫不及待尝试。ChatGPT Plus 用户 Lance Ulanoff 在提示字段中输入,请求生成一个中年男子在海边建造火箭的场景。他描述了一个宁静的场景,有月亮、海浪轻拍、篝火和一只友好的狗。默认设置:5 秒、480p。
当然,由于效果过于逼真,有的网友也会有些忧虑,“有点担心小孩子看这些视频可能会对自然界的物理现象产生不准确的印象。例如那只瓢虫看起来非常自然,但其中有一个小瑕疵,一个从未见过瓢虫移动的不知情的观察者可能会误以为这是正常的。”
使用有限制:账户、积分
Sora 目前只对 ChatGPT Plus 和 ChatGPT Pro 用户开放,ChatGPT Free、Enterprise 和 Edu 账户无法访问 Sora。
其中,ChatGPT Plus 用户最多 50 个优先视频(消耗 1,000 积分),视频分辨率高达 720p,时长为 5 秒;ChatGPT Pro 用户则最多 500 个优先视频(消耗 10,000 积分),可以生成无限 relaxed 视频(不消耗积分,但可能被安排在网站流量低时排队完成),最高支持 1080p 分辨率、20 秒时长、同时可以生成 5 个视频,并且下载无水印。
如果使用 Re-cut、Remix、Blend 和 Loop 来创建超出 5 秒增量的内容,则积分将按以下方式消耗:
另外,截至目前,OpenAI 尚不清楚何时在欧洲和英国推出。
Sora 支持的国家列表:
https://help.openai.com/en/articles/10250692-sora-supported-countries
结束语
或许是因为 Sora 一直未正式发布,但大家对其呈现的效果都很惊叹,因此 Sora 一直备受关注和期待。
昨天,LontVideo 联合创始人 CEO Ruud van der Linden 还在 x 上透露,OpenAI 的 Chad Nelson 在伦敦的 C21Media 主题演讲中表示 Sora v2 即将发布。根据泄露的视频内容,Sora v2 能够生成长达一分钟的动态视频,支持文本生成视频(text-to-video)、图像生成视频(text+image-to-video)、视频编辑生成(text+video-to-video)、视频间转换(video-to-video)。不过这次发布并未如提及的这般。
Sora 在上月底还被人在 huggingface 上恶意泄露了 API,使其短暂的开放了 1 小时左右。原因则是获得早期访问权限、测试 Sora 的艺术家和 OpenAI 爆发了巨大矛盾。他们认为,OpenAI 利用其进行免费工作,通过过分控制其早期测试计划,让他们白白为 OpenAI 制作宣传视频,于是这群艺术家通过泄露了 OpenAI 的 Sora 视频生成器访问权限,表达了对 OpenAI 的不满。
根据当时泄露的信息,这版 Sora 可以生成最高 1080P 分辨率、时长 10 秒的视频。有网友在使用 Sora 的 API 时候发现,泄露的 API 实际上是 Sora Trubo。但 OpenAI 发言人回应只表示,Sora 仍处于“研究预览”阶段。
此次Sora终于如愿发布,是否满足了大家的期待?