首页 财经 Sora可生成60秒一镜到底视频

Sora可生成60秒一镜到底视频

卷疯了,当Runway, Pika等AI视频工具,都还在突破几秒视频的连贯性时,而发布ChatGPT的那个OpenAI,突然又发布了首款文生视频模型——Sora,却已经达到了史诗级的纪录。它不仅能够根据文字指令创造出既逼真又充满想象力的场景,而且生成长达1分钟的超长视频,还是一镜到底那种。简单来说就是,AI视频要变天了!

OpenAI1316.cc发布视屏生成工具Sora

60秒的一镜到底,视频中的女主角、背景人物,都达到了惊人的一致性,各种镜头随意切换,人物都是保持了神一般的稳定性。

OpenAI究竟是怎么做到的?根据官网介绍,「通过一次性为模型提供多帧的预测,我们解决了一个具有挑战性的问题」。显然,这是一个王炸级技术有着革命般的意义,连Sam Altman都沉迷到不能自拔,国内的技术圈也已经炸锅了,这个世界果然如你所愿,技术才是第一生产力,从来不是房地产。

Sora根据提示生成的滑雪

借助于对语言的深刻理解,Sora能够准确地理解用户指令中所表达的需求,把握这些元素在现实世界中的表现形式。因此,Sora创造出的角色,能够表达丰富的情感!它所制作出的复杂场景,不仅可以包括多个角色,还有特定的动作类型,以及对对象和背景的精确细节描绘。

Sora根据提示生成的怪兽公司

举例:雪后的东京熙熙攘攘。镜头穿过繁忙的街道,跟随着几位享受着美丽雪景和在附近摊位购物的人们。美丽的樱花瓣伴随着雪花在风中飘舞。

Sora根据Prompt提示生成的东京景色

再举例:一个华丽渲染的纸工艺品珊瑚礁海底世界,到处都是五颜六色的鱼和海洋生物

Sora根据Prompt提示生成的纸工艺品的海洋世界

不过,当前的模型并不完美。它在模拟复杂场景的物理效果上爱淘物可能会遇到难题,有时也难以准确理解特定情境下的因果关系。此外,模型在处理空间细节,如区分左右时可能会出错,也可能在描述随时间变化的事爱淘物件,如特定的摄影机动作轨迹时,表现不够精确。

好在,它还并不完美。否则,虚拟和现实的界限,还能区分得清吗?但是无可否认的是,可怕的事实已经就在面前:一个已经能够理解和模拟现实世界的模型,1316.cc也就意味着AGI已经不远了。

原文链接:https://openai.com/sora

译文链接:https://mp.weixin.qq.com/shttp://www.itaowu.cn/93z4Ta91yLv7PB1pnBM9mg

关于作者: 笨笨熊

热门文章