Sora可生成60秒一镜到底视频

卷疯了，当Runway, Pika等AI视频工具，都还在突破几秒视频的连贯性时，而发布ChatGPT的那个OpenAI，突然又发布了首款文生视频模型——Sora，却已经达到了史诗级的纪录。它不仅能够根据文字指令创造出既逼真又充满想象力的场景，而且生成长达1分钟的超长视频，还是一镜到底那种。简单来说就是，AI视频要变天了！

OpenAI１３１６．ｃｃ发布视屏生成工具Sora

60秒的一镜到底，视频中的女主角、背景人物，都达到了惊人的一致性，各种镜头随意切换，人物都是保持了神一般的稳定性。

OpenAI究竟是怎么做到的？根据官网介绍，「通过一次性为模型提供多帧的预测，我们解决了一个具有挑战性的问题」。显然，这是一个王炸级技术有着革命般的意义，连Sam Altman都沉迷到不能自拔，国内的技术圈也已经炸锅了，这个世界果然如你所愿，技术才是第一生产力，从来不是房地产。

Sora根据提示生成的滑雪

借助于对语言的深刻理解，Sora能够准确地理解用户指令中所表达的需求，把握这些元素在现实世界中的表现形式。因此，Sora创造出的角色，能够表达丰富的情感！它所制作出的复杂场景，不仅可以包括多个角色，还有特定的动作类型，以及对对象和背景的精确细节描绘。

Sora根据提示生成的怪兽公司

举例：雪后的东京熙熙攘攘。镜头穿过繁忙的街道，跟随着几位享受着美丽雪景和在附近摊位购物的人们。美丽的樱花瓣伴随着雪花在风中飘舞。

Sora根据Prompt提示生成的东京景色

再举例：一个华丽渲染的纸工艺品珊瑚礁海底世界，到处都是五颜六色的鱼和海洋生物

Sora根据Prompt提示生成的纸工艺品的海洋世界

不过，当前的模型并不完美。它在模拟复杂场景的物理效果上爱淘物可能会遇到难题，有时也难以准确理解特定情境下的因果关系。此外，模型在处理空间细节，如区分左右时可能会出错，也可能在描述随时间变化的事爱淘物件，如特定的摄影机动作轨迹时，表现不够精确。

好在，它还并不完美。否则，虚拟和现实的界限，还能区分得清吗？但是无可否认的是，可怕的事实已经就在面前：一个已经能够理解和模拟现实世界的模型，１３１６．ｃｃ也就意味着AGI已经不远了。

原文链接：https://openai.com/sora

译文链接：https://mp.weixin.qq.com/shttp://www.itaowu.cn/93z4Ta91yLv7PB1pnBM9mg

爱淘物

给这篇文章的作者打赏

关于作者: 笨笨熊

相关文章

颈动脉长了斑块还能逆转吗

上海落户政策取消？不实

泰国检方决定起诉前总理他信

热门文章

170到75岁退伍军人优待政策 70到80岁退伍军人每月补助多少

2横尸遍野是指代表什么生肖，经典释义落实

349年至53年养老金补贴调整吗 49年至53年有高龄补贴是多少

4100岁老红军每月领多少钱 100岁红军每月领多少钱

52023驼奶粉质量(驼奶粉价格)