欢迎光临厦门雄霸电子商务有限公司官网!
工控|工业|自动化进口DCS系统 机器人系统 大型伺服系统
全国咨询热线(Zona)18150899970
产品展示
联系我们
厦门雄霸电子商务有限公司
手机:18150899970
QQ:391038081
邮箱:sales@saulcontrol.com
地址 :福建省厦门市思明区吕岭路1733号2008单元(万科创想中心)
联系人:Zona
您的位置: 首页>>新闻资讯
工控资讯

OpenAI又打出王炸!一句话生成60秒视频,马斯克:人类认输吧

时间:2024-02-19 作者:

在大年初七,春节假期的尾声,OpenAI突然发布的AI文字生成视频模型Sora被全网刷屏,马斯克甚至感叹“gg Humans”(gg是good game的缩写,在竞技游戏中原意为称赞对方打得不错,但目前主流的含义是代表认输退出)。  文字生成视频的AI模型其实之前也有不少,比如去年11月美国AI初创公司Pika Labs发布的Pika 1.0;去年Runway推出了文生视频模型Gen-1,并完成了两次迭代;还有谷歌团队发布的视频生成模型VideoPoet。但问题在于,此前市面上的文生视频模型只能生成数秒,最高十多秒的视频。而Sora一上来就是60秒的视频长度,且生成视频的细节、质量几乎“秒杀”其他文生视频模型,这足以颠覆目前的视频生成模型初创公司的格局。  视频生成质量炸裂,好莱坞时代要结束了?  Sora生成的视频效果有多强?下面是OpenAI在官网展示的第一个视频,也是最能够表现Sora实力的视频。   这个视频的提示词为“一位时尚女士走在东京的街道上,街道上充满了温暖的霓虹灯和动画城市标志。她穿着黑色皮夹克、红色长裙和黑色靴子,拿着一个黑色钱包。她戴着太阳镜,涂着红色口红。她走路自信而随意。街道潮湿且反光,形成了五颜六色灯光的镜面效果。许多行人四处走动。”  从视频中,无论是运镜还是人物、地面、背景的细节,还有拉进镜头后人物面部上的皱纹、毛发、墨镜上的反光,都几乎可以以假乱真,画面稳定不错位。在长达60秒的视频里,画面随镜头的大幅度运动并没有出现错位的情况,整体风格保持了惊人的一致性。  在复杂场景方面,另一个演示视频同样展现了Sora的炸裂效果。下面这个视频使用的提示词为:“一段美丽的自制视频展示了2056年尼日利亚拉各斯的人们。用手机相机拍摄。”  同样是运镜幅度巨大的场景,同时背景有大量的人物。在以往的文生图模型中,类似这种背景有人群的图片都会产生很多错位,很容易看出AI的痕迹,而在Sora生成的这个视频里,背景人群不仔细看很难发现有错误,特别是在动态的视频当中。另一方面在视频后半段的人物近景里,大幅度运动的镜头同样没有对人物造成影响,画面细节极为稳定。
在线客服
联系方式

热线电话

18150899970

邮箱

sales@saulcontrol.com

上班时间

周一到周五

微信
WhatsApp
线