OpenAI首席技术官最新透露:Sora预计将在今年发布,计划加入语音功能,还有
OpenAI首席技术官最新透露:Sora预计将在今年发布,计划加入语音功能,还有这些“干货”
OpenAI 似乎已经在为 Sora 降世预热了。
当地时间 3 月 13 日周三,OpenAI 首席技术官米拉 · 穆拉蒂(Mira Murati)接受了《华盛顿邮报》的视频专访。
穆拉蒂在接受采访时透露,目前利用 Sora 生成视频的成本非常高,团队正在优化技术,预计将在今年正式发布。
穆拉蒂透露,OpenAI 人工智能文生视频大模型 Sora 即将于今年晚些时候正式向公众发布,OpenAI 计划最终加入音频功能,以使场景更为真实,同时还将允许用户编辑 Sora 生成的视频内容。
除此之外,穆拉蒂还回答了 Sora 的特别之处、如何修正瑕疵、是否会包含音频、训练数据来自哪里等若干问题。给出的答案有的笼统,有的不乏诚意。
Sora 如何 " 化文字为神奇 "?请你想象一幕场景:" 一条美人鱼和她的螃蟹伙伴,正在一起浏览智能手机…… "
作为这场媒体采访的 " 福利 ",主持人获得了让 Sora 将其提供的多组文本提示,转化为视频图像的机会,而以上的这一幕,便是 Sora 提供的视频中的一帧。
图片来源:视频截图
Sora 究竟是如何实现这一转换的呢?穆拉蒂表示,尽管解释美人鱼的进化可能都要比解释 " 扩散模型 " ( diffusion models ) 的内部运作容易得多,但简而言之便是:人工智能模型分析了大量视频,学会了识别物体和动作。然后,当你给它一个文字提示时,它就会勾勒出整个场景,然后填充每一帧。
在被问及 OpenAI 为 Sora 使用了哪些训练数据时,穆拉蒂指出,"我们使用了公开数据和授权数据"。
在另外一段视频里,主持人要求 Sora 制作一段她更为符合这场采访的内容:" 两位 30 多岁、有着棕色头发的职业女性,在一个光线充足的演播室里坐下来接受新闻采访。"
图片来源:视频截图
最终,在 Sora 交出的 " 作业 " 里,无论是两位女性嘴型和头发的动捕,还是皮夹克上的细节,一切看起来都那么真实。Murati 指出,这段 20 秒的 720p 分辨率短片,Sora 花了几分钟才制作完成,但目前还未能支持配备音效。
但穆拉蒂已承诺,他们计划最终会添加声音。
Murati 还表示,当前 Sora 生成视频的成本远高于该公司的图像生成器 Dall-E。不过,在未来向公众正式发布时,OpenAI 将进行优化,以降低对算力的需求。
北京时间 2 月 16 日,OpenAI 发布文生视频模型 Sora,效果惊艳,引爆全球。此时距离 OpenAI 推出 ChatGPT,开启生成式 AI 时代,仅仅过去了 14 个月时间,AI 的进化速度令人震惊。
在 Sora 生成的视频里,女士身着黑色皮衣、红色裙子在霓虹街头行走,不仅主体连贯稳定,还有多镜头,包括从大街景慢慢切入到对女士的脸部表情的特写,以及潮湿的街道地面反射霓虹灯的光影效果。
Sora 的研究结果表明,扩展视频生成模型是构建物理世界通用模拟器一条极具前景的途径,它使人工智能理解和模拟运动中的物理世界迈向了一个新的高度。
有业内人士预言,通用人工智能(AGI)将比预期更早到来,产业差距将拉大。此外,文生视频所带来的颠覆性影响引发了人们的担忧,亦有远虑者就真实与虚拟间模糊的边界反复预警。但少有争议的一点是,Sora 被认为有望推动 AI 应用加速落地。
与此同时,Sora 的诞生引发了人们对于 AI 未来发展的更多展望。随着技术的不断进步,AI 将在更多领域发挥更大的作用。无论是工业生产、教育培训还是娱乐休闲等领域,AI 都将为人类带来更多的惊喜和可能性。
2 月 16 日,360 创始人周鸿祎发布微博提到自己对 Sora 的看法,周鸿祎认为,Sora 的诞生意味着 AGI(通用人工智能)实现可能从 10 年缩短至一两年。
谈到 Sora 最大的优势,周鸿祎表示,以往文生视频软件都是在 2D 平面上对图形元素进行操作,可以把视频看成是多个真实图片的组合,并没有真正掌握这个世界的知识。但 Sora 产生的视频里,它能像人一样理解坦克是有巨大冲击力的,坦克能撞毁汽车,而不会出现汽车撞毁坦克这样的情况," 这次 OpenAI 利用它的大语言模型优势,让 Sora 实现了对现实世界的理解和对世界的模拟两层能力,这样产生的视频才是真实的,才能跳出 2D 的范围模拟真实的物理世界。"
周鸿祎提到,有了大模型技术作为基础,再加上人类知识的引导,可以创造各个领域的超级工具,例如在生物医学、蛋白质、基因研究,包括物理、化学、数学的学科研究上,大模型都会发挥作用。
" 一旦人工智能接上摄像头,把所有的电影都看一遍,把 YouTube 上和 TikTok 的视频都看一遍,对世界的理解将远远超过文字学习,一幅图胜过千言万语,这就离 AGI 真的就不远了,不是 10 年 20 年的问题,可能一两年很快就可以实现。" 周鸿祎感慨。
每日经济新闻综合 OpenAI 官网、每日经济新闻、公开资料
每日经济新闻
-
- 中央网信办:重点整治蓄意造谣抹黑企业、直播带货虚假宣传等
-
2024-03-15 22:20:45
-
- 一位全国人大代表,与他带来的55条“法律草案”
-
2024-03-15 22:18:27
-
- 苹果在欧盟又做出重大让步,将允许用户通过网页下载 iPhone 应用
-
2024-03-14 02:32:55
-
- 河北燕郊一餐饮店爆炸,有伤者就医,目前伤亡不明
-
2024-03-14 02:30:38
-
- 中通快递客服回应包裹积压:个别特殊网点有异常报备
-
2024-03-14 02:28:22
-
- 德国大罢工扩散冲击经济
-
2024-03-14 02:26:05
-
- 已致1死22伤!河北燕郊爆炸事故最新通报
-
2024-03-14 02:23:48
-
- 纯电“宝宝巴士” 极氪新车MIX曝光:4.6米长的电动MPV
-
2024-03-14 02:21:32
-
- 小米曾学忠体验穆斯林斋月:太阳出来到下山 不吃不喝
-
2024-03-14 02:19:15
-
- 华为Mate60系列能装谷歌移动服务了?纯血鸿蒙显威
-
2024-03-14 02:16:58
-
- 和华为相比?赵明:荣耀Magic6至臻版屏幕是最强的
-
2024-03-14 02:14:41
-
- 鸿蒙智行新成员 华为享界S9真容公布:要吃BBA的行政轿车
-
2024-03-14 02:12:24
-
- 七八百元的集采心脏支架敢用吗?国家医保局回应
-
2024-03-13 00:26:50
-
- 2024年中国无人驾驶汽车感知层概述——激光雷达头部厂商优势突出
-
2024-03-13 00:24:33
-
- 揭露波音安全问题的“吹哨人”突然身亡
-
2024-03-13 00:22:17
-
- “炫彩多肉”突然火了,为啥传出油漆味?最新提醒
-
2024-03-13 00:19:59
-
- 一年点外卖近300次!29岁小伙确诊癌症,医生提醒
-
2024-03-13 00:17:42
-
- AI自动化?有用才是硬道理
-
2024-03-13 00:15:25
-
- 价格战未休,比亚迪启动三年“解放战役”
-
2024-03-13 00:13:09
-
- 湖南小伙找到流浪25年叔叔,半天将其爆改成“霸道总裁”:体面回家见老母亲
-
2024-03-13 00:10:53