OpenAI 首个视频模型将如何影响游戏行业?
作者:阿法兔研究笔记
欢迎大家转发到朋友圈~~这样兔儿就更有动力发更多好内容了~
不过,Sora 似乎可以为更逼真的程序生成游戏铺平道路。这既令人兴奋,又让人害怕。
因为对于我们来说,未来视频伪造的检验难度很可能会更高。
* 转载本文,请附上所有参考文献链接
Sora MineCraft*本文 1600 字左右
OpenAI 新推出的首个视频生成模型 Sora,基本刷屏了朋友圈。但是,笔者发现了一个新的现象——那就是,引发了科技圈外很多专业电影人的关注。可见文生视频,对于当今的应用场景是多么的重要。
但更值得阅读的是 OpenAI 发布的关于 Sora 的技术报告《作为世界模拟器的视频生成模型》(Video generation models as world simulators)》。
其中提到了一些重点细节:
- 补片技术:视觉数据的创新转化。先将视频数据压缩到低维度潜在空间,再将它分解成时空补片,从而实现视频到补片的转化。
- 视频压缩网络 : OpenAI 开发了能够处理原始视频数据的降维技术,生成在时间和空间上都进行了压缩的潜在表征。 Sora 会在这种压缩的潜在空间中接受训练,继而生成新的视频内容。 OpenAI 还开发了一个解码器,能够将这些潜在表征还原为像素级的视频 + 图像。
- 时空补片技术: 通过处理压缩后的视频输入,OpenAI 具备提取出一系列时空补片的能力,这些补片在模型中扮演着类似于 Transformer Tokens 的角色。 值得一提的是,这套方案同样适用于图像处理,因为从本质上来说,图像可以被视为单帧的视频。 采用基于补片的表现形式,Sora 能够适应不同分辨率、持续时间及宽高比的视频和图像。 在生成新视频内容时,OpenAI 可以通过将这些随机初始化的补片,按照需要的大小排列成网格,来控制最终视频的大小和形式。
- 视频生成的 Transformer 扩展技术, Sora 是一种扩散模型,能接受带有噪声的图像块(及条件信息如文本提示)作为输入,并被训练,从而能够预测出原始的“清晰”图像块。 值得注意的是,Sora 属于扩散型 Transformer。

不过,Sora 似乎可以为更逼真的程序生成游戏铺平道路。这既令人兴奋,又让人害怕。
因为对于我们来说,未来视频伪造的检验难度很可能会更高。
参考资料:
1.Video generation models as world simulators (openai.com)
2.OpenAI’s Sora video-generating model can render video games, too | TechCrunc
【阅读更多】
谷歌搜索:被 ChatGPT 颠覆的可能性
重新定义搜索:人工智能 + 搜索带来的机会
最新!彻底颠覆 Office,微软发布 Copil
生成式 AI 颠覆前端,你该何去何从?
重磅突发!OpenAI 正式推出多模态 GPT-4
0
0
免责声明:文章中的所有内容仅代表作者的观点,与本平台无关。用户不应以本文作为投资决策的参考。
PoolX:锁仓获得新代币空投
不要错过热门新币,且APR 高达 10%+
立即参与!
你也可能喜欢
Bitget 将捐赠 1,200 万港元,支持香港大埔火灾救援及重建工作
Bitget Announcement•2025/11/28 09:06
Animoca Brands高管:2026年将拓展业务重心,聚焦稳定币、AI与DePIN领域
金色财经•2025/11/28 03:36
Bitget现货杠杆关于暂停 ELX/USDT 杠杆交易服务的公告
Bitget Announcement•2025/11/27 08:19
网格新人福利:领取 150 USDT 双重欢迎礼
Bitget Announcement•2025/11/27 04:40
加密货币价格
更多Bitcoin
BTC
$91,511.85
+0.11%
Ethereum
ETH
$3,039.91
+0.41%
Tether USDt
USDT
$0.9999
-0.00%
XRP
XRP
$2.2
+0.43%
BNB
BNB
$891.37
-0.21%
Solana
SOL
$141.18
-0.62%
USDC
USDC
$0.9998
-0.00%
TRON
TRX
$0.2805
+0.91%
Dogecoin
DOGE
$0.1507
-1.43%
Cardano
ADA
$0.4260
-0.97%
交易热门币种
新用户可获得价值 6200 USDT 的迎新大礼包
立即交易
立即成为交易者?新用户可获得价值 6200 USDT 的迎新大礼包
立即注册