
昨晚,AI世界的另一波小小的组合来了。有Opus 4.1具有更强的领先编程,而Genie 3随着Google的成功下降。 Ultraman看到它时无法坐下,因此他很快到达了GPT-Oss,这是Openai首次开放资源。但是,我们可能对Claude编程没有任何真正的感觉,OSS的开放资源似乎无人看管。毕竟,这不是GPT血的完整版本。今天有很好的结果。一些可以在本地部署的大型模型并不强。他们甚至以相同的参数量的笑声少于国内GLM-4.5空气。 。 。相比之下,Google DeepMind的Genie 3确实令人惊叹。江江将付出一切,看看Genie 3如何创建可以播放,移动和使用“内存”的3D thtworld的高清晰度。作为世界的模型,它继续延续精灵1和2的技术和概念,并可以产生一个可以接触,向下,向下,向下,向下,向下,向下,左和正确的键通过单词的文字。扩展全文
没有其他ADO,让我们首先首先显示结果。
老实说,我相信下面的视频只需说这是视频录制即可。视图的视图可以下沉,方向的键可用于控制运动。更不用说汽车的速度了。即使它沿着土地落在,使您对物理世界的理解。
看着在水中驾驶的船时,转向非常丝滑,甚至灯笼的碰撞效果也尤其真实。由于Genie 3的实时帧速率每秒达到24帧,并且分辨率可以达到720p。从这些参数来看,它与普通视频确实没有什么不同。
我还以前也看过世界模型和实时几代的游戏玩法,但是经验确实更糟。您不仅经常卡住,而且是同一S塞恩也被打破了。例如,您面前有人会在您的面前消失(恐惧)。即使您只是站在那里而不动,肉眼中的场景也会改变。 。 。
在Dynamics Lab中,测试链接放置在文章的末尾
和Genie 3在前后之间具有阴影 - 刮擦的一致性,以确保您一分钟前在墙上绘制的蓝色油漆,以及sucknod的几分钟。
即使您使用提示可以随时添加内容,也不必担心屏幕崩溃。
DeepMind还尝试了自己的Sima代理商的Genie 3。一开始有一张图片和指令,其余提示是由代理商完全编辑的。
例如,给Genie 3一张面包店的图片,目标是移至面包冷却架,并且代理应该知道机架的冷却,也有必要知道将方向钥匙向前移动。
看到这么多例子后,杰妮3做了快速,平稳地了解物理学的理解和一致性。江吉安(Jiangjiang)认为它是首先出生的。遵循物理定律,这是类似于统一的3D场景的完整建模。
但是,实际上,这是 - 逐帧。当难以保证纯净的视频的相似性很难时,即使吉妮3上下跳跃,也不会下降?真的很好奇。 。 。
但是,由于Genie 2中没有技术报告,因此我们只能从线索中选择一些信息,然后窥视他们如何使用这种魔术。
作为Genie系列的第三代Genie 3与其他模型一样,Genie 3是在先前的波浪中成长的新来者。在谈到它的前面,它们确实不是普通的,并且有许多创新的亮点。
例如,Genie 1是第一个创建向上,向下,向下,左和右的游戏玩法的人。根据其角色,为了继续控制其生成的内容,Genie 1是自回归的MOD那时。简而言之,请记住每次形成下一个帧时检查所有历史记录。
自动进展图,资料来源:自动进度视频型号MAGI-1技术报告
Genie 1还创建了一个额外的模块,以专注于空间和时间之间的关系,即对空间进行建模。
当涉及培训阶段时,由于大多数互联网视频都没有动作标签,因此他们不知道视频中按下哪个键以及人们将运行多远。因此,他们选择使用该模型来预测下一帧中发生的情况,迫使模型了解每个动作的内在含义,而这不受潜在的行动研究的支持。
Genie 1是2世代的场景
不幸的是,自Genie 2以来,没有技术报告。结果的判断,它已经从2D发展到3D,并且持续时间最高为一分钟。
最后,当我们到达Genie 3时,我们可以长期提出实时一代D强一致性。从一代人的论文来看,它们背后的一些技术,例如自动化,时空建模,不支持潜在的动作研究等,可能会代代相传。
从1到3,它取得了巨大的发展,但仅持续了一年半。 。 。未来有希望。
但是,虽然结果非常好,但深态是诚实的,并说Genie 3仍然有很多缺点。例如,环境运动空间仍然有限,直接单词很高,接触只需几分钟,等等。
如果所有这些问题都可以解决,那么感觉就像是在超级真实的环境中体现出智能机器人的训练,甚至是Xiao ZHA的令人难忘的元元素。
通常,DeepMind有一些有趣的事情要做,这比带有隔壁卷参数和perfor的大型模型更有趣曼斯。
我们可能不会觉得模型在回答问题时更准确,但是Genie 3游戏玩法的视觉影响和实时接触确实不同。
事实证明,游戏是由每个人都厌倦了呕吐血的游戏场景来塑造的。现在,他们可以使用世界模型快速实现相同的效果,这是简单的成本。
但是唯一的问题是DeepMind并未打开任何测试版本。我希望他们在Spittingok中的演示中没有太多魔术。 。 。
撰写者:MOMO MO TIANTIAN
编辑:Jiangjiang Noodle系列
编辑:Huyanyan
图像,资源:
Genie 2,3官方发行页
https://arxiv.org/pdf/2402.15391
https://arxiv.org/pdf/2505.13211
https://demo.dynamicslab.ai/chaos回到Sohu,以查看更多