对标Genie 3 蚂蚁灵波开源世界模型LingBot-World快讯

TechWeb.com.cn 2026-01-29 10:12
分享到:
导读

蚂蚁集团旗下灵波科技今日宣布全面开源世界模型 LingBot-World,最新开源的LingBot-World模型在视频质量、动态程度、长时一致性、交互能力等关键指标上媲美 Google Genie 3,灵波科技已先后开源空间感知模型LingBot-Depth以及具身大模型 LingBot-VLA。

【TechWeb】1月29日消息,蚂蚁集团旗下灵波科技今日宣布全面开源世界模型 LingBot-World。此前,灵波科技已先后开源空间感知模型LingBot-Depth以及具身大模型 LingBot-VLA。

业内人士指出,随着“灵波”系列连续发布三款具身领域大模型,蚂蚁的AGI战略实现了从数字世界到物理感知的关键延伸。这标志着其“基础模型-通用应用-实体交互”的全栈路径已然清晰。

据介绍,最新开源的LingBot-World模型在视频质量、动态程度、长时一致性、交互能力等关键指标上媲美 Google Genie 3,旨在为具身智能、自动驾驶及游戏开发提供高保真、高动态、可实时操控的“数字演练场”。

其中,针对视频生成中最常见的“长时漂移”问题(生成时间一长就可能出现物体变形、细节塌陷、主体消失或场景结构崩坏等现象),LingBot-World 通过多阶段训练以及并行化加速,实现了近 10 分钟的连续稳定无损生成,为长序列、多步骤的复杂任务训练提供支撑。

目前,LingBot-World 模型权重及推理代码已面向社区开放。

模型 LingBot-World 生成 提供 交互
分享到:

1.TMT观察网遵循行业规范,任何转载的稿件都会明确标注作者和来源;
2.TMT观察网的原创文章,请转载时务必注明文章作者和"来源:TMT观察网",不尊重原创的行为TMT观察网或将追究责任;
3.作者投稿可能会经TMT观察网编辑修改或补充。