首页
学习
活动
专区
圈层
工具
发布

一图生成3D世界,灵光App率先将世界模型搬到手机里

IT时报记者 孙妍

一张照片,一部手机,你就能在AI造的世界里漫步。

4月27日,蚂蚁灵光App上线“体验世界模型”,成为业界首个可在移动端体验世界模型的AGI产品。用户只需上传一张图片,即可在手机上生成最长60秒的3D世界,并且用手游操控视角,像玩游戏一样在里面走动探索,从触发指令到开始探索,仅需秒级。这是业内首次实现在端侧跑起世界模型,实测分钟级的长时一致性、实时可交互的体验,颇为震撼。

在此之前,灵光上线“闪应用”功能,率先实现在手机端30秒生成应用,全民“手搓”应用风潮。

世界模型被视为通向AGI(通用人工智能)的重要路径之一,是连接数字世界与物理世界的重要桥梁。此次灵光App“体验世界模型”功能背后接入了蚂蚁灵波LingBot-World-Fast世界模型,该模型也已经开源。

打开灵光App,在对话框上传一张图片后,系统会智能推荐操作指令,用户选择“生成图中世界”。或者直接输入“帮我用第一人称视角探索这个世界”这类自然语言,系统会自动进入世界模型生成流程。

进入世界模型体验页面后,灵光App引入了手游摇杆操控方式,让用户以最熟悉的方式探索AI即时生成的3D世界。屏幕左侧摇杆负责控制角色在3D场景中的位移,用户可前后左右自由行走;右侧摇杆则负责控制视角旋转,实现全方位环顾探索。这一操控逻辑与主流3D手游高度一致,玩家无需额外学习,即可上手操控。

世界模型的移动端部署,是行业里公认的难题。算力需求大、延迟控制难、终端性能参差不齐,每一条都是实际的工程挑战。灵光团队采用高效、低延迟的流式传输技术,实现了百毫秒级的响应延迟,用户从触发指令到开始探索3D世界仅需秒级。

灵光App负责人蔡伟表示,“体验世界模型功能是灵光在探索智能边界的又一实践。此前灵光推出的闪应用功能可实现自然语言30秒生应用,也是把原本专业开发者的Coding能力给到普通用户。”

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OtIt9skY41zN8K6JIh4OVi8g0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券