Project Genie: 用AI将Google街景变为可交互3D世界

Project Genie: 用AI将Google街景变为可交互3D世界

Olivia Hughes
14
original

DeepMind推出Project Genie,结合Google Street View生成逼真3D模拟场景,现已面向全球Google AI Ultra订阅用户开放。这项技术能将静态街景图像转化为可交互的动态环境,为游戏、设计、虚拟旅行等打开新可能。

当你打开Google Street View,看到的是一张张360度静态照片。但DeepMind最新的Project Genie,正在把这些静止的街景变成可以走进去、互动起来的3D世界。听起来像科幻片?其实它已经来了。

World模型的新玩法

Project Genie本质上是一个AI世界模型。它不像传统3D重建那样依赖激光扫描或手工建模,而是直接从海量的Street View图像中学习——理解空间的几何结构、光影变化、物体之间的相对关系。然后,当用户输入一个地点(比如东京的某条小巷),Genie就能生成对应的交互式3D场景,你可以在里面自由移动、改变视角,甚至模拟不同的天气和光照条件。

这一点对游戏开发者尤其有意义。过去要复刻一个真实地点,需要前期大量实地拍摄和建模工作。现在,通过Street View的数据库,Genie几乎能瞬间生成任何可街景覆盖区域的数字孪生。

Street View的新角色

Google Street View已经运行了十几年,积累了超过1700亿张图片。但以前,这些图片的用途基本停留在“查看”层面。Project Genie把它变成了一座庞大的训练素材库。模型不仅学习建筑和道路的外观,还能推理出空间背后的物理逻辑——比如一堵墙背后的区域应该被遮挡,而不是凭空消失。

这种能力源于DeepMind在生成式AI和3D视觉上的长期积累。据官方介绍,Genie在训练时使用了数亿张来自不同国家和地区、不同时间段的街景图像,因此对现实世界的多样性有很强的适应能力。不过,目前生成的场景在细节上仍有提升空间,比如人物和车辆的动态模拟还不够自然。

开放与限制

Project Genie并非完全免费。它首先面向Google AI Ultra订阅用户开放,这是Google One旗下的高端AI服务,包含Gemini Advanced等工具。订阅用户可以通过专门的界面输入地点,然后生成并导出3D场景。官方没有透露未来是否会扩展到更低层级或免费使用,但考虑到计算成本,初期保持订阅制是合理的。

此外,生成的场景可以用于非商业用途,比如教学设计、虚拟旅行或者个人创意项目。如果开发者想在商业游戏中直接使用,可能需要额外的授权——不过这点DeepMind还没明确。

意义不止于“好玩”

除了娱乐和设计,Project Genie在城市规划、灾害模拟、文化遗产保护等领域也有潜力。你可以用它快速模拟一个新建筑对周围环境的光照影响,或者游客在古迹中的移动路线。甚至,对于自动驾驶系统来说,这种合成的真实世界场景也能提供额外的训练数据——不过那可能需要更高精度的交互。

当然,隐私问题也不容忽视。Street View本身曾因拍摄到人脸等敏感信息而引发争议。虽然DeepMind表示生成的场景会模糊处理个体信息,但能否完全避免数据滥用,还需要更透明的机制。

总的来看,Project Genie是AI将“看”转化为“懂”的一个漂亮案例。它让街景不再只是一张张照片,而变成可以走进去、可以改变的空间。对订阅用户来说,这是一个值得立刻去试的新玩具;对行业来说,它可能预告了下一代3D内容生成的方式。

Project GenieGoogle DeepMindStreet ViewAI世界模型3D场景生成虚拟旅行游戏开发Google AI Ultra

分享

评论

0
0/500 字符

暂无评论

成为第一个评论的人

探索更多