Project Genie: 用AI将Google街景变为可交互3D世界

当你打开Google Street View，看到的是一张张360度静态照片。但DeepMind最新的Project Genie，正在把这些静止的街景变成可以走进去、互动起来的3D世界。听起来像科幻片？其实它已经来了。

World模型的新玩法

Project Genie本质上是一个AI世界模型。它不像传统3D重建那样依赖激光扫描或手工建模，而是直接从海量的Street View图像中学习——理解空间的几何结构、光影变化、物体之间的相对关系。然后，当用户输入一个地点（比如东京的某条小巷），Genie就能生成对应的交互式3D场景，你可以在里面自由移动、改变视角，甚至模拟不同的天气和光照条件。

这一点对游戏开发者尤其有意义。过去要复刻一个真实地点，需要前期大量实地拍摄和建模工作。现在，通过Street View的数据库，Genie几乎能瞬间生成任何可街景覆盖区域的数字孪生。

Street View的新角色

Google Street View已经运行了十几年，积累了超过1700亿张图片。但以前，这些图片的用途基本停留在“查看”层面。Project Genie把它变成了一座庞大的训练素材库。模型不仅学习建筑和道路的外观，还能推理出空间背后的物理逻辑——比如一堵墙背后的区域应该被遮挡，而不是凭空消失。

这种能力源于DeepMind在生成式AI和3D视觉上的长期积累。据官方介绍，Genie在训练时使用了数亿张来自不同国家和地区、不同时间段的街景图像，因此对现实世界的多样性有很强的适应能力。不过，目前生成的场景在细节上仍有提升空间，比如人物和车辆的动态模拟还不够自然。

开放与限制

Project Genie并非完全免费。它首先面向Google AI Ultra订阅用户开放，这是Google One旗下的高端AI服务，包含Gemini Advanced等工具。订阅用户可以通过专门的界面输入地点，然后生成并导出3D场景。官方没有透露未来是否会扩展到更低层级或免费使用，但考虑到计算成本，初期保持订阅制是合理的。

此外，生成的场景可以用于非商业用途，比如教学设计、虚拟旅行或者个人创意项目。如果开发者想在商业游戏中直接使用，可能需要额外的授权——不过这点DeepMind还没明确。